QA Outsourcing & Consulting

MIT연구팀, 페이크 뉴스 언어 패턴을 검출하는 AI모델 개발 본문

IT Trend/IT 이야기

MIT연구팀, 페이크 뉴스 언어 패턴을 검출하는 AI모델 개발

인프라웨어테크놀러지(IT) 2019. 2. 15. 12:01

MIT 연구팀은 페이크 뉴스를 자동 검출하는 시스템의 연구 성과를 2019년 2월 6일에 발표.


연구팀이 개발한 기계학습 모델은 진짜 기사와 가짜 기사에 대해, 미묘하지만 일관성 있는 언어 선택의 차이를 파악하는데 성공했다.


연구 결과, 페이크 뉴스 검출 시스템을 실용화 하기 위해서는 진짜 기사 샘플에 대해 보다 엄격한 테스트를 더 할 필요가 있다고 밝혔다.


페이크 뉴스 문제는 도널드 트럼프와 힐러리 클링턴이 대통령 후보로 대립했던 2016년에 널리 알려졌다. 이에 가짜 뉴스가 포함하는 언어상의 단서를 인식하는 인공 신경망에 의한 페이크 뉴스 자동 검출 시스템 개발이 시작되었다.


남은 두 가지 숙제


하지만, 이러한 시스템에는 두 가지 숙제가 남아 있었다.


먼저 하나는 인공 신경망이 학습 시 어떤 언어 패턴을 분석할 지 모른다는 블랙박스 문제이다.


두번째는 사전에 선택한 토픽을 이용하여 학습시키고 결과를 테스트하여 AI모델이 만들어지는데, 학습 결과 테스트를 전혀 다른 새로운 토픽으로 하는 경우, 페이크 뉴스 검출 정밀도가 떨어질 가능성이 있다는 것이다.



MIT 연구 팀은 이 모든 문제를 해결한 결과를 논문으로 하여 Conference and Workshop on Neural Information Processing Systems에서 발표했다.


연구팀은 페이크 뉴스와 진짜 뉴스가 담고 있는 언어 패턴을 검출할 수 있도록 학습하는 딥러닝 모델을 개발했다.


블랙박스를 열어 모델이 예측을 위해 인식하는 단어와 문장을 밝히고, 딥러닝 테스트를 위해, 학습에서 사용하지 않은 새로운 토픽을 사용했다.


이러한 접근으로 각각의 기사를 언어 패턴만을 가지고 페이크 뉴스인지 아닌지를 판별한다. 이 방법은 뉴스 기자용 어플리케이션에서 요구되는 기능에 가깝다. 종래의 페이크 뉴스 검출 시스템은 위키페디아의 페이지나 웹사이트와 같은 소스 정보와의 조합으로 기사를 판별했다.


연구팀 일원 중 한 명인 Xavier Boix는 "우리는 언어만을 기반으로 한 검출 시스템의 판별 프로세스가 어떤 것인지 이해하고 싶었다. 페이크 뉴스의 언어가 어떤 것인지에 대해 통찰력을 제공하기 때문"이라고 언급했으며,

논문 1저자(first author)인 Nicole O’Brien은 "기계학습과 AI가 안고 있는 중대한 문제는, 답은 얻을 수 있으나, 왜 그 답을 얻었는지는 모른다는 것"이라고 말하면서, "이러한 내부 작업을 명확히 하면, 딥러닝의 페이크 뉴스 검출 시스템의 신뢰성을 이해하는 첫 걸음이 될 것"이라고 말했다.




출처 : PEERING UNDER THE HOOD OF FAKE-NEWS DETECTORS [MIT NEWS]

Comments