QA Outsourcing & Consulting

AI, 사람처럼 학습하고 사물을 판별하는 시각 시스템을 UCLA가 개발 본문

IT Trend/IT 이야기

AI, 사람처럼 학습하고 사물을 판별하는 시각 시스템을 UCLA가 개발

인프라웨어테크놀러지(IT) 2019. 1. 18. 11:14

미국 UCLA의 Samueli공학부는 2018년 12월 18일(미국 현지시간), 스탠포드 대학 연구팀과 "보이는 것이 실제로는 무언인지" 인간이 학습하는 것과 같은 방법으로 학습하고 특정 지을 수 있는 컴퓨터 시스템을 개발했다고 발표.


이것은 어떤 사진일까? (출처 : UCLA)


이번에 개발한 시스템은 컴퓨터가 시각 이미지를 읽어, 무엇인지 특정지을 수 있는 컴퓨터 비전(computer vision)으로 불리는 기술의 진화형.


현재 AI는 성능과 기능 모두 매년 진화되고는 있으나, 어디까지나 "특정한 분야"에 대해서이다. 즉, 이러한 기술의 향상은 인간에 의한 트레이닝과 프로그래밍에 좌우되며, 공장과 감시 카메라 등 무엇이 보이는지 사전에 알고 있지 않으면 무용지물이 된다. 예를 들어 공장이라면 사전에 등록한 정상 부품, 감시 카메라라면 등록되어 있는 종업원의 얼굴을 들 수 있다.


연구 그룹은 이번 성과가 범용 AI 시스템으로의 중요한 진보라고 말한다.

범용 AI 시스템은 현 시점에서 이용되고 있는 AI와는 달리, 자신이 학습하고, 직감적으로 추론에 기반하여 판단하고, 인간과 같은 방법으로 인간과 커뮤니케이션을 하는 컴퓨터를 목표로 한다.


개발한 "컴퓨터 비전" 시스템은 앞서 본 사진과 같은 부분 부분을 보고, 실제 물체가 무엇인지 특정 지을 수 있다.

사진은 오토바이의 일부를 촬영한 것이다.





현재 컴퓨터 비전이 안고 있는 큰 문제

현재 사용 가능한 최고 성능의 컴퓨터 비전 시스템을 가지고 있더라도, 특정 부분만을 보고, 물체의 전체 이미지를 그리는 일을 불가능하다. 또한, 지금까지의 시스템은, 물체가 보통과는 다른 형태로 나열되면 인식이 불가능하다.


연구 팀의 목표는 이렇다.

개가 의자 뒤에 있어 가려져 보여, 다리와 꼬리만 보인다 하더라도, 개라고 인식할 수 있도록 하는 것이다.

인간은 이런 경우라도 개의 머리와 몸의 다른 부분이 어디에 있는지 직감에 의해 쉽게 가리킬 수 있으나, 대부분 AI 시스템에서는 이러한 능력을 갖추지 못하고 있다.

이러한 점도 연구 팀의 과제로 되어 있다.


또한, 현재 컴퓨터 비전 시스템은 스스로 학습하도록 설계되어 있지 않다. 현재 시스템은 학습해야 하는 것 자체를 "보여줘서" 트레이닝할 필요가 있다. 일반적으로 특정 물체를 학습하기 위해 개발자가 라벨을 붙인 이미지를 수천~수만개 입력하는 방법을 사용한다.


물론 컴퓨터는 이미지 내 물체가 무엇인지를 판단할 근거를 설명할 수 없다. AI 시스템은 사람과 같이, 학습한 물체의 내적 이미지와 일반 모델을 만들 수 없기 때문이다.




3단계로 대상을 보기

연구 팀은 이러한 단적을 극복하고 보이는 물체가 무엇인지 맞출 수 있는 새로운 방법을 고안하여, "Proceedings of the National Academy of Sciences"에 논물을 발표했다. (PDF)


새로운 방법의 접근은 3단계이다.

1. 시스템은 이미지를 뷰렛(viewlets)이라고 부르는 다수의 작은 부분으로 분할한다.

2. 이러한 뷰렛이 어떻게 모여서 문제의 대상을 형성하는지를 학습한다.

3. 주위에 어떤 물체가 있는지를 보고, 그 물체에 관한 정보가 메인 물체를 기술하고, 식별할 때에 관련이 있는지를 판단한다.


연구 팀은 새로운 시스템에 인간처럼 학습을 시키려고 했다. 여기에서 인간을 둘러싸고 있는 환경 대신에 인터넷을 활용하여 새로운 시스템에 인터넷에 있는 방대한 이미지를 입력했다.


개발한 시스템은 인간을 포함한 수천장의 이미지를 보고, 배경에 있는 중요하지 않은 물체를 무시하고 인체란 무엇인지 이해한다.



UCAL에서 전기공학과 컴퓨터 공학 교수를 역임하고 이번 연구를 주도한 Vwani Roychowdhury 교수는 다음과 같이 설명한다.


"다행히 인터넷은 뇌에서 영감을 얻은 컴퓨터 비전 시스템이 인간과 똑같이 학습할 때 두 가지 점에서 도움이 됩니다. 하나는 동일한 유형의 물체를 묘사하는 풍부한 이미지와 동영상이 있다는 것. 또 하나는 이러한 물체가 다양한 시점으로 (ex, 어두운 곳, 높은 곳, 가까운 곳) 여러 환경에 놓여 있다는 것입니다." 


연구 팀은 새로운 컴퓨터 비전 시스템을 각각 사람과 다른 물체를 포함하는 약 9000장의 이미지로 테스트 했다. 시스템 개발자에 의한 지도를 받지 않고 라벨이 붙은 이미지도 없는 상태에서 인체의 상세 모델 구축이 가능했다.


연구 팀은 오토바이와 자동차, 비행기 이미지를 사용하여 같은 테스트를 했다. 모두 새로운 시스템이 오랫동안 트레이닝되어 온 이전 컴퓨터 비전 시스템 이상의 성능을 발휘했다고 한다.








Contact US


Address

서울특별시 금천구 가산디지털1로 19 
대륭테크노타운 18차 20층

지도 크게 보기
2018.12.27 | 지도 크게 보기 ©  NAVER Corp.

Phone
02-6190-7296

E-mail
qa_partner@infrawaretech.com


Homepage
http://infrawaretech-qa.tistory.com/



Comments