logo

English

구글의 천재 AI 연구자 신경망을 능가하는 "캡슐 네트워크" 발표

by 엉뚱도마뱀 posted Nov 28, 2017
?

Shortcut

PrevPrev Article

NextNext Article

Larger Font Smaller Font Up Down Go comment Print Attachment
?

Shortcut

PrevPrev Article

NextNext Article

Larger Font Smaller Font Up Down Go comment Print Attachment

인간의 뇌를 모방 한 인공 지능의 학습 능력을 형성하는 기반이되는 신경망. 그 단점을 보완하고 자기 학습 능력을 향상 "캡슐 네트워크"를 구글의 연구원이 발표했다. 컴퓨터의 화상 인식 기능인 컴퓨터 영상처리 기능으로 응용 발전시켜, 자율 주행 차량으로 활용도 기대되는 새로운 개념이라고 한다.

 

neuralnetwork-1024x661.jpg

 

인공 지능 (AI)을 둘러싼 요즘의 열띤 논쟁의 주인공은 69세의 구글의 연구원 제프 힌튼이다. 캐나다 토론토 대학 소속이기도 한 이 익살스러운 교수는 2012 년 10 월에 AI 연구로 세계에 충격을주고 새로운 가능성을 열었다.

 

힌튼과 2 명의 대학원생이 발표 한 내용에 따르면, 수십 년 동안 연구 대상으로 도전해온 오래된 기술 "인공 신경망"이 기계의 이미지 인식 기능을 비약적으로 향상 시켰다고 한다. 신경망은 인간의 뇌를 모델로 신경 세포 (뉴런)와 그 관계를 인공적으로 구축 한 것이고 AI에 응용되어 수집한 데이터를 바탕으로 새로운 개념을 학습시키는 머신러닝 등에 활용되고있다.

 

그 발표에서 6 개월도 지나지 않아 3 명의 연구원은 구글에 채용되었고 입사 기념 연설에서  "이제 신경망은 우리의 주장을 구현해서 , 잔디 위를 걷는 고양이를 (개도 돼지도 아니고) 고양이라고 인식하고 인터넷에서 트롤과 싸우고있습니다 . 우리는 (컴퓨터에 이미지 인식하는"시각 "기능을 제공) 컴퓨터 비전 기술의 활용법을 잘못하고 있다고 생각합니다. 현시점에서 무엇보다 잘 작동하지만, 그렇다고해서 올바른 것은 아니었습니다." 라고 주장했다.

 

컴퓨터 비전을 진화시키는 새로운 개념

대신 힌튼은 또 "오래된"아이디어에 대해 밝혔다. 컴퓨터가 사물을 인식하는 방법을 바꾸고 새로운 형태의 AI를 만들어내는 것아 매우 중요한 개념이다. 왜냐하면 컴퓨터 비전은 자율 주행 차량과 의사의 역할을 소프트웨어로 구현할 수 있기 때문이다.

 

2017 년 10 월 하순 힌튼은 2 개의 논문을 발표하고 40 년 가까이 숙고를 거듭 한 아이디어를 증명했다. "이것은 매우 오랜 기간 동안 나에게 가져온 많은 직관에 의해 완성 된 것입니다. 계속 잘 정리되지 않았지만, 마침내 발표 할 수 있었다"고 말했다.

 

힌튼의 새로운 연구는 "캡슐 네트워크"로 불린다. 신경망을 발전시킨 것으로, 이미지와 동영상을 통해 기계에 세계를 이해하기 쉽게 만드는 것을 목표로하고있다.

 

발표 한 논문 중 하나에서는, 캡슐 네트워크의 정확성에 대해 신경망 수준의 성능에 필적했다고 말했다. 소프트웨어가 필기로 기록된  숫자를 얼마나 정확하게 인식 할 수 있는가하는 기준 테스트를 실시하여 얻은 결과라고한다.

 

두 번째 논문에서는 캡슐 네트워크 오답율에 대해 신경망 최저 오류 수치보다  절반으로 감소했다고 발표했다. 트럭이나 자동차 등 장난감을 다른 각도에서 소프트웨어에 인식시키는 과제를 통해 결과를 얻었다.

 

가상 뉴런을 이용한  "캡슐"에 자율 학습을 추가

힌튼은 현재도 이 새로운 기술의 연구를 계속하고있다. 동료 2 명, 사라 사부루와 니콜라스 프로스트의 연구 거점은 구글의 캐나다 토론토 지사이다.

 

캡슐 네트워크의 목적은 현재의 머신 러닝 시스템의 약점을 극복 하는 것이다. 즉, 소프트웨어가 원래 할 수 있었던 일들을 제한하던 과거에서 벗어나고자 하는 것이다.

현재 구글을 비롯한  대부분의 IT 업계에서 사용되는 이미지 인식 소프트웨어는 모든 장면에서 대상물을 확실하게 인식하려고하면 많은 사진을 참고해야한다. 왜냐하면 이러한 빅데이터 AI 소프트웨어는 배운 것을 현 상황에서 일반화하는 것이 익숙하지 않기 때문이다. 예를 들어, 물건을 다른 새로운 관점에서 보면 같은 것이라고 판단하는 작업은 잘할 수 없다는 단점이 있다. 

 

컴퓨터에 고양이를 다양한 각도에서 인식시키기 위해서는 다양한 관점에서 촬영 한 사진이 수 천 장의 필요하다. 인간의 아이라면 그런의미없는 훈련을 필요로하지 않고, 집에서 기르고있는 애완 동물을 인식 할 수 있다.

 

AI 시스템과 인간의 인식 세계에 대한 차이를 극복하려면 컴퓨터 비전 소프트웨어에 좀 더 통합 할 필요가 있다고 힌튼은 생각하고있다.

 

"캡슐"은 노출 된 가상 뉴런의 작은 집합체로 고양이의 코와 귀 같은 물체가 다른 부품과 공간에서 그 상대적인 위치를 탐지하도록 설계되어있다. 다수의 캡슐에 의한 네트워크는 새로운 장면에 대해 사실 이미있는 장면을 다른 관점에서 본 것 이라고 이해하도록 하는 것이다.

 

데이터의 양을 줄이고 속도 개선이 과제

힌튼은 1979 년 시각 시스템은 타고난 기하학적 감각과 같은 것을 필요로하고 있다는 직관을 얻었다. 인간이 심리적 이미지를 어떻게 활용하고 있는지를 설명하려고 했을 때의 일이다. 그리고 2011 년, 캡슐 네트워크의 기본 구상을 처음 발표했다.

 

위에서 소개한 기술의 발표는 AI 분야의 연구자들 사이에서 오랫동안 기다려온 것이다. 뉴욕 대학에서 이미지 인식을 연구하는 조규현 교수는 "우리 모두 기대하고 있으며, 제프의 계속적은 연구 성과를 기다리고 있었다"고 말했다.

 

힌튼의 아이디어가 얼마나 혁신적인지를 단언하기에는 아직 이르다. 그 자신도 그것을 알고있다. AI 분야의 베테랑 연구자들은 당초 힌튼의 주장을 믿지 못했으나 점점 지지하는 쪽으로 방향을 선회하고 있고 연구결과를 기대하는 분위기이다. 그러나 캡슐 네트워크는 여전히 엄청난 이미지의 산을 가지고 증명 될 필요가 있으며, 기존의 이미지 인식 소프트웨어에 비해 속도도 느린 것으로 지적되기 시작하고있다. 힌튼은 이런 단점을 극복 할 수 있다고 낙관적으로 생각하고있다. 

 

독일과 캐나다에 본사를 둔 이미지 인식의 신생 기업 Twenty Billion Neurons의 공동 설립자이자 캐나다 몬트리올 대학 교수 롤랜드 메미세뷔찌는 힐튼의 기본 구상에 대해 "주어진있는 양의 데이터에서 기존 시스템보다 많은 이해를 얻을 수 있습니다 "라고 말했다.

 

만약 캡슐 네트워크의 개념이 더 광범위하게 활용할 수 있다고 증명되면, 의료 등의 분야에 활용될 수 있을 것이다. AI를 훈련하기위한 화상 데이터가 절대적으로 부족한 분야이기 때문이다.

 

어떤 의미에서는 캡슐 네트워크는 AI 연구의 최신 트렌드에서 벗어나 새로운 한 걸음을 내딛는 출발점이라고 할 수있다. 최근 신경망의 추세는 소프트웨어는 가능한 한 주변 데이타에 대한 지식을 주지 않고 물건을 자신의 힘으로 처음부터 이해시켜야한다는 것이다. 즉 다량의 이미지로 부터 학습하는 기존은 방식을 극복해야 한다는 것이다.

 

뉴욕 대학 교수 게리 마커스(자신이 창업한 AI의 신생기업을 2016년 Uber에 매각)는 "힌튼의 직관에 의한 최근 연구 성과는 새로운 바람으로 숨결을 불어넣는 것으로 매우 환영할 만한 것이라고 생각합니다. AI 분야의 연구자들은 시각과 언어 등의 필수 능력을 구현하기 위해서 인간의 뇌에 포함된 원래의 구조를 적극적으로 모방해야 합니다" 라고 평가했다. 

그리고  "새롭게 등장한 체계가 어떤 결과를 보여줄 지는 아직 모릅니다. 하지만 지금까지의 AI 연구가 표류하고 있던 고립된 관습에서 벗어나는 방법을 원론에 충실하는 길에서 찾아 냈다는 점에서 힌튼 좋은 성과를 올리고 있었다고 할 수있습니다."라고 마커스는 말했다


List of Articles
No. Subject Author Date Views
27 Wandboard Yocto XBMC 올리기 digipine 2017.11.03 436
26 Wandboard Yocto XBMC 올리기 digipine 2017.11.03 351
25 안드로이드 의 써드파티 어플의 SD RW 권한 부여 digipine 2017.11.03 335
24 스니핑 개념, 공격기법, 방어법, 참고할만한 오픈소스 라이브러리 및 툴 digipine 2017.11.03 1300
23 GA-P55A-UD3R rev 2.0 / GT 240 OSX 스노우 레파드 해킨가이드 digipine 2017.11.03 754
22 HIGH QUALITY MOBILE EXPERIENCE (HQME) digipine 2017.11.03 339
21 해킨토시 설치법 GA-P55A-UD3R rev 2.0 / intel Core i5 760 / NVIDIA GeForce GT 240 digipine 2017.11.03 642
20 CISCO Router 설정 팁 - QOS 1 digipine 2017.11.03 1816
19 UC 환경을 위한 종합 네트워크 FMC digipine 2017.11.03 202
18 네트웍 용어중 bps, cps, BPS, pps 의 차이점 digipine 2017.11.03 1576
17 L4 장비의 핵심 로드 밸런싱(Load Balancing) digipine 2017.11.03 946
16 DaVinci 에 대한 소개글 digipine 2017.11.03 112
15 RFID와 USN 에 대해서 digipine 2017.11.03 226
14 SECS 프로토콜 개요 digipine 2017.11.03 893
13 반도체 전공정 후공정 설명 digipine 2017.11.02 4304
12 반도체 장비/공정 기술 용어집 digipine 2017.11.02 1888
11 차세대 비휘발성 메모리 기술동향 file digipine 2017.11.02 247
10 서보모터의 기초와 제어 file digipine 2017.11.02 422
9 서보 모터 (Servo-motor) 의 내부 구조와 회전 원리 file digipine 2017.11.02 807
8 Linux Wi-Fi Setup Tools and Commands digipine 2017.11.02 15446
Board Pagination Prev 1 ... 2 3 ... 4 Next
/ 4