logo

English

구글의 천재 AI 연구자 신경망을 능가하는 "캡슐 네트워크" 발표

by 엉뚱도마뱀 posted Nov 28, 2017
?

Shortcut

PrevPrev Article

NextNext Article

Larger Font Smaller Font Up Down Go comment Print Attachment
?

Shortcut

PrevPrev Article

NextNext Article

Larger Font Smaller Font Up Down Go comment Print Attachment

인간의 뇌를 모방 한 인공 지능의 학습 능력을 형성하는 기반이되는 신경망. 그 단점을 보완하고 자기 학습 능력을 향상 "캡슐 네트워크"를 구글의 연구원이 발표했다. 컴퓨터의 화상 인식 기능인 컴퓨터 영상처리 기능으로 응용 발전시켜, 자율 주행 차량으로 활용도 기대되는 새로운 개념이라고 한다.

 

neuralnetwork-1024x661.jpg

 

인공 지능 (AI)을 둘러싼 요즘의 열띤 논쟁의 주인공은 69세의 구글의 연구원 제프 힌튼이다. 캐나다 토론토 대학 소속이기도 한 이 익살스러운 교수는 2012 년 10 월에 AI 연구로 세계에 충격을주고 새로운 가능성을 열었다.

 

힌튼과 2 명의 대학원생이 발표 한 내용에 따르면, 수십 년 동안 연구 대상으로 도전해온 오래된 기술 "인공 신경망"이 기계의 이미지 인식 기능을 비약적으로 향상 시켰다고 한다. 신경망은 인간의 뇌를 모델로 신경 세포 (뉴런)와 그 관계를 인공적으로 구축 한 것이고 AI에 응용되어 수집한 데이터를 바탕으로 새로운 개념을 학습시키는 머신러닝 등에 활용되고있다.

 

그 발표에서 6 개월도 지나지 않아 3 명의 연구원은 구글에 채용되었고 입사 기념 연설에서  "이제 신경망은 우리의 주장을 구현해서 , 잔디 위를 걷는 고양이를 (개도 돼지도 아니고) 고양이라고 인식하고 인터넷에서 트롤과 싸우고있습니다 . 우리는 (컴퓨터에 이미지 인식하는"시각 "기능을 제공) 컴퓨터 비전 기술의 활용법을 잘못하고 있다고 생각합니다. 현시점에서 무엇보다 잘 작동하지만, 그렇다고해서 올바른 것은 아니었습니다." 라고 주장했다.

 

컴퓨터 비전을 진화시키는 새로운 개념

대신 힌튼은 또 "오래된"아이디어에 대해 밝혔다. 컴퓨터가 사물을 인식하는 방법을 바꾸고 새로운 형태의 AI를 만들어내는 것아 매우 중요한 개념이다. 왜냐하면 컴퓨터 비전은 자율 주행 차량과 의사의 역할을 소프트웨어로 구현할 수 있기 때문이다.

 

2017 년 10 월 하순 힌튼은 2 개의 논문을 발표하고 40 년 가까이 숙고를 거듭 한 아이디어를 증명했다. "이것은 매우 오랜 기간 동안 나에게 가져온 많은 직관에 의해 완성 된 것입니다. 계속 잘 정리되지 않았지만, 마침내 발표 할 수 있었다"고 말했다.

 

힌튼의 새로운 연구는 "캡슐 네트워크"로 불린다. 신경망을 발전시킨 것으로, 이미지와 동영상을 통해 기계에 세계를 이해하기 쉽게 만드는 것을 목표로하고있다.

 

발표 한 논문 중 하나에서는, 캡슐 네트워크의 정확성에 대해 신경망 수준의 성능에 필적했다고 말했다. 소프트웨어가 필기로 기록된  숫자를 얼마나 정확하게 인식 할 수 있는가하는 기준 테스트를 실시하여 얻은 결과라고한다.

 

두 번째 논문에서는 캡슐 네트워크 오답율에 대해 신경망 최저 오류 수치보다  절반으로 감소했다고 발표했다. 트럭이나 자동차 등 장난감을 다른 각도에서 소프트웨어에 인식시키는 과제를 통해 결과를 얻었다.

 

가상 뉴런을 이용한  "캡슐"에 자율 학습을 추가

힌튼은 현재도 이 새로운 기술의 연구를 계속하고있다. 동료 2 명, 사라 사부루와 니콜라스 프로스트의 연구 거점은 구글의 캐나다 토론토 지사이다.

 

캡슐 네트워크의 목적은 현재의 머신 러닝 시스템의 약점을 극복 하는 것이다. 즉, 소프트웨어가 원래 할 수 있었던 일들을 제한하던 과거에서 벗어나고자 하는 것이다.

현재 구글을 비롯한  대부분의 IT 업계에서 사용되는 이미지 인식 소프트웨어는 모든 장면에서 대상물을 확실하게 인식하려고하면 많은 사진을 참고해야한다. 왜냐하면 이러한 빅데이터 AI 소프트웨어는 배운 것을 현 상황에서 일반화하는 것이 익숙하지 않기 때문이다. 예를 들어, 물건을 다른 새로운 관점에서 보면 같은 것이라고 판단하는 작업은 잘할 수 없다는 단점이 있다. 

 

컴퓨터에 고양이를 다양한 각도에서 인식시키기 위해서는 다양한 관점에서 촬영 한 사진이 수 천 장의 필요하다. 인간의 아이라면 그런의미없는 훈련을 필요로하지 않고, 집에서 기르고있는 애완 동물을 인식 할 수 있다.

 

AI 시스템과 인간의 인식 세계에 대한 차이를 극복하려면 컴퓨터 비전 소프트웨어에 좀 더 통합 할 필요가 있다고 힌튼은 생각하고있다.

 

"캡슐"은 노출 된 가상 뉴런의 작은 집합체로 고양이의 코와 귀 같은 물체가 다른 부품과 공간에서 그 상대적인 위치를 탐지하도록 설계되어있다. 다수의 캡슐에 의한 네트워크는 새로운 장면에 대해 사실 이미있는 장면을 다른 관점에서 본 것 이라고 이해하도록 하는 것이다.

 

데이터의 양을 줄이고 속도 개선이 과제

힌튼은 1979 년 시각 시스템은 타고난 기하학적 감각과 같은 것을 필요로하고 있다는 직관을 얻었다. 인간이 심리적 이미지를 어떻게 활용하고 있는지를 설명하려고 했을 때의 일이다. 그리고 2011 년, 캡슐 네트워크의 기본 구상을 처음 발표했다.

 

위에서 소개한 기술의 발표는 AI 분야의 연구자들 사이에서 오랫동안 기다려온 것이다. 뉴욕 대학에서 이미지 인식을 연구하는 조규현 교수는 "우리 모두 기대하고 있으며, 제프의 계속적은 연구 성과를 기다리고 있었다"고 말했다.

 

힌튼의 아이디어가 얼마나 혁신적인지를 단언하기에는 아직 이르다. 그 자신도 그것을 알고있다. AI 분야의 베테랑 연구자들은 당초 힌튼의 주장을 믿지 못했으나 점점 지지하는 쪽으로 방향을 선회하고 있고 연구결과를 기대하는 분위기이다. 그러나 캡슐 네트워크는 여전히 엄청난 이미지의 산을 가지고 증명 될 필요가 있으며, 기존의 이미지 인식 소프트웨어에 비해 속도도 느린 것으로 지적되기 시작하고있다. 힌튼은 이런 단점을 극복 할 수 있다고 낙관적으로 생각하고있다. 

 

독일과 캐나다에 본사를 둔 이미지 인식의 신생 기업 Twenty Billion Neurons의 공동 설립자이자 캐나다 몬트리올 대학 교수 롤랜드 메미세뷔찌는 힐튼의 기본 구상에 대해 "주어진있는 양의 데이터에서 기존 시스템보다 많은 이해를 얻을 수 있습니다 "라고 말했다.

 

만약 캡슐 네트워크의 개념이 더 광범위하게 활용할 수 있다고 증명되면, 의료 등의 분야에 활용될 수 있을 것이다. AI를 훈련하기위한 화상 데이터가 절대적으로 부족한 분야이기 때문이다.

 

어떤 의미에서는 캡슐 네트워크는 AI 연구의 최신 트렌드에서 벗어나 새로운 한 걸음을 내딛는 출발점이라고 할 수있다. 최근 신경망의 추세는 소프트웨어는 가능한 한 주변 데이타에 대한 지식을 주지 않고 물건을 자신의 힘으로 처음부터 이해시켜야한다는 것이다. 즉 다량의 이미지로 부터 학습하는 기존은 방식을 극복해야 한다는 것이다.

 

뉴욕 대학 교수 게리 마커스(자신이 창업한 AI의 신생기업을 2016년 Uber에 매각)는 "힌튼의 직관에 의한 최근 연구 성과는 새로운 바람으로 숨결을 불어넣는 것으로 매우 환영할 만한 것이라고 생각합니다. AI 분야의 연구자들은 시각과 언어 등의 필수 능력을 구현하기 위해서 인간의 뇌에 포함된 원래의 구조를 적극적으로 모방해야 합니다" 라고 평가했다. 

그리고  "새롭게 등장한 체계가 어떤 결과를 보여줄 지는 아직 모릅니다. 하지만 지금까지의 AI 연구가 표류하고 있던 고립된 관습에서 벗어나는 방법을 원론에 충실하는 길에서 찾아 냈다는 점에서 힌튼 좋은 성과를 올리고 있었다고 할 수있습니다."라고 마커스는 말했다


List of Articles
No. Subject Author Date Views
67 Galanz Glanz BCD-467WTDH Screen-Controlled eco-smart refrigerator file lizard2019 2020.05.19 55542
66 How video compression works 5/5 - Deblocking, deringing, and color space conversion file digipine 2017.11.02 23694
65 Linux Wi-Fi Setup Tools and Commands digipine 2017.11.02 15446
64 How video compression works 2/5 - Quantization, coding, and prediction file digipine 2017.11.02 5828
63 CM6206 High Integrated USB Audio I/O Controller Windows Driver and PDF file digipine 2022.02.02 5640
62 [경고] Windows 10 Ctrl+Z 누르면 편집한 파일이 삭제되는 현상 file digipine 2017.12.11 4622
61 반도체 전공정 후공정 설명 digipine 2017.11.02 4304
60 임베디드 Linux 시스템 부팅 시 프로그램 자동 실행 digipine 2017.11.03 4153
59 암호화폐 (Crypto Currency) 비트코인 file digipine 2018.02.08 3514
58 블럭체인 기술자료 링크 digipine 2018.02.08 3103
57 반도체 장비/공정 기술 용어집 digipine 2017.11.02 1888
56 CISCO Router 설정 팁 - QOS 1 digipine 2017.11.03 1816
55 How video compression works 1/5 file digipine 2017.11.02 1596
54 How video compression works 3/5 - Color and motion file digipine 2017.11.02 1595
53 네트웍 용어중 bps, cps, BPS, pps 의 차이점 digipine 2017.11.03 1576
52 High Quality Mobile Experience (HQME) IEEE P2200TM file lizard2019 2020.02.18 1443
51 무료 파티션 도구 AOMEI Partition Assistant v6.6 exFAT를 완벽하게 지원 file 엉뚱도마뱀 2017.11.27 1339
50 스니핑 개념, 공격기법, 방어법, 참고할만한 오픈소스 라이브러리 및 툴 digipine 2017.11.03 1300
49 파나소닉, 풀 스펙 8K 동영상 신호 전송용 단일 케이블 및 커넥터 솔루션 개발 file lizard2019 2019.06.07 1187
48 True Wireless Stereo(TWS)와 LE Audio file digipine 2020.05.27 1175
Board Pagination Prev 1 2 3 ... 4 Next
/ 4