본문 바로가기

[내가 읽은 책]인공지능, 머신러닝, 딥러닝 입문_75

The deep learning race is driven by cutting-edge algorithms, with major players like Google, Facebook, Amazon, and Apple leading the charge. Collaboration between startups and corporations is essential, while Korea needs to strengthen its ecosystem. Netflix uses deep learning for personalized recommendations, accounting for 75% of its consumed content. Google, a leader in deep learning, acquired DeepMind and excels in image search and AI research. Microsoft’s Project Adam rivals Google with efficient resource use, powering applications like Cortana. Baidu, led by Andrew Ng, excels in speech recognition with its DeepSpeech technology.

딥러닝 전쟁의 시작

세계는 지금 소리 없는 딥러닝 전쟁이 시작됐다. 이 전쟁에서의 핵심 무기는 바로 알고리즘이다. 알고리즘이란 어떤 문제를 해결하기 위해 수학적으로 검증된 처리 절차를 말한다. 알고리즘은 여러 종류의 플랫폼에 프로그램으로 구현되어 목적한 기능을 수행한다. 이러한 알고리즘은 다양한 분야에서 숙련된 전문가의 머리에서 나온다. 결국 딥러닝 전쟁은 사람 전쟁이라 할 수 있다.

구글과 페이스북, 아마존 등과 같은 인터넷 서비스 기업들은 일찌감치 딥러닝 전 쟁에 뛰어들었고, 기업향 IT 서비스 업체의 리더인 마이크로소프트와 IBM도 뒤 늦게 합류했다. 혁신적인 기업으로 알려진 애플은 아직까지 딥러닝 분야에 특별한 움직임을 보이지 않다가 최근 딥러닝 기술업체 인수 및 핵심인력 채용 공고 등을 통해 본격적인 참여를 선언했다.

미국 실리콘밸리를 중심으로 풍부한 자본을 공급받은 수많은 스타트업들은 딥러 닝에 필요한 혁신적인 기술을 개발하면서 딥러닝 생태계에서 대기업과 중견기업 의 공백을 메워주고 있다. 선진 IT 업체들은 이러한 비옥한 딥러닝 생태계에서 필 요한 영양분을 섭취하며 빠르게 성장해 가고 있다. 딥러닝 분야에서 우리에게는 좋은 소식과 나쁜 소식이 있다. 좋은 소식은 딥러닝이 이 제 막 시작했다는 것이고, 나쁜 소식은 우리의 딥러닝 생태계가 너무 취약하다는 것이 다. 우리도 하루속히 건강한 생태계를 만들어야 한다. 대학교와 연구소에서 연구한 딥 러닝 기반 기술을 스타트업이 흡수하여 혁신적인 사업 모델과 결합하고 이러한 스타트 업에 대기업이 적극적인 투자를 하는 것이 바람직하다. 딥러닝은 선택의 문제가 아닌 듯 하다. 왜냐하면 우리가 이것을 포기한다면 산업전반에 파급될 피해가 우리가 상상 하는 것 이상으로 크기 때문이다. 지금이 바로 제 4차 산업혁명의 중심인 딥러닝 시대 진입의 골든타임이다.

 

보고 싶은 영화를 로봇이 추천하는 넷플릭스

구글만이 거대한 컴퓨터 자원을 이용한 인공지능 연구를 하는 것이 아니다. 미국 의 넷플릭스 Netflix라는 회사도 딥러닝 분야에 엄청난 투자를 하고 있다. 1997년 설립된 넷플릭스는 초기에는 영화 및 TV 드라마 DVD를 온라인으로 주문 받고 우편으로 배달해주는 서비스로 시작했다가 지금은 인터넷을 통한 스트리밍 서비스를 제공하는 회사다. 스트리밍이란 영화를 내려받지 않고 실시간으로 사용 자의 TV나 모바일 기기에 영상을 보내주는 것을 말한다. 사용자는 서비스 종류에 따라 매달 8~12달러 정도의 구독료를 낸다. 통신료는 별 도다. 2015 10월까지 전 세계 50여 개 국가에 약 7천만 명이 회원으로 등록돼 있고 미국에만 약 43백만의 회원이 있다. 넷플릭스가 딥러닝에 주목하는 이유는 바로 추천 서비스 때문이다. 내가 보고 싶 은 영화를 스스로 결정할 때도 있지만 가끔은 내 취향을 아는 친구나 가족이 추천 해주는 영화를 선택한 경험이 누구나 있을 것이다. 물론 관람평을 분석하거나 검 색 엔진을 통해 내가 보고 싶은 영화를 직접 찾아내는 영화 전문가는 예외일 수도 있겠다. 그러나 바쁜 일상 생활 속에서 영화를 고르는 것도 하나의 스트레스가 될 수 있다. 예를 들면, 넷플릭스가 보유하고 있는 영화가 약 17,000편 정도가 되는데 1분 분 량의 예고편만 보더라도 밤낮 없이 꼬박 10일 이상이 걸린다. '영화 한편 볼까?하 고 TV를 켜는 순간 평소 보고 싶었던 영화를 넷플릭스가 자동으로 추천해 준다면 우리는 10일을 버는 셈이 된다.

한편으로는 넷플릭스도 끊임없이 고객들에게 볼거리를 제공해야 한다. 만약 고객 이 넷플릭스에서 더는 볼거리가 없다고 판단하는 순간 넷플릭스는 다른 사업을 찾 아봐야 한다. 고객들에게 계속 볼거리를 제공하게 해주는 것이 바로 추천엔진이고 넷플릭스의 핵심역량이다. 초기 넷플릭스의 추천엔진은 여러모로 부족했다. 넷플릭스가 추천한 영화를 실제 로 시청한 이용자의 비율이 매우 낮았고 심지어 가장 싫어하는 장르의 영화를 추 천하는 사례까지 있었다. 2006년 넷플릭스는 IT 서비스 업계 최초로 크라우드 소싱crowd sourcing 형태의 연구 개발을 시도했다. 100만 달러의 상금이 걸린 넷플릭스 프라이즈Netflix Prize가 그것 이다. 이 대회는 넷플릭스가 자체적으로 개발한 영화 추천엔진인 씨네매치 CineMatch의 성 능을 개선하고자 오픈이노베이션open innovation 방식으로 기획된 것이다. 만약 새로 운 추천 알고리즘이 기존의 것보다 10% 이상의 성능 향상을 가져온다면, 그 알고 리즘을 제안한 개인 또는 팀은 대회 우승과 함께 10억 원을 상금으로 가져가는 것 이 넷플릭스 프라이즈다. 이에 통계전문가, 프로그래머, 머신러닝 전문가 등 다양 한 분야의 사람들이 개인 또는 팀으로 이 대회에 도전했다. 첫해에는 대부분의 참가자들이 넷플릭스의 씨네매치 알고리즘과 비슷한 성능을 내는 데 만족해야 했다. 점차 참가자들이 경기에 익숙해지고 저마다 개발한 알고 리즘들이 발전하면서 이듬해인 2007년에는 넷플릭스 씨네매치보다 8.43% 향상된 결과를 보인 팀이 1등을 했고, 2008년에는 9.44% 향상된 결과를 낸 팀이 1등을 차 지했다. 공교롭게도 두 해 모두 같은 팀이 1등을 했는데, AT&T의 벨코BellKor라는 팀이었다.

2009년에는 팀 벨코가 다른 팀과 연합해서 대망의 10.06% 성능 향상을 기록했다. 7명으로 구성된 벨코스 프래그매틱 카오스BellKor's Pragmatic Chaos라는 연합팀은 우승 과 함께 10억 원의 우승 상금을 차지했다. 그러나 아쉽게도 이 대회는 개인적인 정 보 유출 소송으로 인해 현재 중단된 상태다. 여기서 잠깐 넷플릭스 프라이즈 대회의 진행 과정을 들여다 보자. 넷플릭스는 480,000명의 이용자와 17,700편의 영화, 그리고 1억 개 이상의 영화평을 [이용자, 영화명, 날짜, 평점] 형태로 저장한 데이터베이스를 보유하고 있는데, 참가자들에 게 평점을 지운 [이용자, 영화명, 날짜, ***] 형태의 데이터를 2 500만 개 세트 로 제공하고 참가자들이 각 데이터세트의 영화 평점을 예측하는 식으로 진행된다. 결론적으로, 단지 영화평점 예측의 정확도만을 평가하는 이 100만 달러짜리 대회 는 그 의도는 좋았으나 결국 투자 대비 만족스러운 결과는 얻지 못했다. 굳이 100 만 달러를 투자한 것의 소득을 묻는다면 궁색하게나마 사람들에게 넷플릭스 서비 스를 홍보하는 마케팅 효과 정도로 만족해야 할 듯하다. 추측컨대 넷플릭스 관계 자들은 대회가 진행되는 동안 추천엔진의 성능 지표를 영화평점 RMSE으로만 결 정하는 것이 불합리하다는 것을 이미 알았을지도 모른다. 영화 추천의 정확도가 넷플릭스 사업의 성패를 좌우하는 이상 넷플릭스는 추천엔 진의 성능 향상에 회사의 역량을 집중하고 있다. 최근 넷플릭스는 딥러닝 기술을 개인화personalization 수준을 높이는 데 적극적으로 사용하고 있고 이를 통해 추천의 정확성을 꾸준히 개선하고 있다. 현재 넷플릭스 이용자가 소비하는 콘텐츠의 75% 는 씨네매치가 추천한 것이라고 한다.

딥러닝의 선두주자 구글

 

구글은 페이지랭크PageRank2라는 알고리즘으로 검색 서비스의 수준을 한차원 높였 다. 1991년 팀 버너스 리Tim Berners-Lee가 만든 최초의 웹사이트인 info.cern.ch가 생긴 이래 야후!Yahoo!가 포털 서비스를 시작했을 때는 전 세계 웹사이트 수가 고작 2,738개에 불과했다. 이후 매년 몇십 배의 성장률로 웹사이트가 늘어나면서 구글 이 베타 서비스를 시작한 1998년에는 전 세계 웹사이트의 수가 240만 개에 달했 다. 최근 전 세계 웹사이트의 수는 2014 9월 기준으로 10억 개를 돌파했다. 구글의 검색 서비스는 사용자가 원하는 검색어를 포함하는 웹사이트를 보여주는 것인데, 이때 검색어에 따라 몇천 개에서 몇천만 개를 보여준다. 구글은 바로 이 페이지랭크라는 알고리즘을 이용해 웹페이지의 중요도 순으로 정렬함으로써 사용 자는 몇천만 개나 되는 모든 웹사이트를 보지 않고도 자신이 원하는 정보를 찾아 볼 수 있다. 여기에 검색 속도를 높이기 위해(대부분 1초 안에 검색이 끝난다!) 전 세계 모든 웹페이지를 구글 데이터센터에 저장해놓고 키워드별 색인 작업을 미리 해 놓는다. 지금까지 검색어로 사용되는 모든 텍스트는 정해진 변환 규칙에 따라 컴퓨터가 알아볼 수 있는 이진수로 바꿀 수 있어서 구글의 키워드 형태의 검색 서비스가 가 능했다. 하지만 사진과 동영상과 같은 이미지 검색은 구글조차도 구현하기 어려운 영역이었다. 소리나 음성은 시간 변화에 따른 1차원적 패턴 비교이므로 비교적 쉽다(음성인식은 또 다른 영역이며 다음 장에서 설명하겠다).

구글은 약 12억 개 이상의 동영상이 저장돼 있는 유튜브나 10억 개 이상의 사진이 포함돼 있는 웹사이트에서 텍스트가 아닌 이미지만을 가지고 검색할 수 있는 서비 스가 필요했다.2011년 구글 엑스Google X5는 스탠포드 대학의 딥러닝 전문가인 앤드류 응Andrew Ng 교수에게 딥러닝 기술이 이미지 검색에 얼마만큼 효과적인지 실제 구현을 통해 보 여 줄 것을 요청했다. 이 실험적인 프로젝트에서 상당히 긍정적인 결과가 도출됐 고, 구글은 이 프로젝트를 통해 이미지 검색 분야에서 딥러닝 기술의 적용 가능성 을 확인하게 된다. 곧 구글은 이 연구를 구글 브레인Google Brain이라는 정식 프로젝 트로 승격한 후 본격적인 이미지 검색 기술 개발을 시작한다. 앤드류 응 교수와 구글의 수석 연구원 제프 딘Jeff Dean이 이끄는 구글 브레인 팀은 16,000대의 컴퓨터를 이용해 유튜브에 저장된 천만 개의 이미지를 분석해 고양이 를 구별해내는 데 성공한다. 구글은 이 프로젝트의 성공으로 딥러닝의 잠재력을 다시 한번 실감하고 본격적인 딥러닝 기술 사냥에 나선다. 구글은 2013, 딥러닝의 창시자로 알려진 토론토 대학의 제프리 힌튼 교수를 영 입하고 힌튼 교수가 설립한 디엔엔리서치DNNResearch도 동시에 인수한다(제프리 힌 튼 교수는 현재 파트타임으로 구글 연구에 참여하고 있다). 이듬해에는 영국 런던 에 있는 불과 현재 12명의 딥러닝 전문가로 구성된 딥마인드를 자그마치 4억 달러에 인수한다. 당시 많은 사람들은 도대체 구글이 무슨 생각으로 보잘것없는 스타트업을 4억 달러에 인수했는지 궁금해 했다. 딥마인드의 정체가 조금씩 밝혀지면서 그러한 궁금증도 어느 정도 해소됐다. 지금은 알파고의 성공으로 누구도 그들 의 가치에 의문을 가지는 사람은 없다. 구글은 이후에도 딥러닝 전문기술을 확보하기 위해 어떠한 파격적인 투자도 서 슴지 않고 있으며, 구글의 자회사인 구글 벤처스Google Ventures와 구글 캐피탈Google Capital6 이 이를 전담하고 있다.

 

딥러닝의 모범생 마이크로소프트

코타나Cortana는 마이크로소프트에서 개발한 음성인식 기반의 지능형 개인 도우미 앱이다. 애플Apple의 시리Siri, 구글 나우Google Now와 유사한 서비스를 제공하며 현 재 영어, 프랑스어, 독일어, 이탈리아어, 스페인어, 포르투갈어, 중국어, 일본어 버 전이 있고 11개 국가에서 사용 중이다. 코타나는 마이크로소프트의 비디오 게임인 할로Halo에 나오는 캐릭터로, 프로젝트 코드명으로 쓰이다가 정식 명칭이 됐다.

윈도우 모바일 Windows Mobile, 아이오에스iOS, 안드로이드Android가 설치된 대부분의 스마트폰과 태블릿에서 동작하며, 엑스박스Xbox, 윈도우 PC에서도 사용할 수 있 다. 딥러닝 기술이 내장된 코타나는 사용자 목소리를 인식하고 자연어를 분석해 사용자와 잡담chit chat을 하거나 정보 검색이 필요하면 마이크로소프트의 검색엔진 인 빙Bing을 이용해 검색 결과를 보여준다.

마이크로소프트는 딥러닝 기술을 스카이프 통역기Skype Translator와 이메일 클러터 email Clutter 같은 서비스에도 적용하고 있다. 스카이프 통역기는 인터넷 기반 전화 서비스인 스카이프를 사용할 때 서로 다른 언어를 사용하더라도 거의 실시간으로 통역해주는 서비스다. 현재 영어, 스페인어, 독일어, 프랑스어, 이탈리아어, 중국 어를 사용할 수 있다. 이메일 클러터는 사용자의 이메일을 분석해 스팸은 물론 중 요하지 않거나 불필요한 메일은 숨기고 중요도가 높은 순으로 정렬하는 서비스를 제공한다. 마이크로소프트는 딥러닝 기술을 음성인식과 자연어 처리 분야에 집중 하고 있으며, 이를 통해 자사 서비스의 가치를 지속적으로 강화하고 있다. 마이크로소프트는 구글 브레인 프로젝트의 성공적인 결과에 자극을 받고 프로젝 트 아담Project Adam을 출범시키면서 딥러닝 연구에 본격적으로 뛰어들었다. 프로젝 트 아담의 목표는 수천 대의 저렴한 서버를 네트워크로 연결해 대규모 분산 컴퓨 팅 환경을 만들고, 이 분산 컴퓨터가 거대한 신경망 학습을 체득하게 하는 것이 다. 이렇게 학습된 마이크로소프트의 인공지능 컴퓨터는 디지털 이미지 분석에 첫 번째로 적용됐다. 구글 브레인은 유튜브에 있는 동영상 이미지를 검색했으나 프로젝트 아담은 이미 지넷ImageNet7 에 있는 약 1,400만 개의 디지털 이미지를 22,000개의 영역으로 분류 하는 데 적용했다. 그 결과로 프로젝트 아담은 구글 브레인보다 30배의 적은 컴퓨 팅 자원으로 50배 이상의 성능 향상과 두 배 이상의 정확도를 얻는 데 성공했다.

마이크로소프트는 중국 베이징에 있는 딥러닝 연구소를 중심으로 새로운 도전에 나섰다. 그동안 컴퓨터가 한번도 좋은 결과를 보여주지 못했던 IQ 테스트 분야다. 여러 가지 도형의 패턴인식을 통해 공간적 논리력을 측정하는 영역, 연속된 숫자 의 패턴 변화를 통해 수학적 논리력을 측정하는 수리 영역, 그리고 어휘의 이해도 를 묻는 언어 영역으로 구성돼 있는 IQ 테스트에서 특히 컴퓨터로선 가장 수행하 기 어려운 언어 영역에 도전했다.

마이크로소프트는 딥러닝 기법을 이용해 여러 가지 상황에 따른 언어 활용을 훈련 시킨 결과, 기존의 알고리즘은 물론이고 200명 규모의 아마존 메커니컬 터크 서 비스의 평균값보다 더 좋은 결과를 보여줬다.

세계 2위의 검색 서비스 바이두

사람들은 바이두Baidu를 가리켜 중국의 구글Chinese Google이라고 한다. 구글처럼 겸 색 서비스를 주요 사업으로 삼고 있는 바이두는 최근 마이크로소프트의 빙을 근소 하게 누르고 구글 다음으로 세계 2위의 검색 서비스 업체가 됐다. 바이두의 목표는 세계화를 가속화해서 구글과의 격차를 좁히는 것이다. 이를 위한 바이두의 투자는 거침이 없다. 바이두는 지난 2014 5월에 스탠포드 대학의 앤드류 응 교수를 영입하고 바이두 의 딥러닝 분야 수석연구원으로서 미국 실리콘밸리 소재 인공지능 연구소를 이끌 게 했다. 구글 본사 바로 뒤에 이 연구소를 설립하고 구글의 딥러닝 핵심 프로젝트 인 구글 브레인을 총괄했던 앤드류 응 교수를 영입함으로써 바이두는 본격적인 구 글과의 전쟁을 선언하였다.

앤드류 응은 바이두에 합류하고 나서 가장 중점을 둬야 할 목표로 정확도를 꼽았 다. 그 이유는 정확도가 높아지면 높아질수록 인공지능이 주는 가치는 질과 양적 인 측면에서 그 차원이 달라지기 때문이라고 설명한다. 그가 주목한 바이두의 정 확성 개선의 첫 번째 타깃은 모바일 음성인식이었다. 2014 12월 바이두는 딥스피치 Deep Speech를 발표한다. 딥스피치는 딥러닝 기술 중 하나인 순환신경망RNN; Recurrent Neural Network 방법을 이용한 음성인식 프로그램이 다. 벤치마킹 테스트 결과 딥스피치가 단어 인식 정확도에서 애플, 구글, 마이크로 소프트의 음성인식 프로그램을 모두 앞질렀다. 특히 바이두의 딥스피치는 소음이 심한 주변환경에서 더욱 실력을 발휘했다. 참고로 소리에 섞여있는 소음 제거는 비지도학습의 군집 모델을 사용한다. 예를 들면, 사람의 음성과 다른 소음의 특성을 파악해서 두 개의 음파를 분리clustering하는 것이다. 2015 12, 딥스피치가 발표된 지 정확히 1년 후 바이두는 딥스피치2를 발표한 다. 사실 딥스피치1은 중국 베이징 소재 딥러닝 연구소에서 주도해서 개발한 것이 고, 딥스피치2는 앤드류 응이 이끄는 실리콘밸리팀이 주도적으로 개발한 것이다. 딥스피치2는 음성인식 컴퓨팅 과정을 하나로 묶는 완전체end-to-end 시스템을 구현 했고, 여기에 가장 많이 사용되는 중국어인 만다린어Mandarin를 인식하는 기능을 추 가했다. 중국어 음성인식의 필요성은 여러 가지가 있겠지만 특히 동일한 음에 여러 가지 다른 의미의 글자를 가지고 있는 중국어 특성 때문에 음성인식을 통한 문자 입력 이나 검색이 핵심적인 모바일 서비스가 될 것이라는 것이 바이두의 설명이다. 바 이두는 5년 내에 음성이나 이미지 검색이 전체 검색의 절반을 넘어설 것이라고 예상하고 있다.

페이스북은 '사람을 연결하는' 서비스에서 '사람을 더 많이 연결하는' 서비스로 가 기 위해서는 딥러닝이 핵심적인 역할을 할 것이라고 예상하고 있다.

 

페이스북은 매일 접속하는 10억 명의 사람들에게 각 사용자마다 2,000여 개 이 상의 아이템을 보여줄 수 있는데 이 가운데 각 개인이 가장 보고 싶어하는 아이템 100여 개를 선택해야 한다. 그러기 위해서는 컴퓨터가 사람마다 다른 관심, 취향, 문화, 관계 등을 이해해야 하고 동시에 2,000여 개의 아이템의 속성도 알고 있어야 한다. 이를 위해 페이스북은 2013 12월 인공지능 연구소FAIR; Facebook AI Research를 설립하고 뉴욕대학교 딥러닝 전문가인 얀 르쿤 교수에게 인공지능 연구 총괄을 맡 겼다. 얀 르쿤은 딥러닝 분야에서 다섯 손가락 안에 드는 세계적인 거물이다. 그만 큼 페이스북이 인공지능에 거는 기대를 엿볼 수 있다. 1980년대 인공지능 분야가 두 번째 겨울을 맞이하고 있을 때 얀 르쿤은 프랑스에 서 컴퓨터공학을 전공하고 있었다. 그는 인공지능 분야가 침체된 이유를 이해하지 못했고, 언젠가는 다시 큰 역할을 하리라 굳게 믿었다. 1987년 프랑스에서 박사학위를 받고 캐나다 토론토대학에 있는 제프리 힌튼 교수 를 찾아가서 박사후과정을 이수한다. 제프리 힌튼 교수는 당시 학문적으로 외면 당했던 인공지능 연구를 묵묵히 수행하면서 지금의 딥러닝이 있게 한 장본인이다. 여기서 얀 르쿤은 제프리 힌튼 교수와 함께 딥러닝의 핵심인 역전파 이론을 정립 한다. 역전파 이론은 그의 박사논문 주제이기도 하다. 토론토대학의 박사후과정을 마치고 얀 르쿤은 AT&T의 벨 연구소로 옮겨 컨볼루 션 신경망10CNN; Convolution Neural Network 이론을 기반으로 디지털 이미지 인식 기술 을 연구한다. 여기서 그는 손으로 필기된 개인수표를 읽을 수 있는 리더기를 개발 해 ATM에 설치하는 등 상품화에 성공하기도 했다. 이후 2003년 뉴욕대학교 컴퓨 터과학 교수로 임용된 후 토론토 대학의 제프리 힌튼 교수, 몬트리올 대학의 요슈 아 벤지오 교수와 함께 '딥러닝 비밀단체deep learning conspiracy'를 결성한다. 이 비밀단 체는 스탠포드 대학의 앤드류 응 교수와 함께 지금의 딥러닝 붐을 일으키는 데 결 정적인 역할을 한다. 2014 3월에 페이스북은 딥페이스DeepFace 시스템을 발표했다. 딥페이스는 두 개 의 인물사진을 비교해서 동일인인지 여부를 판단하는 프로그램인데 그 정확도가 97.25%에 달한다. 사람이 구별했을 때 97.53%라고 하니 사람과 똑같다는 얘기다. 딥페이스는 페이스북이 2012년에 인수한 이스라엘 스타트업 face.com이 개발한 것으로 딥러닝 기술을 적용해 인식률을 획기적으로 개선한 얼굴인식 프로그램이 다. 그림 9.4는 딥페이스가 헐리우드 스타인 실베스터 스탤론의 사진을 인식하는 과정을 보여준다.

페이스북은 인공지능 연구소를 미국 뉴욕, 실리콘밸리 그리고 프랑스 파리에 설치 하고 여기서 개발된 인공지능 기술을 페이스북의 다양한 서비스에 접목해 더욱 매 력적인 서비스로 발전시키려고 노력 중이다. 예를 들어, 2015 8월에 시작한 페 이스북의 개인비서 M이라는 서비스에 인공지능을 이식하는 것이 있다. 페이스북 M은 구글 나우, 마이크로소프트의 코타나, 애플의 시리와 같은 서비스로 식당 예약, 스케줄 관리, 항공편 예약 등의 일을 대신 해준다. 페이스북 M 2015 년 페이스북이 인수한 wit.ai라는 자연어 처리 전문업체에서 시작이 되었는데, 지 금은 인공지능연구소가 페이스북 M을 더욱 똑똑한 개인비서로 훈련시키고 있는 중이다.

스마트 기업을 지향하는 IBM

인터넷 기업이 아닌 업체로 인공지능 분야에 선두적인 역할을 하는 회사로는 IBM 을 들 수 있다. IBM 1997년 세계 체스 챔피언인 가리 카스파로프를 물리친 인공 지능 컴퓨터 딥블루 시스템의 성공 이후 인공지능 분야에서 IBM 기술력을 알릴 수 있는 새로운 기회를 찾고 있었다. 3,000여 명 규모의 IBM 연구개발 조직의 총책임을 맡고 있는 폴 혼Paul Horm은 우연히 제퍼디Jeopardy!11 라는 퀴즈쇼를 보고 무릎을 쳤다. 은유적인 언어를 이해하 고 광범위한 지식이 필요한 이 퀴즈쇼에서 사람과 겨뤄서 이긴다면 인공지능 분야 에서 IBM의 기술력을 보여줄 수 있을 것이라고 판단했기 때문이다.

IBM 연구원인 데이비드 페루치David Ferruchi는 피컨트Piquant라는 질의응답 시스템 개 발을 예전부터 하고 있었는데 폴 혼은 2006년 여름에 정식으로 데이비드 페루치 에게 제퍼디 프로젝트를 일임한다. 데이비드 페루치는 무수히 많은 시행착오 끝에 왓슨Watson이라고 하는 인공지능 시스템 개발을 완성하고, 2011년 제퍼디! 퀴즈쇼 에 나간다. 여기서 왓슨은 최대 우승상금 수상자인 브래드 러터Brad Rutter, 최다우승 기록자인 켄 제닝스Ken Jennings와 겨뤄서 모두 물리치고 우승하면서 10억 원의 상금 을 받게 된다. 퀴즈쇼에 참가할 당시 왓슨은 다른 참가자와 똑같이 사회자가 설명 하는 질문을 듣고 기계 손을 이용해 버튼을 누른 뒤 답하는 방식으로 경쟁했는데 유일한 차이점은 왓슨의 두뇌는 무대 뒤의 100여 대의 컴퓨터12 안에 있었다는 것 뿐이었다.

당시 왓슨에는 두 가지 인공지능 기술이 적용됐다. 하나는 음성인식 및 자연어 처 리 기술이고 다른 하나는 질문을 이해하고 질문에 해당하는 답을 확률적 근거를 가지고 추론하는 기술이다. 왓슨은 이 두 기술을 완벽히 구현해서 제퍼디! 역사상 가장 훌륭한 두 인간 참가자를 물리치고 우승했고, 이를 통해 신문이나 백과사전, 교과서 등에 있는 어떤 사실을 묻는 질의응답 분야에서는 사람보다 앞선다는 것을 증명했다. IBM은 몇몇의 특정 분야에서는 이제 전문가보다 똑똑한 왓슨을 본격적으로 시장 에 선보이기 시작했다. 예를 들어, 헬스케어 분야 및 기상 예측 서비스 분야에서는 파일럿 프로젝트가 진행되고 있으며 가시적인 매출도 생기기 시작했다. IBM은 이제 왓슨이 더 매력적인 상품이 되길 원한다. 이를 위해 딥러닝과 같은 또 다른 강력한 인공지능 기능을 추가하려고 시도 중이다. 예를 들면, 자동번역 기능 이나, 음성을 텍스트로 변환한다거나 거꾸로 텍스트를 음성으로 변환하는 딥러닝 기술이다. IBM은 이러한 딥러닝 기술을 확보하기 위해 캐나다 몬트리올 대학교에 있는 딥러닝의 대가인 요슈아 벤지오 교수와 협업 중이다.

 

책 제목 : 알고리즘으로 배우는 인공지능, 머신러닝, 딥러닝 입문

지은이 : 김의중