[스페셜 리포트] 소프트웨어, 세상을 바꾸다_① 검색시장의 새 이정표, 지식그래프

2015/04/29 by 삼성전자
공유 레이어 열기/닫기
주소가 복사되었습니다.

#1

요즘 한창 DIY(Do It Yourself, 부품을 구입해 직접 조립하는 것) 취미에 빠져 있는 어려운(34)씨. 얼마 전 그는 앤티크 가구점에서 본 탁자를 떠올리며 비슷하게 생긴 소품 제작에 돌입했다. 역시 ‘DIY 마니아’인 친한 선배는 그에게 “나무 느낌을 살리려면 수지(樹脂)로 칠하는 게 좋다”고 귀띔했다. 어씨는 선배 말을 떠올리며 인터넷 포털 검색 창에 ‘수지’를 입력했다.

결과 화면의 맨 윗부분을 차지한 건 최근 신곡으로 컴백한 걸그룹 미쓰에이 멤버 ‘수지’ 관련 정보였다. 사이사이 ‘수지부동산’ ‘수지 개발’ ‘무역수지’ ‘수지 균형’ 관련 링크도 눈에 띄었다. 뜻밖의 결과에 당황한 어씨는 잠시 후 키워드를 ‘수지 라커(lacquer, 어법에 맞는 표기는 ‘래커’)’로 바꿨다. ‘수지로 만든 라커’라고 검색어를 구체화하면 원하는 결과가 나올 거라고 생각한 것. 그러자 이번엔 미얀마의 재야 지도자 아웅산 수지(Aung San Suu Kyi, 어법에 맞는 표기는 ‘아웅산 수치’)가 미얀마 라커인(Rakhine) 지역 개발 이슈에 침묵하고 있다는 뉴스가 떠올랐다. 간간이 수지(경기 용인시 수지구) 일대 코인 라커(coin locker) 얘기도 등장했다.

다시 고민에 빠진 어씨, 이번엔 ‘수지 도료’를 쳤다. 그랬더니 합성수지 도료 관련 내용이 끝도 없이 펼쳐졌다. ‘뭐라고 입력해야 하지? 아하, 합성수지가 아니라 천연수지로 검색하면 되겠구나!’

이번엔 검색 범위가 제법 좁혀졌다. 하지만 여전히 천연수지 도료에 대한 연구 결과와 그에 관한 옛날 뉴스가 대부분이고 천연수지 라커 구매 정보를 찾는 건 여전히 ‘짚더미에서 바늘 찾기’ 수준이었다. 그는 그만 검색을 포기해버렸다. “에이, 컴퓨터가 하는 일이 그렇지! 역시 좀 힘들어도 발품을 팔아야 해.” 어려운씨는 결국 오는 주말 서울 을지로 전문상가에 다녀오기로 마음 먹었다.

 

#2

같은 시각, 정답만(37)씨도 DIY 차탁(茶卓)을 완성한 후 수지 마감재를 찾고 있었다. 의미 검색, 일명 ‘시맨틱 서치(semantic search)’를 사용해 ‘수지’를 검색하자, ‘수지’의 다양한 의미에 해당하는 콘텐츠가 일목요연하게 정렬돼 눈앞에 나타났다. 일일이 찾기가 복잡하다고 여긴 정씨는 이 단계에서 다시 ‘수지 라커’란 검색어를 입력했다. 검색엔진은 자동으로 ‘천연수지 래커’의 검색 결과를 보여줬다. 관련 콘텐츠들이 나열되는 건 일반 검색엔진과 비슷했다. 하지만 PC 화면 오른쪽 위에 또 하나의 공간이 생성돼 관련 이미지는 물론, 천연수지의 △사전적 정의 △속성과 용도 △합성수지와의 차이점 △가공 제품과 구매처 등의 정보가 깔끔하게 제시됐다.

정씨는 그 공간 아래쪽에 가지런히 제시된 작은 이미지들 중 천연수지 래커 판매처 사진을 클릭했다. 그러자 천연수지 도료 판매 웹사이트가 죽 떠올랐다. 결국 그는 그 중 한 곳에서 맘에 드는 래커가 괜찮은 가격에 나와 있는 걸 발견한 후 주문을 완료했다. 이내 정씨 메일함엔 “주문 상품이 내일 도착할 예정”이란 확인 메일이 날아왔다.

정답만씨는 간단한 검색 행위만으로 원하는 제품을 쉽게 구했다. 그뿐 아니라 천연수지에 대해서도 한층 자세히 알게 됐다. 천연수지로 만든 래커는 아토피를 일으키지 않는 친환경 도료란 사실도 배웠다. ‘건강친화적 도료란 말이지, 그럼! 누가 만드는 건데.” 그는 어쩐지 뿌듯해졌다.

스페셜리포트_삽화 (1)

 

‘의도’ 이해하는 검색, 가능할까?

위 두 사례의 차이점은 확연하다. 같은 과제를 놓고도 정답만씨가 어려운씨에 비해 훨씬 더 쉽게 해결책을 도출했다는 사실이다. 비결은 ‘검색엔진’에 있다.

어씨가 사용한 검색엔진은 사용자가 입력한 검색어와 동일한 문자가 포함된 콘텐츠를 ‘전체 사용자의 검색 빈도’ 순(順)으로 단순 배열해 보여줬다. 이 경우, 개별 콘텐츠 간 의미의 상관관계는 ‘제로(0)’에 가깝다. 쉽게 말해 ‘백과사전식(式) 배열’이라고 할 수 있다. 반면, 정씨가 사용한 검색엔진은 ‘똑같은 문자도 다양한 상황에서 서로 다른 뜻으로 사용될 수 있다’는 사실을 인지하고 있었다. 그래서 사용자가 입력한 검색어를 여러 맥락(context)에서 찾아 관련성 높은 순서로 제시할 줄 알았다. 한 발 더 나아가 ‘동의어’나 ‘연관어’ 개념 이해도 가능했다. 그 결과, 검색자의 의도에 보다 근접한 결과를 내놓을 수 있었다.

스페셜리포트_그래프▲지식그래프는 사용자가 검색한 키워드에 관한 콘텐츠를 총체적으로, 그리고 가시적으로 보여준다. 말 그대로 ‘그래프화(化)된 지식’인 셈이다

정답만씨의 경우, △‘라커’와 ‘래커’가 같은 뜻이고 △‘수지’가 ‘천연수지’와 연관된다는 사실을 시맨틱 서치 엔진이 이해했다. 그 때문에 ‘수지 라커’를 입력했을 때 (‘아웅산 수지’와 ‘라커인’처럼) 동일한 문자라도 서로 흩어져 존재하는 맥락보다 ‘천연수지 래커’가 더 가까울 거라고 판단, 검색 결과를 내놓은 것이다.

정씨가 사용한 검색 엔진은 ‘천연수지’, 그리고 ‘천연수지 래커’와 관련된 콘텐츠를 ‘한눈에 들어오는’ 비주얼로 제시할 줄 안다. 검색자는 그 결과를 쓱 둘러본 후 본인이 원하는 정보를 클릭하면 된다. 원하는 내용이 언제 나올지 모르는 상태로 헤드라인과 발췌 부분을 일일이 읽어가며 ‘무한 스크롤 다운(scroll down)’ 하지 않아도 된다. 게다가 이 검색 엔진은 수많은 출처에서 자료를 끌어와 정리할 줄도 안다. 사용자 입장에서 이런 검색엔진은 본인의 관심 분야와 관련, 뜻밖의 재밌는 사실을 알려줄 수 있으므로 지식의 폭이 자연스레 넓어지는 효과까지 제공한다.

 

정확하게, 보기 좋게, 검색도 쉽게!

정답만씨의 검색 행위를 수월하게 해준 시맨틱 서치 엔진은 실제로 최근 소프트웨어·콘텐츠 산업 분야에서 ‘블루 오션’으로 떠오르고 있다. 그리고 이 검색 엔진의 기반이 되는 게 바로 ‘지식그래프(knowledge graph)’다. 정씨의 검색 과정을 설명한 부분에서 ‘PC 화면 오른쪽 위에 생성된 또 하나의 공간’이 지식그래프라고 이해하면 쉽다. 하지만 지식그래프는 모호한 명칭만큼이나 이해가 쉽진 않다. 지식그래프의 정확한 정의는 뭘까?

먼저 ‘그래프’란 개념을 생각해보자. 예를 들어 최근 봄 날씨에 대해 궁금증이 생겼다고 하자. 날씨가 하도 변덕스러워 대체 기후가 온난화되는 건지 아닌지 확실히 알고 싶다. 이게 일시적 현상인지, 장기적으로 진행돼온 전 지구적 현상인지 확인하려면 최근 100년간 매해 평균 기온의 추이를 알아보면 될 것이다. 인터넷에서 1910년대, 1920년대, 1930년대 평균 기온을 각각 검색하면 관련 수치들이 나온다. 어렵사리 10년 단위로 평균 기온을 찾았다 해도 숫자만 보며 그 관련성을 이해하려면 머리가 복잡해진다. 하지만 이 숫자들을 그래프로 만든다면 어떨까? 우리나라 기온이 해마다 어느 정도 편차를 보이는 가운데 점차 온난화 경향을 띠고 있다는 사실을 단번에 알 수 있다.

여기서 우리는 그래프란 ‘수많은 데이터와 그 관련성을 한눈에, 보기 쉽게 제시해주는 포맷’이란 사실을 다시 한 번 확인할 수 있다. 그래프에서 중요한 건 콘텐츠와 가시성(可視性·visibility)이다. 지식그래프 역시 특정 개념에 관한 총체적 콘텐츠를 가시적으로 드러내준다. 검색엔진과 결합, 하나의 키워드에 관련된 데이터들과 그 관련성을 보기 쉽게 제시해주는 것. 사용자가 검색한 키워드 관련 지식을 통합적으로 보여주는 동시에 연관 키워드까지도 쉽게 찾을 수 있도록 해주는 소프트웨어인 셈이다. 바로 이 점 때문에 지식 그래프에선 콘텐츠와 가시성 못지않게 검색용이성(browsibility)이 중요하다.

어쩌면 이 글을 읽는 독자 중 일부는 이미 지식그래프를 접했거나 또는 이용 중인지도 모른다. 지식그래프 개발 선두 기업 중 한 곳인 구글이 지난 2012년부터 ‘구글 지식그래프(Google knowledge graph)’ 서비스를 시작했기 때문. 구글에서 뭔가 검색해본 경험이 있는 사용자라면 지식그래프도 당연히 접해봤을 것이다. 실제로 구글에서 특정 키워드를 검색했을 때 나타나는 결과 페이지 오른쪽이 지식그래프 영역에 해당한다.

스페셜리포트지식그래프4

지식그래프가 실제로 어떻게 사용되는지 알아보기 위해 실제 검색어 하나를 예로 들어 살펴보겠다. 구글 검색 창에서 ‘Taj Mahal(타지마할)’이란 단어를 입력하면 인도의 유명 유적지 타지마할 사진과 함께 △지도 △주소 △연혁 △높이 △건축 양식 △건축가 △묻혀 있는 사람들 △건물 기능 등 타지마할에 관한 각종 정보가 떠오른다. 연관 웹사이트 링크가 제시되는 건 물론이고 아그라 성이나 쿠트브 미나르, 만리장성 등 타지마할을 즐겨 찾는 이가 좋아할 만한 다른 유적지 사진도 제시된다. 결과 창의 맨 아래쪽엔 ‘타지마할’이란 예명을 쓰는 미국의 유명 R&B 가수와 라스베이거스 소재 ‘타지마할 리조트’도 나와 있어 타지마할로 이런 내용을 원한 이들이라면 곧바로 이 영역을 클릭, 결과를 확인할 수 있다. 잘 보이고(visible) 검색이 용이할 뿐 아니라(browsible) 보여지는 콘텐츠의 질과 양 모두 총체적이다.

 

인공지능에 한 걸음 더 다가서다

지식그래프의 등장은 IT 산업에 엄청난 혁신(innovation)을 안겨줄 것으로 기대된다. 인공지능(Artificial Intelligence, AI) 개발이 처음 본격적으로 거론되던 1950년대부터 지속적으로 예견돼온 인공지능의 가능성과 문제점에 획기적 해결책을 제시하고 있다는 점에서 특히 그렇다.

컴퓨터는 인간에 의해 주어진 데이터를 정해진 명령어에 따라 처리할 줄은 알아도 스스로 생각해 맥락을 구분하는 단계에까진 이르지 못했다. 바로 이 점은 인공지능의 치명적 한계로 지적돼왔다. 종종 인공지능이 희화화되곤 하는 것도 이 때문이다. 얼마 전 TV 코미디 쇼에 등장한 에피소드가 단적인 예다. 이 장면에선 이발소 도우미 로봇이 고객의 머리를 ‘깎아’ 드리라는 주인의 지시를 받고 ‘까까(과자)’를 고객 입에 밀어 넣는다.

인공지능을 더욱 정교하게 다듬으려는 시도는 과학계 전반에 걸쳐 꾸준히 진행됐다. 인간처럼 △스스로 맥락을 판단하고 △동의어를 인지해 융통성 있게 이해하며 △인간의 능력으론 한번에 처리하지 못할 정도로 방대한 데이터를 일목요연하게 종합해 △모든 결과를 한눈에 보이도록 제시하는 ‘인공지능 탑재 컴퓨터’를 완성하기 위해 부단히 노력해온 것이다.

만일 컴퓨터가 이런 기능까지 구현한다면 오랫동안 전설이나 동화, 공상과학소설 등에서나 상상해오던 인간의 꿈은 더 이상 꿈에 머무르지 않게 된다. 실제로 그리스 신화에선 청동으로 만들어진 기계 인간 ‘탈로스(Talos)’가 기지를 발휘해 위기에 빠진 공주 ‘에우로파(Europa)’를 지켜준다. 그림동화집 속 백설공주의 계모는 거울 속 이미지와 세상만사를 의논한다. 시계를 좀 더 최근으로 돌려 공상과학 영화 시리즈 ‘스타트렉(Star Trek)’에선 무한한 정보에 기초해 다양한 지침을 제안하는 로봇 ‘싱크 탱크(Think Tank)’가 종횡무진 활약한다.

스페셜리포트지식그래프1▲인간은 오랫동안 자신과 비슷한 수준의 사고 능력을 갖춘 인공지능을 꿈꿔왔다. 전지전능한 인공지능을 기반으로 인간을 돕거나 공격하는 로봇은 실제로 수많은 전설과 공상과학소설 속 단골소재였다

인공지능은 때로 등골 오싹해지는 상상을 낳기도 했다. 영화계의 거장 스탠리 큐브릭 감독의 1968년 작품 ‘2001 스페이스 오디세이(2001: A Space Odyssey)’ 속 인공지능 컴퓨터 ‘할(HAL) 9000’이 대표적이다. 단순 점멸하는 붉은 등(燈) 모양의 이 로봇은 우주선 탑승자를 모두 죽이고 지구 정복까지 꿈꾸는 ‘가공할 파워 캐릭터’로 등장한다.

하지만 실제 세상에서 할9000 같은 로봇이 횡포를 부릴 가능성은 거의 없다. 그보다는 한층 똑똑해진 인공지능이 구글 지식그래프 같은 검색엔진으로, 아니 그보다 훨씬 더 무한한 가능성으로 인간에게 큰 도움을 줄 공산이 크다. 구글을 포함해 애플(시리·Siri), IBM(왓슨·Watson), 마이크로소프트(커타나·Cortana), 아마존(에코·Echo) 등 유수의 글로벌 IT 기업이 지식그래프 개발에 열을 올리는 건 그 때문이다.

 

지식그래프 개발 ‘첫삽’ 뜬 삼성전자

삼성전자 역시 날로 치열해지는 지식그래프 시장에 뛰어들기 위해 최근 본격적 행보를 시작했다. 그 출발점은 소프트웨어센터다.

지식그래프 분야에 접근하는 삼성전자의 자세는 여타 기업과 사뭇 다르다. 가장 두드러지는 차이는 ‘개방성’. “소프트웨어 소스를 단계적으로 개방, 비옥한 개발 환경을 일구는 동시에 자체 개발력도 성장시켜나가겠다”는 복안이다. 이제껏 대부분의 기업이 검색 소프트웨어를 개발할 때 자신들만의 벽을 쌓고 독채를 지어 올렸다면 삼성전자는 집단지성 개념에 기초해 분야별 전문가들이 자유롭게 왕래할 수 있도록 커다란 광장을 조성하고자 하는 것이다.

‘지식그래프’라는 검색엔진 진화사(史)의 새 이정표 앞에 선 삼성전자의 첫걸음은 구체적으로 어떤 형태를 띠고 있을까. 다음 편에선 삼성전자 소프트웨어센터에서 지식그래프 개발 작업에 한창인 이들을 만나 그 세계를 좀 더 밀착해 들여다보려 한다.

by 삼성전자

삼성전자

삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>

TOP