[스페셜 리포트] 소프트웨어, 세상을 바꾸다_③ ‘케이샵 프로젝트’ 이끄는 윤진수 삼성전자 소프트웨어센터 상무를 만나다<연재 끝>
“데이터(data)는 그 자체가 일정한 가치를 담고 있습니다. 삼성전자에서도 이 같은 데이터의 중요성을 인지하고 데이터를 하나의 시스템으로 구축하기 위해 꾸준히 노력해왔어요. 기업 전체로 봤을 때 데이터가 부서별로 쌓이면 그 중 한 조직에서 특정 데이터가 필요하다 해도 쉬이 찾아보기 어려워집니다. 여기저기 흩어져 있는 데이터를 통합하고 그 결과에서 가치를 도출하는 작업이 필요한 건 그 때문이죠. 삼성전자가 소프트웨어센터를 만든 이유도 거기에 있습니다. 소프트웨어센터의 목표 중 하나는 데이터를 통합해 자산화(資産化)하는 겁니다. 데이터를 공유 플랫폼에 담아 누구나 쉽게 이용하도록 하는 거죠. 그렇게 되면 제품 경쟁력이 높아지는 건 물론, 회사 전체의 ‘프로세스 혁신’도 보다 효율적으로 지원할 수 있게 됩니다.”
▲윤진수 상무는 “빅데이터란 말이 널리 퍼지긴 했지만 아직 그 의미가 명확하게 정립돼 있진 않다”면서도 “머지않은 미래에 빅데이터 개념이 우리 삶 깊숙이 스며들게 될 것”이라고 전망했다
“우리 목표는 삼성전자 고객용 보조 검색 서비스 개발”
지난 7일 삼성디지털시티에서 마주한 윤진수 삼성전자 소프트웨어센터 상무의 말투는 간결하면서도 확신에 차 있었다. 그는 지난 1993년 삼성전자에 입사, 줄곧 소프트웨어 한 분야에서 근무해왔다. 지난 2013년 말부턴 삼성전자 내 빅데이터 관련 프로젝트들을 총괄하고 있다.
윤 상무의 주요 임무는 삼성전자 내부 데이터를 통합, 효율적으로 활용할 수 있는 플랫폼을 만드는 것이다. 이렇게 가공된 데이터는 삼성전자 임직원이면 누구나 쉽게 쓸 수 있다. 대량의 데이터를 분석해 특정 부서가 필요로 하는 내용을 쉽게 찾아볼 수 있도록 가공하는 것도 그가 이끄는 조직의 역할 중 하나다. 삼성전자의 지식그래프 데이터 공개 프로젝트 ‘케이샵(K#) 프로젝트’도 그 연장선상에 있다.
“저희는 독립적 기능이 갖춰진 검색엔진을 개발하려는 게 아닙니다. 삼성전자가 포털 서비스를 제공하는 기업은 아니니까요. 엄밀하게 말하면 저희의 목표는 ‘삼성 제품 속에 자연스레 스며들어 사용자를 편리하게 하는 보조 검색 서비스 개발’입니다. 삼성전자 고객 입장에선 ‘삼성전자 웹사이트에 갔더니 다른 곳에서보다 훨씬 쉽게 제품 기능 등의 정보를 찾을 수 있더라’고 느끼도록 만드는 게 목표입니다. 다시 말해 저희는 웹사이트나 개별 상품에 통합돼 삼성전자 제품과 서비스의 경쟁력을 제고하는 방향으로 빅데이터를 활용하고자 합니다.”
데이터를 모아 필요 시 제공하는데 검색 ‘엔진’은 아니다? 소프트웨어를 전공하지 않은 일반 사용자 입장에선 다소 헷갈릴 수 있는 논리다. 윤 상무는 태블릿 PC를 꺼내 스크린에 화면 하나를 띄운 후 설명을 이어갔다.
“제가 삼성 제품 고객인데 지금 삼성 TV를 보고 있다고 해보죠. 제 손엔 삼성 디지털카메라도 한 대 들려 있습니다. 만약 제가 지난 주말 이 카메라로 촬영한 동영상을 TV 화면으로 보고 싶다면 어떤 행동을 취할까요?”
이 상황에서 이제까지의 소비자들은 삼성전자 고객센터에 전화를 걸거나 구글·네이버 등의 검색 창에 ‘TV-카메라 연결법’ 따위의 문구를 입력해왔다. 고객센터를 이용할 경우, 영업 종료 시각 이후엔 통화 연결이 어렵다는 문제가 있었다. 인터넷 포털 서비스 활용 시엔 관련 웹문서를 일일이 확인해야 했다(설사 원하는 내용을 찾는다 해도 자신이 갖고 있는 TV나 디지털카메라의 모델명과 사양의 일치 여부를 재점검해야 하는 불편을 감수해야 했다).
동일한 상황에서 삼성전자 내 빅데이터 시스템이 통합돼 사용자 서비스로 제공된다면 어떨까? 삼성 TV 사용자는 자신이 보유한 각종 디지털 기기의 정보를 삼성전자 웹사이트에 미리 등록해둔 후 TV와 호환되는 기기, 기기 간 연결에 필요한 케이블 종류 등을 그때그때 확인만 하면 된다. 어쩌면 해당 페이지에서 한 차례 클릭만으로 필요한 제품을 구입할 수 있게 될지도 모른다.
지식그래프 기술은 바로 이 단계에서 적용된다. ‘내 카메라 속 영상을 TV로 보려면 어떻게 하지?’란 궁금증이 떠올랐을 때 지식그래프는 이렇게 답한다. “당신의 카메라에 ○○ 드라이버를 설치하면 당신이 갖고 있는 TV와 무선인터넷으로 콘텐츠를 공유할 수 있다.” 그 과정에서 나올 법한 질문, 이를테면 ‘이 카메라 기종이 내 TV와 호환될까?’ ‘(호환된다면)케이블로 연결해야 할까, 블루투스로도 연결이 될까?’ ‘바로 호환되지 않으면 별도 드라이버를 설치해야 할까?’ ‘이 모든 정보를 찾아보려면 어떻게 해야 할까?’ 등은 지식그래프가 알아서 처리해버린다. 인간과 유사한 사고방식으로 데이터를 처리해 사용자가 원하는 답변을 직관적으로 내놓는 것이다.
지식그래프가 이렇게 기능하려면 TV와 디지털카메라뿐 아니라 기타 다양한 기기와 그들을 서로 연결시켜줄 수 있는 장치에 관한 데이터가 모두 통합돼야 한다. 그리고 이렇게 통합된 데이터는 최종 사용자 입장에서 그들의 수요와 발상에 맞춰 정리돼 있어야 한다. 이 작업을 수행하는 곳이 바로 소프트웨어센터다.
“연결성이 모든 것이다(Connectivity is everything)”
‘빅데이터’라는 정보 트렌드의 등장은 IT 분야의 기술적 환경에서 몇 가지 변화를 가져왔다. 첫째, 연결성(connectivity)이 더욱 확대됐다. 둘째, 데이터의 총량이 늘어나면서 관련 처리 기술도 발달했다. 셋째, 데이터를 선별해 인간의 사고방식대로 정렬하는 노하우가 축적됐다.
연결성은 ‘현대 과학기술의 꽃’으로 불리는 IT 업계에서 가장 핵심적인 키워드 중 하나다. 연결성의 중요성은 널리 통용되는 ‘연결성이 모든 것이다(Connectivity is everything)’란 슬로건에서도 확인된다. 사실 이 슬로건이 제일 처음 사용된 건 뇌신경과학 분야에서였다. 2005년 독일 막스플랑크연구소(Max Planck Institute, MPI) 뇌신경과학자들은 뇌신경 회로의 작동 원리를 MRI 사진으로 촬영하는 데 성공했다. 그 과정에서 ‘수많은 세포와 연결된 신경 매듭일수록 더 중요한 기능을 수행할 뿐 아니라 점점 더 많은 세포를 활성화시킨다’는 사실이 확인됐다. 즉 한 세포의 연결성이 좋을수록 더 큰 영향력과 더 다양한 기능을 갖게 되며, 그런 세포가 많아져야 전체적인 세포의 활동 수준이 높아진다는 것이다(☞관련 링크 바로 가기).
▲연결성의 위력을 보여주는 다이어그램. 많은 세포와 연결된 매듭은 자신에게 속한 각각의 세포들을 불활성(검은 점) 상태에서 활성(흰 점) 상태로 점차 바꿔나간다
최종 사용자가 제품을 보다 쉽고 효율적으로 쓸 수 있도록 하는 게 목표인 IT 생태계에서도 연결성은 더없이 중요하다. 인간과 환경이 다양한 기기를 통해 연결될수록 일상은 더욱 편리해진다. 이는 사물인터넷이나 커넥티드카의 현주소에서도 명확하게 드러난다. 지식그래프는 이 같은 연결성을 구현하기 위해 소비자가 어떤 제품을 어떻게 사용해야 할지 한눈에 파악할 수 있게 해준다. 이 역시 다양한 데이터 간 연결성 구축을 전제로 한다.
지식그래프 구축이 가능해진 배경엔 데이터 처리 기술의 발전과 한층 진화된 데이터 접근 환경이 자리 잡고 있다. 사실 지금보다 사용 가능한 정보량이 훨씬 적었던 과거에도 모든 데이터를 일일이 분석, 처리하는 일은 불가능에 가까웠다. 이 때문에 당시엔 데이터의 경향을 읽기 위한 방식으로 ‘샘플링(sampling)’이 관행처럼 사용됐다. 데이터를 한꺼번에 처리할 수 없으니 무작위로 표본을 추출했고, 그 결과 값이 대표성을 띤다는 가정 아래 경향성을 판단했던 것이다.
하지만 지금은 상황이 달라졌다. ‘맵리듀스(Map Reduce)’ ‘마이크 2.0(MIKE 2.0)’ 등 빅데이터 처리 기술이 계속 개발되고 있을 뿐 아니라 그 중 상당수가 (누구나 이용할 수 있는 상태로) 공개되는 추세다. 빅데이터 분야를 둘러싼, 이 같은 환경의 진화는 관련 기술이 인류 사회에 공헌하게 될 가능성을 높여준다는 점에서 고무적이다.
‘소프트웨어, 세상을 바꾸다’ 시리즈 내내 강조했듯 데이터의 양이 가히 폭발적으로 늘고 있는 현대 사회에선 데이터 선별 기준을 정하는 문제가 중요하게 제기된다. 기준 설정 방식은 검색엔진 개발 주체의 특성에 따라 달라지겠지만 중요한 건 ‘어떻게 하면 최종 사용자의 사고 방식을 최대한 똑같이 따라갈 수 있을까?’다. 사람들이 흔히 따르는 생각의 흐름에 맞춰 데이터가 전개되도록 설계하는 것, 이 부분이 지식그래프 개발의 핵심이다.
삼성전자 소프트웨어센터의 당면 과제는 이 같은 최신 기술 변화의 추세 속에서 ‘데이터의 연결성’ 개선을 통해 ‘삼성 제품의 연결성’을 높이는 것이다. 그 과정을 통해 삼성 제품의 품질을 높이는 한편, 최종 사용자의 제품 활용 수준도 한층 끌어올릴 수 있다는 논리다.
삼성 소프트웨어, 폐쇄적 ‘성당’ 벗어나 개방적 ‘시장’으로
이 같은 맥락에서 삼성전자가 연결성 강화 수단으로 택한 방식이 일명 ‘굿커넥션(good connection)’이란 사실은 의미심장하다. 삼성전자는 지난달 개발자 커뮤니티 기트허브닷컴(GitHub.com)에 동의어 처리 데이터 ‘세임애즈(sameAs)’ 데이터를 올렸다. 이후로도 관련 소프트웨어를 추가로 공개, 전 세계 기술자들과 집단지성을 구축해나가겠다는 계획을 세웠다.
물론 삼성전자가 독자적으로 이런 행보를 보이고 있는 건 아니다. 높은 장벽을 세우고 지적 재산을 꽁꽁 숨기는 게 이제까지 과학기술계에 만연한 관행이었다면 오늘날 전 세계 IT 업계의 화두는 일명 ‘기술 공진화(共進化)’로 요약된다. 자기가 가진 걸 조건 없이 내놓아 타인이 맘껏 이용하도록 하고, 그 결과물 역시 자신이 자유롭게 활용하는 형태의 ‘신(新)패러다임’이 점차 자리 잡고 있는 것이다.
사실 이런 흐름은 꽤 오래 전부터 ‘싹’을 보였었다. 미국 소프트웨어 개발자 에릭 S. 레이먼드(Eric S. Raymond)는 1999년 ‘성당과 시장(The Cathedral and the Bazaar)’이란 책을 통해 수많은 개발자와 이용자 가슴에 불을 지폈다. 이 책의 논리는 간명하다. 과학기술, 특히 IT 기술은 더 이상 성역(聖域)으로 간주돼 딱딱하고 어두운 건물에 보관돼선 안 되며, 페르시아 시장 ‘바자(Bazaar)’처럼 열린 하늘 아래 모든 이가 각자 가진 기술을 타인에게 보여주고 자신도 교환을 통해 필요한 기술을 구하는 형태로 개방돼야 한다는 것이다. 이와 관련, IT 업계에서 가장 성공적인 사례로 꼽히는 게 리눅스(Linux) 운영체계 개발 과정이다.
삼성전자 역시 소프트웨어센터가 주도해 케이샵 프로젝트를 추진하는 한편, 적극적 외부 공개에 나섰다. ‘성당’을 지양하고 ‘시장’을 지향하는 IT 업계의 변화 과정에 적극적으로 동참하려는 시도인 셈이다. 윤진수 상무는 “IT 기술의 공진화 단계에서 삼성전자가 기여할 부분이 있을 것”이라며 기대감을 내비쳤다.
“저희 혼자 만들 수 있는 것과 오픈 커뮤니티를 통해 만들 수 있는 것엔 양적으로, 또 질적으로 비교하기 어려울 만큼 큰 차이가 있습니다. 삼성전자는 한국을 대표하는 기업인 만큼 오픈 소스 환경을 비옥하게 조성하는 데 어느 정도 책임과 의무가 있다고 생각합니다. 현재 우리 센터에선 그런 부분까지 포함해 지식그래프 데이터와 소프트웨어 공개 등 일련의 작업을 전략적으로 추진하고 있습니다. 아직 일부이긴 하지만 막상 소프트웨어를 공개하고 보니 외부에서 우리 회사를 보는 시각이 상당 부분 개선되고 있다는 걸 느낍니다. 해외에서 관련 전문가를 확보하거나 연결하기도 쉬워졌고요. 삼성전자가 다루고 있는 영역이 워낙 넓은 만큼 앞으로 다양한 분야에 기여할 수 있을 거라고 생각합니다.”
▲윤진수 상무와 자리를 함께한 삼성전자 소프트웨어센터 직원들. 윤 상무는 “케이샵 프로젝트가 탄생하기까진 우리 실무진의 눈물겨운 노력이 있었다”며 “난 거기에 그저 약간의 힘을 실어줬을 뿐”이라며 모든 공을 직원들에게 돌렸다
이달 중 데이터 제작용 도구 선봬… 하반기엔 API 공개도
윤진수 상무는 “빅데이터를 기반으로 하는 패러다임은 모든 방면에 스며들 것”이라고 단언했다. “미래 세상에선 굳이 ‘빅데이터’란 이름을 쓰지 않더라도 당연히 데이터가 모든 판단의 기준이 될 겁니다. 생산과 마케팅, 서비스 할 것 없이 이제 막연한 감(感)이나 소수 전문가 의견보다 데이터 기반 결과물에 의지하게 되겠죠.”
그에 따르면 지식그래프와 관련, 삼성전자가 데이터 자체를 대외에 공개한 건 이번이 처음이다. 그는 “당분간은 우리가 어느 정도 키워놓은 소프트웨어가 오픈 커뮤니티에서 점점 더 커지는 걸 지켜볼 생각”이라며 “나중엔 우리가 거꾸로 그 결과물을 활용할 수도 있을 것”이라고 말했다.
삼성전자는 지난달 현재까지 확보한 데이터(sameAs)를 공개한 데 이어 이달 중 데이터를 만들기 위해 필요한 도구(sameAs extraction tool)를 공개할 예정이다. 올 하반기엔 삼성전자 지식기반 그래프를 검색하고 추천하는 API(Application Programming Interface)를 9월과 10월, 12월에 단계별로 선보일 계획이다.
“우리 센터는 데이터를 지식화(知識化)하는 과정에서 네 가지를 보다 잘 알고자 노력할 겁니다. 우리의 고객(user), 우리 회사의 상품(product), 우리의 시장(market), 그리고 (휴대전화·TV 등의 제품을 통해) 우리 회사가 제공 중인 서비스가 그것입니다. 이런 노력을 통해 각 사업부가 필요로 하는 정보를 적재적소에 제공할 계획입니다.”
☞[스페셜 리포트] 소프트웨어, 세상을 바꾸다_① 검색시장의 새 이정표, 지식그래프
☞[스페셜 리포트] 소프트웨어, 세상을 바꾸다_②‘개방형 지식그래프’ 구축 뛰어든 삼성전자
삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>