기계와 대화하기
여러분이 가지고 있는 기계에 대한 이미지는 어떤가요? 혹시 어렵고 다가가기 어려운 존재인가요? 인문사회적 현상은 일반인들에게 가까이에 있으면서도 쉽게 다가가는 주제인데 반해, 공학적이고 기술적인 이슈들은 일반인들에게는 머나먼 이야기여서 그런 소리를 듣곤 했었죠.
하지만, 스마트폰을 필두로한 스마트 기기들의 대중화와 함께 공학적 이슈들이 점차적으로 일반인들 사이에서도 주요 대화 소재가 되었습니다.
오늘은 이런 사회적 현상을 반영하여, 비 전공자분들께서도 쉽고 재미있게 기술적 트렌드를 공유할 수 있는 시간을 가져보려고 합니다. 주제는 요즘 뜨거운 이슈인, 기계와의 대화입니다. 저도 이 분야의 전공자는 아니기에 가벼운 영상들과 함께 알아보도록 하겠습니다.
기계와의 대화라 함은 기계에게 자신의 뜻을 전달해서, 기계가 사용자의 의도를 제대로 수행하도록 하는 것에 목적이 있습니다. 소프트웨어 개발자들이 하는 일이, 바로 기계에게 프로그래밍 언어를 통해서 기계와 대화를 하여 일을 시키는 것이죠. 그리고 사용자들은 기계에 달린 입력장치(키보드, 마우스, 터치화면 등)를 이용하여 기계와 대화를 하여 원하는 바를 전달합니다.
음성을 통한 대화
최근 애플사의 siri라는 음성인식장치로 인해 음성인식에 대하여 많은 관심이 모아지고 있습니다. 사실 음성인식 기술은 아주 오래 전부터 많은 노력이 있었던 기술이며, 우리 생활 속 곳곳에 이미 활용되고 있는 기술입니다. 우리나라에서는 음성 인식이라 하면 제 나이 또래 이상의 분들에게 가장 먼저 떠오르는 이미지는 국민배우 안성기님의 “본부, 본부” 일 것입니다. 어떤 영상인지 모르시거나, 오랜만에 한번 보시고 싶으신 분은 추억의 영상을 한번 보실까요
사람들은 음성명령을 통해서 기계를 작동시키는 것보다, 손으로 명령하는 것이 더 정확하고 편리하게 자신의 의사를 전달 할 수 있었기 때문에, 더 좋은 커뮤니케이션 방법이었던 손을 선택했습니다. TV의 볼륨을 올리기 위해서 TV에게 “볼륨을 10까지 올려”라고 이야기하는 것보다, 손가락으로 리모컨을 조작하는 것이 더 편리하기 때문입니다. 이런 이유로 그간 수많은 기계에게 의사전달을 하는 수단으로 가장 큰 사랑을 받은 것은 손을 통한 대화방식이었습니다.
음성 인식 기술들이 오래전부터 개발되어 왔고, 실제로 다양한 기술들이 존재하고 있지만, 왜 실제로 사용이 되지 않고 있을까요? 그 이유는 대화, 커뮤니케이션의 본질에 있습니다. 사람들은 누구나 대화, 또는 의사전달을 가장 효율적이고 편리한 방법으로 하려고 합니다. 그러기 위해서 많은 암묵적 표현이나 생략 등이 일어나게 됩니다. 이해하기 쉽게 예를 들면, “저 남자아이가 너가 말하던 철수가 맞니?” 라는 문장을 “쟤가 걔니?” 라고 줄여서 이야기 하고, 식당에서 식사중에 “너가 들고 있는 소스를 나에게 전달해주겠니?”를 “나도!” 라고 이야기합니다.
또한, 실제로 의사전달에 있어서 음성에 의존하는 비율은 30% 미만으로, 음성보다 더 간편한 제스쳐로 의사를 전달하려고 합니다. 예를 들면, “나는 지금 너가 마음에 안드는 행동을 해서 기분이 나빠!”를 “기분 나빠!”도 아니고, 단순히 인상을 찌푸리는 것으로 표현을 하고, “이리와”라는 것은 손을 이용해 표현합니다. 이런 행동들은 더 편리하고 확실한 의사전달 방법을 선택하게 된 자연스런 결과입니다.
기존의 음성인식 기술들은 의도와 시도는 훌륭했지만, 불완전한 인식률과 불필요한 단계들 때문에, 훌륭한 의사전달 수단으로써는 합격점을 받기가 어려웠던 것입니다.
하지만 기술의 발전으로 인해, 근래에 손을 위협하는 의사전달 수단들이 등장하고 있습니다. 그 중 대표적인 것이 오랫동안 사람들의 러브콜을 받아온 음성인식입니다. 현재, 바다 2.0이 탑재 된 Wave3에서도 간단하면서 편리한 음성인식이 구현되어있습니다. 한번 보시죠.
보신 바와 같이 현재의 음성인식은 기존의 단순한 명령을 넘어서서, 조금 더 복잡한 수준의 명령을 보다 정확하게 수행할 수 있게 되었습니다. 이로 인해 사용자들은 음성 명령이 손 보다 편리한 입력수단으로 사용될 수 있다고 생각하게 되었습니다.
이런, 음성인식 기술은 휴대단말에 국한되지 않고, 다양한 분야에서 활용되기 위해 연구되고 있습니다. 그 중 포항공대(Click!)에서 연구 중인 데모영상을 보시면서, 멀지 않은 미래의 음성인식 기술에 대해서 상상해 보시죠.
대화하기 위한 다양한 시도, 기계와 바디 랭귀지로 대화하기
앞서 말씀 드린 바와 같이 의사를 전달할 때에 음성만이 아닌 다양한 수단을 통해서 의사를 전달합니다. 음성, 표정, 손짓, 음량 등등 매우 다양한 수단 중 가장 편리한 수단을 통해서 의사전달을 합니다. 이에 다양한 의사전달 방법을 이해하려는 연구들도 꾸준히 이어져오고 있는데요. 하나하나 살펴보겠습니다.
사람간의 대화 기술 중 가장 중요한 기술은 아마 상대방의 기분을 파악하고 이를 헤아리는 기술 일 것입니다. 그렇기에 오래 전부터 사람의 기분을 파악하기 위한 노력들이 이루어졌습니다. 여러분은 사람의 기분을 어떻게 읽으시나요? 아마 대화 상대방의 표정이나, 억양, 몸짓 등을 통해서 알 수 있을 겁니다.
휴대폰을 예를 들면, 화가 났을 때는 평소보다 더 과격하게 핸드폰을 두드리게 되죠. 기계들도 마찬가지로 이런 사용자의 작은 변화들을 파악하여 사용자의 기분을 파악하려고 합니다. 그 중 가장 기본적인 방법인, 표정을 읽는 방법에 대한 영상을 하나 보실까요? 유튜브의 Ingelligent Robot @ CIR(Click!)
채널에는 로봇의 인공 지능을 활용한 다양한 영상들이 올라와 있는데요. 그 중 흥미로운 영상들을 소개해 드립니다.
▶ 얼굴표정
좌측 상단에 보면, 데모 시연자의 표정에 따라, angry, happy 등 사용자의 기분을 파악하고 있다는 걸 알 수 있습니다.
▶ 로봇 얼굴
또한, 대화란 주고 받는 것이기에, 단순히 기계가 사람을 이해하는 것에 그치지 않고, 기계도 사람처럼 표현하기 위한 노력들도 이루어지고 있습니다. 기계도 사람처럼, 기분에 따라 표정이나 목소리 톤을 바꾸는 것이죠.
▶ 바디트랙킹
모션 인식을 통한 대화에 대한 연구도 꾸준히 이어져오고 있으며, 이는 이미 높은 수준으로 상용화되어 많은 가정에서 사용중이기도 합니다. 대표적인 예가 가정에서 많이 사용하고 있는 게임기인 wii나 kinect 등이 있겠습니다. 단지, 손가락을 살짝 움직이면, 알아서 내 뜻을 알고 움직이는 TV나 로봇이 가장 편리하겠죠.
▶ 포커스
마지막으로 살펴볼 기술은 다자간 대화입니다. 대화는 1:1 아닌 다자간에도 이루어질 수 있습니다. 예를 들면 TV 앞에 4명의 가족이 앉아서 TV와 대화를 한다면, TV는 매우 헷갈리게 될텐데요. 누가 누구인지, 누가 나한테 뭐라고 말을 거는지, 파악을 해야겠죠? 생각만해도 머리가 조금 아파오는 어려운 문제인데요. 이와 관련된 연구도 이루어지고 있답니다.
2012 CES 스마트 TV, 상용화된 인식 기술을 보다
그리고 이런 기술들은 실제로 우리가 만나볼 수 있는 TV에 상용화되고 있습니다. 2012 CES에서 많은 관심을 받았던 삼성 스마트 TV에는 음성 인식, 모션 인식, 얼굴 인식의 기능이 탑재되어 보다 다양한 의사 전달 수단이 마련되었답니다. 말로, 또는 손짓으로 TV의 채널 조정이나 볼륨 조정을 할 수 있으니, 이제 더 이상 리모컨을 찾아 헤메는 일이 없겠죠? 2012에 소개된 삼성의 최신 스마트 TV를 소개해드립니다.
삼성전자의 프리미엄 TV 모델 LED ES8000과 PDP E8000 시리즈에 탑재된 스마트 인터랙션 기술은 삼성전자가 세계 최초로 TV에 적용한 기술로 사람의 동작이나 음성 그리고 얼굴까지 인식해 직관적으로 TV를 컨트롤 할 수 있도록 한 기능입니다.
우와~ 엄청나게 많은 이야기를 해버린 거 같은데요. 도움이 되셨는지 모르겠습니다. 제가 소개해 드린 내용은 정말이지, 빙산의 일각에 불과합니다. 이외에도 수없이 많은 연구들이 이루어지며, 다양한 방법으로 기계와 의사소통하기 위해서 노력중입니다. 우리가 상상도 못했던, 사용하지 않던 혁신적인 방법을 통해서 의사소통하기 위해 노력 중이죠. 예를 들면, 뇌파를 통한 기기의 조작이 있습니다. 말도, 손짓도 없이 생각만 하면 알아서 해주는 거죠.
이런 노력들의 끝엔, 아마 공상영화에서나 보던 말하고 걸어다니는 로봇들이 있겠죠? 이런 노력들은 점차적으로 우리의 삶으로 파고 들 것입니다. 사실, 이미 파고 들어오기 시작했는데, 아직 눈치 채지 못하셨을 뿐이죠. 오늘 한번 가지고 계신 핸드폰과 대화를 시도해 보세요.(갤럭시S2를 사용하신다면 Voice talk라는 어플리케이션을 통해 명령을 해보세요. 생각 보다 깊숙히 이런 노력들이 주변에 침투해있단 사실에 놀라실지도 모르겠습니다.)
마지막으로, 음성 인식이 되는 삼성 핸드폰의 광고 영상하나 소개해 드리며 인사 드립니다.
※ 본 블로그에 게시한 글은 개인적인 것으로 삼성전자의 입장, 전략 또는 의견을 나타내지 않습니다.
제품뉴스 > 더 많은 제품
삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>