갤럭시 AI 글로벌 연구소 6화: 인도 벵갈루루 (SRI-B)

2024/06/28
본문듣기 AUDIO Play
공유 레이어 열기/닫기
주소가 복사되었습니다.

삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 6화에서는 갤럭시 AI 힌디어 개발 과정을 살펴보고, AI 혁신 방향과 AI가 지역사회에 미친 영향에 대해 알아본다.

 

세계에서 가장 많은 인구가 살고 있는 나라 중 하나인 인도는 사람 수 만큼이나 언어도 다양하다. 힌디어는 인도인의 약 40%가 사용하는 대표 언어로, 약 6억 명이 사용하는 걸로 알려져 있다. 이는 중국어, 스페인어, 영어에 이어 세계에서 네 번째에 해당한다.

특히 지역별로 다양한 방언을 쓰는데다 일상생활에서 영어를 많이 혼용하고, 존댓말과 단어의 성별 구분 등 언어 특성도 뚜렷하기 때문에 외국인들이 배우기 쉽지 않은 언어로 알려져 있다.

삼성전자의 인도 벵갈루루 연구소는 이런 특성을 가진 힌디어를 갤럭시 AI에 접목하기 위해 현지 대학들과의 네트워크를 적극 활용했다.

인도는 우수한 공과대학이 많은 것으로 유명하다. 그래서 삼성전자는 인도 대학들과 산학 협력을 강화하고 우수 인재를 양성하고 있는데, 벵갈루루 연구소는 갤럭시 AI 연구팀을 벨로르 공과대학(이하 VIT)과 함께 구성했다.

갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 단체 사진

 

복잡한 힌디어를 갤럭시 AI에 도입하기까지

힌디어 AI 모델을 개발하는 과정은 쉽지 않았다.

연구팀은 20개가 넘는 지역 방언, 성조, 구두점, 구어체를 모두 반영해야 했다. 또한 인도의 공용어가 힌디어와 영어인 만큼 힌디어 사용자들은 대화 중에 영어 단어를 섞어서 사용하는 것이 일반적인데, 이에 번역된 데이터와 음역된 데이터를 조합해 수차례에 걸쳐 AI 모델 학습을 수행해야 했다.

삼성전자 벵갈루루 연구소의 기리다르 자키 언어 AI 팀장은 “힌디어는 다른 언어에는 드문 권설음(혀를 입안에서 뒤로 말아서 내는 소리) 등 복잡한 음성 구조를 가지고 있다”면서 “AI 솔루션의 음성 합성을 위해 원어민 언어학자의 도움을 받아 데이터를 면밀히 검토했다’고 말했다.

그러면서 “힌디어의 모든 고유한 소리(음소)를 분석하고, 방언을 지원하기 위해 개별 데이터 세트를 만들었다”고 덧붙였다.

 

서로 윈-윈이 되는 산학 협업

삼성전자와 학계의 협력은 특히 인도의 문화적 뉘앙스를 반영한 AI 언어 모델을 개발하는 데 중요한 역할을 했다.

갤럭시 AI개발에서 데이터는 매우 중요한 요소인데, VIT는 대화 음성, 단어, 명령어 등 100만 줄에 달하는 오디오 데이터를 수집하는 데 도움을 주었다.

VIT에는 인도 벵갈루루 연구소와 함께 미래형 오디오 연구실이 구축되어 있다.

인도 최초의 첨단 흡음 시스템, 상반신 로봇 시뮬레이터, 스테레오 마이크, 스피커 등이 갖춰져 있어 언뜻 하이엔드 hi-fi 오디오를 개발하는 것처럼 보인다. 하지만 바로 이곳에서 삼성 갤럭시 AI 언어 모델 개발에 필요한 데이터와 인사이트를 제공하고 있다.

지난 2021년 ‘삼성 SEED랩[1]’을 시작으로 VIT뿐만 아니라 다수의 인도 주요대학들의 교직원, 학생, 인턴 등이 삼성 관련 프로젝트에 참여해 왔다.

VIT 학생 ‘야시카 일란체지얀(Yashika Ilanchezhiyan)’은 “삼성과 같은 일류 기업의 다양한 프로젝트에 참여할 수 있어 영광”이라며, “새로운 기술을 실무적으로 배우면서 현재와 미래의 제품에 실질적인 변화를 가져올 수 있다고 자부한다”고 말했다.

갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 연구원들

삼성전자 인도 벵갈루루 연구소의 기리다르 자키 언어 AI 팀장은 “우리의 협업은 동반 성장과 지역 사회의 이익을 모두 얻을 수 있는 윈윈 방식”이라며 “이러한 파트너십을 통해 지역 발전을 촉진하고 공익을 실현하며, 대학과의 협력을 통해 전문 지식과 맞춤형 데이터를 확보하면서도 대학에는 각 분야 전문가의 멘토링을 제공할 수 있다”고 말했다.

갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소

 

글로벌 개방형 협업으로 이룬 AI 혁신과 성과 확산

벵갈루루 연구소는 힌디어 도입 뿐 아니라 전 세계에 있는 갤럭시 AI 연구소와 협력해 영국, 인도, 호주 영어와 태국어, 베트남어, 인도네시아어 등의 AI 언어 모델을 개발하는 데도 큰 역할을 했다. 특히 타 지역 갤럭시 AI 연구팀이 인도에 직접 방문해 개발 자문을 구하기도 했다.

기리다르 팀장은 “모든 언어가 개발에 어려움이 있을 것이다. 우리 역시 힌디어 사용자들이 다른 언어를 사용하는 사람들과 하루 빨리 소통할 수 있도록 하는 것이 최종 목표였다”고 말했다.

갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 직원들이 벤치에 앉아있다.

이 프로젝트는 개방형 협업과 전문 지식 공유를 통해 혁신을 추구한다는 삼성전자의 철학을 잘 보여 준다.

벵갈루루 연구소는 혼자 개발하기 보다 개방적인 자세로 학계와 협력하면서 전 세계 삼성전자 연구소에 모범 사례를 남겼다.

기리다르 팀장은 “혼자가 아닌 함께 만들어가는 AI 혁신은 앞으로도 우리가 해야 할 일이며, 보다 많은 사람들이 갤럭시 AI를 만족해하며 이용할 수 있도록 계속해서 노력할 것”이라고 다짐했다.

갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 임직원들의 단체 사진

 


[1]Samsung Student Ecosystem for Engineered Data

기업뉴스 > 기술

기업뉴스

제품뉴스 > 모바일

제품뉴스

삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>

TOP