갤럭시 AI 글로벌 연구소 8화: 일본(SRJ)

2024/07/12
본문듣기 AUDIO Play
공유 레이어 열기/닫기
주소가 복사되었습니다.

삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 8화에서는 일본 연구소(SRJ)를 찾아가 다양한 상황에 대한 사례 연구 과정을 살펴본다.

 

일본 연구소(SRJ)는 가전과 디스플레이 등 하드웨어 중심의 R&D 센터로 출범했고, 인공지능(AI) 분야로도 연구 범위를 확대해 왔다. 요코하마에 위치한 이 연구소는 작년 말부터 음성 통화 내용을 자동으로 통역하는 갤럭시 AI 실시간 통역 기능을 위한 소프트웨어 개발 연구팀을 운영 중이다.

일본 연구소의 카유키 아카사코 AI리더는 “실시간 통역 기능은 올해 열리는 파리 올림픽 등 외국 여행을 할 때 매우 유용하다”며, “올림픽 경기 관람객도 사용한다는 가정 하에 올림픽에서 진행되는 스포츠 종목이나 경기장 위치 등이 학습된 음성 인식 프로그램을 구축하고 있다”고 전했다.

갤럭시 AI 글로벌 일본 연구소 임직원

 

음성, 나아가 맥락 인식의 중요성

갤럭시 AI 통역 기능을 사용해 보면 그 유용성을 즉각 체감할 수 있다. 그러나 해외여행 중에도 일본어를 기반으로 원활한 의사소통이 가능하도록 구현하는 것은 연구진에게 쉬운 과제가 아니었다.

일본어는 음가의 수가 제한되어 있기 때문에 동음이의어가 많다. 예를 들어, 발음이 비슷한 ‘젓가락'(箸, 하시)과 ‘교량'(橋, 하시)은 억양의 차이로 인해 비교적 쉽게 구별할 수는 있다. 하지만, ‘관광'(観光, 칸코우)과 ‘관행'(慣行, 칸코우) 또는 ‘공공'(公共, 코우쿄우)과 ‘호황'(好況, 코우쿄우) 같은 단어들은 문맥을 고려해 그 의미를 판단해야 한다.

箸, Hashi ,hashi chopsticks bridge/ 観光, Kankò 慣行, kankò sightseeing customs / 公共,Kōkyō 好況, kōkyò public prosperity

아카사코 리더는 “지명, 인명, 고유명사, 방언, 숫자 등의 사용으로 문맥이 모호한 경우엔 각 단어의 명확한 의미를 판단하기가 더 어려워지므로 음성 인식의 정확도를 높이기 위해서는 그만큼 방대한 데이터가 필요하다”며, “장소명과 활동 등의 새로운 조합이 다양하게 발생하는데, 갤럭시 AI를 사용할 때 맥락이 명확히 전달되도록 하는 것이 중요하다”고 말했다.

갤럭시 AI 글로벌 일본 연구소 임직원들의 모습

 

효율적인 데이터 수집을 향한 도전

어떠한 데이터가 필요한지 파악하는 것은 물론 실제로 데이터를 수집하는 것 역시 어려운 일이다.

과거에는 음성 인식 엔진을 학습시키기 위해 사람이 직접 녹음한 데이터를 사용했지만, 이제는 삼성전자의 대규모 언어모델(LLM)인 삼성 가우스를 사용해 시나리오와 관련된 단어나 구문이 포함된 문장을 취합한다. 연구진은 녹음 데이터, 텍스트 음성 변환(TTS)으로 생성된 데이터를 모두 활용해 데이터 수집 효율성을 크게 향상시켰다.

또한, 최종 단계에서 사람의 검사를 통해 정확한 데이터가 반영되도록 했다.

아카사코 리더는 “문제를 발견하고 해결해 음성 인식의 정확성을 높일 때마다 보람을 느낀다”며, “우리의 목표는 사람들이 전 세계 어디를 여행하든 서로 연결될 수 있도록 하는 것이고, 다양한 상황과 생활 방식이 적용된 갤럭시 AI를 통해 의사소통의 재미와 효율성을 더욱 높일 수 있다”고 덧붙였다.

기업뉴스 > 기술

기업뉴스

제품뉴스 > 모바일

제품뉴스

삼성전자 뉴스룸의 직접 제작한 기사와 이미지는 누구나 자유롭게 사용하실 수 있습니다.
그러나 삼성전자 뉴스룸이 제공받은 일부 기사와 이미지는 사용에 제한이 있습니다.
<삼성전자 뉴스룸 콘텐츠 이용에 대한 안내 바로가기>

TOP