<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet title="XSL_formatting" type="text/xsl" href="https://news.samsung.com/kr/wp-content/plugins/btr_rss/btr_rss.xsl"?><rss version="2.0"
     xmlns:content="http://purl.org/rss/1.0/modules/content/"
     xmlns:wfw="http://wellformedweb.org/CommentAPI/"
     xmlns:dc="http://purl.org/dc/elements/1.1/"
     xmlns:atom="http://www.w3.org/2005/Atom"
     xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
     xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	 xmlns:media="http://search.yahoo.com/mrss/"
	>
	<channel>
		<title>AI 언어 &#8211; Samsung Newsroom Korea</title>
		<atom:link href="https://news.samsung.com/kr/tag/ai-%ec%96%b8%ec%96%b4/feed" rel="self" type="application/rss+xml" />
		<link>https://news.samsung.com/kr</link>
        <image>
            <url>https://img.global.news.samsung.com/image/newlogo/logo_samsung-newsroom.png</url>
            <title>AI 언어 &#8211; Samsung Newsroom Korea</title>
            <link>https://news.samsung.com/kr</link>
        </image>
        <currentYear>2024</currentYear>
        <cssFile>https://news.samsung.com/kr/wp-content/plugins/btr_rss/btr_rss_xsl.css</cssFile>
		<description>What's New on Samsung Newsroom</description>
		<lastBuildDate>Sun, 12 Apr 2026 10:00:00 +0000</lastBuildDate>
		<language>ko-KR</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
					<item>
				<title><![CDATA[“언어 장벽 없는 세상을 위해” 갤럭시 AI 글로벌 연구소의 언어 모델 개발 대장정]]></title>
				<link>https://news.samsung.com/kr/%ec%96%b8%ec%96%b4-%ec%9e%a5%eb%b2%bd-%ec%97%86%eb%8a%94-%ec%84%b8%ec%83%81%ec%9d%84-%ec%9c%84%ed%95%b4-%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac</link>
				<pubDate>Tue, 30 Jul 2024 14:00:54 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/Galaxy-AI-Global-RnD-Centers-thumb.png" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[삼성리서치]]></category>
                <guid isPermaLink="false">https://bit.ly/3yrfUO3</guid>
									<description><![CDATA[삼성전자는 프리미엄 모바일 AI 경험 선도를 목표로 전 세계 20여 개의 R&D 센터에서 AI 모델 개발에 매진하고 있다. ‘갤럭시 AI’의 온디바이스 실시간 통·번역 기능은 현재 16개 언어[1]를 지원하고 있으며, 올해 안에 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어 등 4개 언어를 더 추가해 지원 언어를 총 20개로 확대할 계획이다. 삼성전자 뉴스룸은 인도네시아부터 일본 연구소까지 기사 총 8편에 걸쳐 […]]]></description>
																<content:encoded><![CDATA[<p>삼성전자는 프리미엄 모바일<span> AI </span>경험 선도를 목표로 전 세계<span> 20</span>여 개의<span> R&D </span>센터에서 <span>AI </span>모델 개발에 매진하고 있다<span>. ‘</span>갤럭시<span> AI’</span>의 온디바이스 실시간 통·번역 기능은 현재<span> 16</span>개 언어<a href="#_ftn1" name="_ftnref1"><sup>[1]</sup></a>를 지원하고 있으며<span>, </span>올해 안에 스웨덴어<span>, </span>네덜란드어<span>, </span>루마니아어<span>, </span>튀르키예어 등 <span>4</span>개 언어를 더 추가해 지원 언어를 총<span> 20</span>개로 확대할 계획이다<span>.</span></p>
<p>삼성전자 뉴스룸은 인도네시아부터 일본 연구소까지 기사 총<span> 8</span>편에 걸쳐 <span>‘</span>갤럭시<span> AI’</span>의 다양한 언어 모델 개발 과정을 공개했다<span>. </span>전 세계 삼성 글로벌 연구소의 노력으로 탄생한 <span>‘</span>갤럭시<span> AI’</span>에는 언어 장벽 없이 자유로운 소통을 향한 삼성전자의 끊임없는 여정이 담겨있다<span>. </span>소제목의 각 국가명을 클릭하면 상세 기사로 이동할 수 있다<span>.</span></p>
<div id="attachment_458416" style="width: 1010px" class="wp-caption alignnone"><img aria-describedby="caption-attachment-458416" class="size-full wp-image-458416" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%97%85%EB%89%B4%EC%8A%A4-%EA%B8%B0%EC%88%A0-%EC%82%BC%EC%84%B1%EB%A6%AC%EC%84%9C%EC%B9%98-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C%EC%97%B0%EA%B5%AC%EC%86%8C-1.jpg" alt="갤럭시 AI의 통화 중 실시간 통역 기능은 크게 자동 음성인식(ASR), 인공신경망 기반 기계번역(NMT), 텍스트 음성 변환(TTS) 등 세가지 프로세스를 거친다" width="1000" height="667" /><p id="caption-attachment-458416" class="wp-caption-text">▲갤럭시 AI의 통화 중 실시간 통역 기능은 크게 자동 음성인식(ASR), 인공신경망 기반 기계번역(NMT), 텍스트 음성 변환(TTS) 등 세가지 프로세스를 거친다</p></div>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3UR3MgO" target="_blank" rel="noopener">[요르단]</a> 20개국 30여 종의 아랍어 방언을 이해하는 ‘갤럭시 AI’</strong></span></p>
<p>아랍어는<span> 20</span>여 개국<span> 4</span>억 명 이상이 사용하는 세계에서<span> 6</span>번째로 많이 사용되는 언어다<span>. </span>아랍어를 통번역 하려면 현대 표준 아랍어인 풋스하<span>(Fusha)</span>와 일상생활에서 사용하는 방언인 암미야<span>(Ammiyya)</span>를 모두 학습해야 한다<span>. </span>아랍어 방언은 무려<span> 30</span>여 종이 넘는다<span>.</span></p>
<p>삼성리서치 요르단 연구소<span>(SRJO)</span>는 아랍어 방언을 이해하고<span>, </span>그에 따른 응답을 표준 아랍어로 할 수 있는 언어 모델을 개발했다<span>. </span>이를 위해 서로 다른 방언의 음성 녹음 데이터를 수집하고<span>, </span>이를 직접 텍스트로 변환하는 과정을 거쳤다<span>. </span>삼성전자는 아랍어의 복잡성에 대한 깊은 이해를 바탕으로 신중하게 데이터를 선별했고<span>, </span>고급 모델링 기술을 적용해 아랍어를 갤럭시<span> AI</span>에 추가할 수 있었다<span>.</span></p>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3VddACQ" target="_blank" rel="noopener">[베트남]</a> 0.02초 간격으로 6성조의 베트남어를 분석하는 ‘갤럭시 AI’</strong></span></p>
<p>베트남어는 전 세계 약<span> 1</span>억 명이 사용하는 언어로<span>, </span>중국어나 태국어 등과 같이 음성의 높낮이로 뜻을 구별하는 성조 체계를 가지고 있다<span>. </span>예를 들어 베트남어 단어<span> ‘</span>마<span>(Ma)’</span>는 성조에 따라 엄마<span>(Má), </span>무덤<span>(M</span>ả<span>), </span>귀신<span>(Ma) </span>등 전혀 다른 의미가 된다<span>.</span></p>
<p>삼성리서치 베트남 연구소<span>(SRV)</span>는 이러한 성조의 미세한 차이를 인식할 수 있도록<span>, </span>음성 데이터를 매우 정교하게 다듬고 정제하는 과정을 진행했다<span>. </span>무엇보다 성조를 정확히 구분해 내기 위해 한 단어를<span> 0.02</span>초 전후의 짧은 프레임으로 잘라내고 이를 데이터베이스화했다<span>.</span></p>
<div id="attachment_458417" style="width: 1010px" class="wp-caption alignnone"><img aria-describedby="caption-attachment-458417" class="size-full wp-image-458417" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%97%85%EB%89%B4%EC%8A%A4-%EA%B8%B0%EC%88%A0-%EC%82%BC%EC%84%B1%EB%A6%AC%EC%84%9C%EC%B9%98-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C%EC%97%B0%EA%B5%AC%EC%86%8C-%EB%B2%A0%ED%8A%B8%EB%82%A8.jpg" alt="각 언어의 고유 특성과 문화적 배경을 잘 파악하고 반영해야 좋은 AI 서비스를 제공할 수 있다. 위는 베트남어 사례" width="1000" height="571" /><p id="caption-attachment-458417" class="wp-caption-text">▲각 언어의 고유 특성과 문화적 배경을 잘 파악하고 반영해야 좋은 AI 서비스를 제공할 수 있다. 위는 베트남어 사례</p></div>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3yUYc5r" target="_blank" rel="noopener">[브라질]</a> 중남미 22개국의 다양한 스페인어를 이해하는 ‘갤럭시 AI’</strong></span></p>
<p>중남미<span> 22</span>개국의 공식 언어는 스페인어다<span>. </span>하지만 같은 스페인어라도 동일한 대상을 지칭하는 단어가 국가와 지역에 따라 크게 달라지기도 한다<span>. </span>예를 들어 수영장을 이를 때 멕시코에서는<span> ‘</span>알베르카<span>(alberca)’</span>라 하고<span>, </span>아르헨티나<span>, </span>파라과이<span>, </span>우루과이에서는<span> ‘</span>필레타<span>(pileta)’,  </span>콜롬비아<span>, </span>볼리비아<span>, </span>베네수엘라에서는<span> ‘</span>피시나<span>(piscina)’</span>라고 표현한다<span>.</span></p>
<p>이러한 중남미 지역의 언어 모델 개발을 담당한 삼성리서치 브라질 연구소<span>(SRBR)</span>는<span> ‘</span>갤럭시<span> AI’</span>가 중남미 각 국가의 스페인어 차이를 이해할 수 있도록 현지 연구기관과 협업하여 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집하고 관리하며 꾸준히 개선했다<span>.</span></p>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3Wv9OpH" target="_blank" rel="noopener">[인도네시아]</a> 인구 4위 인도네시아의 문장을 통째로 이해하는 ‘갤럭시 AI’</strong></span></p>
<p>세계에서 네 번째로 인구가 많은 인도네시아에서는 약 <span>2</span>억<span> 8</span>천만 명이 인도네시아어를 사용한다<span>. </span>인도네시아어는 관사나 복수형이 없고<span>, </span>동사도 시제 변화가 없어 상대적으로 배우기 쉬운 언어로 알려져 있다<span>. </span>그러나 동시에<span>, </span>문장의 맥락을 제대로 이해하지 않으면 내용을 이해할 수 없어 통<span>·</span>번역이 쉽지 않은 언어이다<span>. </span>특히<span>, ‘</span>인공신경망번역<span>(Neural Machine Translation, NMT)’ </span>모델에서 어려움이 많았는데<span>, </span>삼성리서치 인도네시아 연구소<span>(SRIN)</span>는 체계적이고 다양한 문장 단위의 학습을 통해 <span>AI</span>가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다<span>.</span></p>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3RbuTly" target="_blank" rel="noopener">[중국]</a> 로컬 기업과 협업하여, 복잡한 언어적 특성을 효율적으로 반영한 ‘갤럭시 AI’</strong></span></p>
<p>중국어는 전 세계에서 가장 많은 사람들이 사용하는 언어다<span>. </span>사용자가 약<span> 14</span>억 명이나 되는 만큼 다양한 방언이 존재하며<span>, </span>사용 지역에 따라 속어<span>, </span>문구<span>, </span>어휘<span>, </span>심지어 성조가 달라지기도 한다<span>. </span>특히 홍콩과 광둥성 지역에서 널리 쓰이는 광둥어는 표준 중국어인 <span>‘</span>보통화<span>‘</span>와는 상당한 차이가 있어 별도 언어 모델이 필요하다<span>.</span></p>
<p>삼성리서치 중국연구소<span>(SRC)</span>는 이러한 중국어에 특화된 갤럭시<span> AI </span>솔루션을 만들기 위해 현지 기업인 바이두와 메이투의 거대언어모델<span>(LLM)</span>을 활용하였다<span>. </span>중국연구소는 광둥어의 문어체와 구어체 간의 차이<span>, </span>성조<span>, </span>영어가 섞인 사용법 등과 같은 복잡한 언어적 특성을 반영해<span> AI </span>솔루션을 개발했고<span>, </span>이로 인해 삼성의 갤럭시<span> AI</span>는 중국과 홍콩 시장에서 큰 반향을 일으키며 성공적으로 자리 잡을 수 있었다<span>.</span></p>
<div id="attachment_458418" style="width: 1010px" class="wp-caption alignnone"><img aria-describedby="caption-attachment-458418" class="size-full wp-image-458418" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%97%85%EB%89%B4%EC%8A%A4-%EA%B8%B0%EC%88%A0-%EC%82%BC%EC%84%B1%EB%A6%AC%EC%84%9C%EC%B9%98-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C%EC%97%B0%EA%B5%AC%EC%86%8C-2.jpg" alt="AI 모델을 학습시키기 위해서는 좋은 데이터를 많이 확보하고, 검증하고, 정리하는 과정이 선행되어야 한다" width="1000" height="563" /><p id="caption-attachment-458418" class="wp-caption-text">▲AI 모델을 학습시키기 위해서는 좋은 데이터를 많이 확보하고, 검증하고, 정리하는 과정이 선행되어야 한다</p></div>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3zlltxX" target="_blank" rel="noopener">[인도]</a> 대학과의 협업으로 20개 방언 데이터 확보해 개발한 ‘갤럭시 AI’</strong></span></p>
<p>인도는 인구가 많고 언어도 다양한 나라로<span>, </span>그중 힌디어는 약<span> 6</span>억 명이 사용하는 대표적인 언어이다<span>. </span>힌디어는 다양한 지역 방언과 영어 혼용<span>, </span>존댓말 및 성별 구분 등으로 외국인이 배우기 어려운 언어로 알려져 있다<span>.</span></p>
<p>이런 힌디어의 복잡한 특성을 반영해 갤럭시 AI에 적용하고자, 삼성전자의 인도 벵갈루루 연구소는 현지 대학들과 손을 잡았다. 벵갈루루 연구소와 벨로르 공과대학(VIT)이 공동으로 연구팀을 구성하여, 20개가 넘는 힌디어의 지역 방언 관련 데이터를 모두 반영하고, 영어 혼용 데이터 역시 학습시킨 AI 모델을 만들었다.</p>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/45RLaCr" target="_blank" rel="noopener">[폴란드]</a> 유럽의 중심부에서 통번역 서비스를 전문화하는 ‘갤럭시 AI’</strong></span></p>
<p>삼성전자 폴란드 연구소<span>(SRPOL)</span>는 유럽의<span> 4</span>개 시간대를 넘나들며<span> 30</span>개 이상의 언어 서비스를 개발하고 있다<span>. </span>이곳은 갤럭시에 빅스비가 탑재된 이후로 다양한 국가와 언어 프로젝트를 수행해 온 경험이 있고<span>, </span>지금도 원격 협업을 통해 언어 검증과<span> AI </span>개발을 확대하고 있다<span>.</span></p>
<p>폴란드 연구소는<span> AI </span>언어 모델 개발에서 언어와 문화적 차이를 극복하는 데 중점을 뒀다<span>. </span>각각의 언어와 문화마다 상황에 대한 인식이 다르므로 번역이 어려울 때가 있지만<span>, </span>연구소는 부서 간 효율적인 커뮤니케이션과 의사결정 과정을 간소화함으로써 이러한 문제들을 해결하고 있다<span>. </span>다양한 팀 간의 상호 이해와 지원을 통해 갤럭시<span> AI</span>는 문화를 통합하고 언어 장벽을 허물어가는 데 중요한 역할을 수행하고 있다<span>.</span></p>
<p> </p>
<p><span style="color: #000080"><strong><a href="https://bit.ly/3VYr9W1" target="_blank" rel="noopener">[일본]</a> 생성형 AI로 학습 데이터 보강해 정교함을 더한 ‘갤럭시 AI’</strong></span></p>
<p>일본어는 음가의 수가 제한되어 있어 동음이의어가 많아<span>, </span>통번역을 진행할 때는 문맥을 고려해 의미를 판단해야 하는 어려움이 있다<span>. </span>그만큼 정확한 의미 판단이 어렵기 때문에 음성 인식의 정확도를 높이려면 방대한 데이터가 필요하다<span>.</span></p>
<p>일본 연구소<span>(SRJ)</span>는 삼성전자의 대규모 언어 모델인 삼성 가우스를 사용해 데이터를 확보하고<span>, </span>녹음 데이터와 텍스트 음성 변환<span>(TTS)</span>으로 생성된 데이터를 모두 활용해 효율성과 정확도를 높였다<span>. </span>마지막 단계에서는 사람이 직접 검사하여 정확한 데이터가 반영될 수 있도록 했다<span>.</span></p>
<p> </p>
<p>최근 모바일 <span>AI </span>전문가들이 모인 <span><a href="https://bit.ly/45ZI92G" target="_blank" rel="noopener">토론 행사</a></span>에서 삼성전자<span> MX</span>사업부 개발실장 최원준 부사장은<span> “</span>우리는 사람을 위한<span>, </span>협력을 통한<span>, </span>안전을 향한<span> AI</span>를 추구한다<span>”</span>라며 “<span>2024</span>년에는<span> 2</span>억 대의 모바일 기기에 갤럭시<span> AI </span>경험을 제공할 예정<span>”</span>이라고 밝혔다<span>.</span></p>
<p>이처럼 사내외의 글로벌 네트워크를 망라한 협업과 언어∙문화의 특성을 반영한 개발 노력 덕분에 갤럭시<span> AI</span>의 실시간 통<span>·</span>번역 기능은 더욱 정교하고 유용하게 발전하고 있다<span>. </span>삼성전자의 혁신 노력이 앞으로도 더 많은 언어와 문화를 연결하는 데 기여할 것이다<span>.</span></p>
<p> </p>
<hr />
<div class="footnotes">
<p class="footnotes"><a href="#_ftnref1" name="_ftn1">[1]</a>현재 지원 언어: 한국어, 중국어(간체), 영어, 프랑스어, 독일어, 힌디어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 스페인어, 태국어, 베트남어, 아랍어, 인도네시아어, 러시아어</p>
</div>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 8화: 일본(SRJ)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-8%ed%99%94-%ec%9d%bc%eb%b3%b8srj</link>
				<pubDate>Fri, 12 Jul 2024 17:00:53 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/Learning-Curve_Japan_TH.jpg" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[일본 연구소]]></category>
                <guid isPermaLink="false">https://bit.ly/3VYr9W1</guid>
									<description><![CDATA[삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 8화에서는 일본 연구소(SRJ)를 찾아가 다양한 상황에 대한 사례 연구 과정을 살펴본다.   일본 연구소(SRJ)는 가전과 디스플레이 등 하드웨어 중심의 R&D 센터로 출범했고, 인공지능(AI) 분야로도 연구 범위를 확대해 왔다. 요코하마에 위치한 이 연구소는 작년 말부터 음성 […]]]></description>
																<content:encoded><![CDATA[<p style="text-align: center"><em><strong>삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 8화에서는 일본 연구소(SRJ)를 찾아가 다양한 상황에 대한 사례 연구 과정을 살펴본다.</strong></em></p>
<p> </p>
<p>일본 연구소(SRJ)는 가전과 디스플레이 등 하드웨어 중심의 R&D 센터로 출범했고, 인공지능(AI) 분야로도 연구 범위를 확대해 왔다. 요코하마에 위치한 이 연구소는 작년 말부터 음성 통화 내용을 자동으로 통역하는 갤럭시 AI 실시간 통역 기능을 위한 소프트웨어 개발 연구팀을 운영 중이다.</p>
<p>일본 연구소의 카유키 아카사코 AI리더는 “실시간 통역 기능은 올해 열리는 파리 올림픽 등 외국 여행을 할 때 매우 유용하다”며, “올림픽 경기 관람객도 사용한다는 가정 하에 올림픽에서 진행되는 스포츠 종목이나 경기장 위치 등이 학습된 음성 인식 프로그램을 구축하고 있다”고 전했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457739 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%88%A0-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%BC%EB%B3%B8-%EC%9E%84%EC%A7%81%EC%9B%90-1.jpg" alt="갤럭시 AI 글로벌 일본 연구소 임직원" width="1000" height="667" /></p>
<p> </p>
<p><strong>음성, 나아가 맥락 인식의 중요성</strong></p>
<p>갤럭시 AI 통역 기능을 사용해 보면 그 유용성을 즉각 체감할 수 있다. 그러나 해외여행 중에도 일본어를 기반으로 원활한 의사소통이 가능하도록 구현하는 것은 연구진에게 쉬운 과제가 아니었다.</p>
<p>일본어는 음가의 수가 제한되어 있기 때문에 동음이의어가 많다. 예를 들어, 발음이 비슷한 ‘젓가락'(箸, 하시)과 ‘교량'(橋, 하시)은 억양의 차이로 인해 비교적 쉽게 구별할 수는 있다. 하지만, ‘관광'(観光, 칸코우)과 ‘관행'(慣行, 칸코우) 또는 ‘공공'(公共, 코우쿄우)과 ‘호황'(好況, 코우쿄우) 같은 단어들은 문맥을 고려해 그 의미를 판단해야 한다.</p>
<p><img loading="lazy" class="alignnone wp-image-457924 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%88%A0-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%BC%EB%B3%B8-%EB%AC%B8%EB%A7%A5-%EC%9D%B8%EC%8B%9D-e1721105323880.jpg" alt="箸, Hashi ,hashi chopsticks bridge/ 観光, Kankò 慣行, kankò sightseeing customs / 公共,Kōkyō 好況, kōkyò public prosperity" width="1000" height="667" /></p>
<p>아카사코 리더는 “지명, 인명, 고유명사, 방언, 숫자 등의 사용으로 문맥이 모호한 경우엔 각 단어의 명확한 의미를 판단하기가 더 어려워지므로 음성 인식의 정확도를 높이기 위해서는 그만큼 방대한 데이터가 필요하다”며, “장소명과 활동 등의 새로운 조합이 다양하게 발생하는데, 갤럭시 AI를 사용할 때 맥락이 명확히 전달되도록 하는 것이 중요하다”고 말했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457740 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EA%B8%B0%EC%88%A0-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9CAI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%BC%EB%B3%B8-%EC%9E%84%EC%A7%81%EC%9B%90-2.jpg" alt="갤럭시 AI 글로벌 일본 연구소 임직원들의 모습" width="1000" height="667" /></p>
<p> </p>
<p><strong>효율적인 데이터 수집을 향한 도전</strong></p>
<p>어떠한 데이터가 필요한지 파악하는 것은 물론 실제로 데이터를 수집하는 것 역시 어려운 일이다.</p>
<p>과거에는 음성 인식 엔진을 학습시키기 위해 사람이 직접 녹음한 데이터를 사용했지만, 이제는 삼성전자의 대규모 언어모델(LLM)인 삼성 가우스를 사용해 시나리오와 관련된 단어나 구문이 포함된 문장을 취합한다. 연구진은 녹음 데이터, 텍스트 음성 변환(TTS)으로 생성된 데이터를 모두 활용해 데이터 수집 효율성을 크게 향상시켰다.</p>
<p>또한, 최종 단계에서 사람의 검사를 통해 정확한 데이터가 반영되도록 했다.</p>
<p>아카사코 리더는 “문제를 발견하고 해결해 음성 인식의 정확성을 높일 때마다 보람을 느낀다”며, “우리의 목표는 사람들이 전 세계 어디를 여행하든 서로 연결될 수 있도록 하는 것이고, 다양한 상황과 생활 방식이 적용된 갤럭시 AI를 통해 의사소통의 재미와 효율성을 더욱 높일 수 있다”고 덧붙였다.</p>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 7화: 폴란드(SRPOL)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-7%ed%99%94-%ed%8f%b4%eb%9e%80%eb%93%9csrpol</link>
				<pubDate>Thu, 04 Jul 2024 17:00:08 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/SRPOL_TH.jpg" medium="image" />
				<dc:creator><![CDATA[jinsoo2.park]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[폴란드 연구소]]></category>
                <guid isPermaLink="false">https://bit.ly/45RLaCr</guid>
									<description><![CDATA[삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 7화에서는 폴란드 연구소(이하 SRPOL)를 찾아가 문화와 국경을 뛰어넘은 협업 과정에 대해 알아본다.   ‘삼성전자 폴란드 연구소(SRPOL)의 하루는 96시간’이라는 말이 있다. 유럽에 속한 나라들은 4개의 시간대를 사용하고 있는데 이 곳 연구소에서 유럽을 넘어 글로벌 시장을 아우르며 […]]]></description>
																<content:encoded><![CDATA[<p style="text-align: center"><em><strong>삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 7화에서는 폴란드 연구소(이하 SRPOL)를 찾아가 문화와 국경을 뛰어넘은 협업 과정에 대해 알아본다.</strong></em></p>
<p> </p>
<p>‘삼성전자 폴란드 연구소(SRPOL)의 하루는 96시간’이라는 말이 있다. 유럽에 속한 나라들은 4개의 시간대를 사용하고 있는데 이 곳 연구소에서 유럽을 넘어 글로벌 시장을 아우르며 30개가 넘는 언어로 서비스를 개발했기에 이런 말이 나온 게 아닐지. 이러한 전문성을 바탕으로 삼성의 글로벌 기술에 문화적 관점을 매끄럽게 녹여내는 데 탁월함을 보이고 있다.</p>
<p>폴란드 연구소는 독일, 프랑스, 이탈리아, 스페인, 영국 등 유럽 전역에 지사를 두고 있다. 과거에는 현지 지사에서 모바일 제품 품질과 상호 운용성을 보장하는 업무를 주로 했지만, 갤럭시에 빅스비가 탑재되면서 업무의 범위가 확장되었다. 언어 검증의 필요성이 대두되면서 갤럭시 AI 개발을 위한 대륙 간 새로운 협업이 시작된 것이다.</p>
<p>폴란드 연구소의 코넬 얀코프스키 음성 디코딩 리더는 “수년간 여러 국가와 원격으로 협업하면서 다양하고 효과적인 커뮤니케이션 채널을 구축해왔다”며 “갤럭시 AI가 전 세계 사람들의 언어 장벽을 낮추는 데 일조할 것”이라고 말했다.</p>
<p>피오트르 안드루스키에비츠 자연어처리 리더는 “대륙을 넘나드는 협업을 위해 끊임없이 데이터를 수집하고 연구해야 하지만, 다행히 모든 팀원이 이 과정을 즐기고 있다”며, “우리 연구팀은 수많은 언어를 다뤄왔기 때문에 언어에 구애받지 않는 보편적인 기술을 개발했다”고 밝혔다. 또한 “새로운 언어 개발을 지원한다는 건 또 다른 언어를 배울 수 있는 기회를 뜻하기에 무척 기대가 된다”고 덧붙였다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-457270" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%ED%8F%B4%EB%9E%80%EB%93%9C-SRPOL-%EB%8B%A8%EC%B2%B4%EC%82%AC%EC%A7%84-1.jpg" alt="삼성전자 폴란드 연구소 단체사진" width="1000" height="625" /></p>
<p> </p>
<p><strong>유럽 AI 언어 개발의 중심축, 폴란드 연구소</strong></p>
<p>언어는 살아 숨쉬고 있으며 지역 문화를 기반으로 변화하기에, AI 언어 모델을 개발하는 데는 기술적인 문제 외에도 또 다른 어려움이 따랐다.</p>
<p>아담 로스 인공지능 리더는 “각각의 언어와 그 언어가 속한 문화마다 특정 상황에 대한 인식이 제각각”이라고 말했다. 실제로 이러한 특성 때문에 타 언어로 통역이 불가능하거나 완전히 일치하는 대응 표현이 없는 경우가 종종 발생한다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-457271" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%ED%8F%B4%EB%9E%80%EB%93%9C-SRPOL-%EC%9D%B8%ED%8F%AC%EA%B7%B8%EB%9E%98%ED%94%BD.jpg" alt="삼성전자 폴란드 연구소 idiom 인포그래픽" width="1000" height="563" /></p>
<p>연구진은 이러한 문제들이 오히려 폴란드 연구소가 유럽의 AI 언어 개발에서 중추적인 역할을 할 수 있는 기회라고 판단했고, 이를 위해 여러 부서 간의 커뮤니케이션 효율성을 높이면서도 특히 의사 결정 단계를 줄이는 데 주력했다.</p>
<p>그렇다고 AI 언어 모델 개발의 어려움을 모두 극복한 것은 아니었다.</p>
<p>아담 로스 인공지능 리더는 “우리 연구진은 새로운 단어나 주제를 다룰 때 단 하나의 예시만으로 단편적으로 판단하지 않는다. 일부 유럽 언어는 다른 언어보다 AI 개발이 더 어렵다”라며, “스페인에 가본 적이 있다면, 사람들이 대개 말을 굉장히 빨리 하는데, 이런 경우엔AI 언어 모델 훈련을 타 언어보다 더 많이 해야 한다”고 밝혔다.</p>
<p>원어민은 이러한 언어와 문화의 미묘한 차이를 단번에 알아차릴 수 있기 때문에 폴란드 연구진은 이러한 점을 매우 중요하게 다뤘다.</p>
<p>아가타 마리아 로지카 음성지능연구 리더는 “타 문화권에서는 유럽 문화권이 서로 비슷해 보이겠지만, 미묘한 차이만 있어도 원어민들은 부자연스럽다고 느끼게 된다. 예를 들어 어떤 나라는 가격을 표시할 때 유로 기호를 선호하지만, 어떤 나라는 ‘euros’로 철자를 쓰는 것을 선호한다”라며, “인터페이스에 구현된 수많은 사용자 정보 중 극히 일부의 예”라고 덧붙였다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-457272" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/07/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%ED%8F%B4%EB%9E%80%EB%93%9C-SRPOL-%EB%8B%A8%EC%B2%B4%EC%82%AC%EC%A7%84-2.jpg" alt="삼성전자 폴란드 연구소 단체사진" width="1000" height="462" /></p>
<p> </p>
<p><strong>다양한 언어와 문화를 잇는 기술</strong></p>
<p>다양한 언어와 문화를 잇는다는 건 어려운 작업이지만, 문화적 정보를 이해하고 개발하는 것은 어려운 작업이다. 그러나 갤럭시 사용자들의 언어 장벽을 낮춰 깊은 관계를 형성하도록 돕기 위해서는 꼭 해야만 하는 일이기도 하다.</p>
<p>마르신 무루갈라 모바일품질보증 리더는 “다양한 팀 간의 커뮤니케이션은 상호 이해와 지지를 기반으로 한다”며, “다양한 문화적 배경을 가진 환경에서 서로 다른 관점을 갖고 있더라도 폴란드 연구진 모두가 하나의 목표를 향해 나아가고 있다”고 말했다. 또한 “갤럭시 AI가 문화를 통합할 수 있다고 믿는다”고 덧붙였다.</p>
<div id="__endic_crx__">
<div class="css-diqpy0"></div>
</div>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 6화: 인도 벵갈루루 (SRI-B)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-6%ed%99%94-%ec%9d%b8%eb%8f%84-%eb%b2%b5%ea%b0%88%eb%a3%a8%eb%a3%a8-sri-b</link>
				<pubDate>Fri, 28 Jun 2024 18:00:32 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/India_TH-1.jpg" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[갤럭시 AI 연구팀]]></category>
		<category><![CDATA[삼성리서치]]></category>
		<category><![CDATA[삼성전자 벵갈루루 연구소]]></category>
                <guid isPermaLink="false">https://bit.ly/3zlltxX</guid>
									<description><![CDATA[삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 6화에서는 갤럭시 AI 힌디어 개발 과정을 살펴보고, AI 혁신 방향과 AI가 지역사회에 미친 영향에 대해 알아본다.   세계에서 가장 많은 인구가 살고 있는 나라 중 하나인 인도는 사람 수 만큼이나 언어도 다양하다. 힌디어는 인도인의 약 […]]]></description>
																<content:encoded><![CDATA[<p style="text-align: center"><em><strong>삼성전자 갤럭시 AI의 온디바이스 실시간 통역 기능은 전 세계 삼성 글로벌 연구소의 노력으로 탄생해 현재 지원 언어가 16개까지 확대됐다. 이번 6화에서는 갤럭시 AI 힌디어 개발 과정을 살펴보고, AI 혁신 방향과 AI가 지역사회에 미친 영향에 대해 알아본다.</strong></em></p>
<p> </p>
<p>세계에서 가장 많은 인구가 살고 있는 나라 중 하나인 인도는 사람 수 만큼이나 언어도 다양하다. 힌디어는 인도인의 약 40%가 사용하는 대표 언어로, 약 6억 명이 사용하는 걸로 알려져 있다. 이는 중국어, 스페인어, 영어에 이어 세계에서 네 번째에 해당한다.</p>
<p>특히 지역별로 다양한 방언을 쓰는데다 일상생활에서 영어를 많이 혼용하고, 존댓말과 단어의 성별 구분 등 언어 특성도 뚜렷하기 때문에 외국인들이 배우기 쉽지 않은 언어로 알려져 있다.</p>
<p>삼성전자의 인도 벵갈루루 연구소는 이런 특성을 가진 힌디어를 갤럭시 AI에 접목하기 위해 현지 대학들과의 네트워크를 적극 활용했다.</p>
<p>인도는 우수한 공과대학이 많은 것으로 유명하다. 그래서 삼성전자는 인도 대학들과 산학 협력을 강화하고 우수 인재를 양성하고 있는데, 벵갈루루 연구소는 갤럭시 AI 연구팀을 벨로르 공과대학(이하 VIT)과 함께 구성했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457159 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B8%B0%EC%88%A0-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%B8%EB%8F%84-%EB%B2%B5%EA%B0%88%EB%A3%A8%EB%A3%A8-%EC%97%B0%EA%B5%AC%ED%8C%80-1.jpg" alt="갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 단체 사진" width="1000" height="667" /></p>
<p> </p>
<p><strong>복잡한 힌디어를 갤럭시 AI에 도입하기까지</strong></p>
<p>힌디어 AI 모델을 개발하는 과정은 쉽지 않았다.</p>
<p>연구팀은 20개가 넘는 지역 방언, 성조, 구두점, 구어체를 모두 반영해야 했다. 또한 인도의 공용어가 힌디어와 영어인 만큼 힌디어 사용자들은 대화 중에 영어 단어를 섞어서 사용하는 것이 일반적인데, 이에 번역된 데이터와 음역된 데이터를 조합해 수차례에 걸쳐 AI 모델 학습을 수행해야 했다.</p>
<p>삼성전자 벵갈루루 연구소의 기리다르 자키 언어 AI 팀장은 “힌디어는 다른 언어에는 드문 권설음(혀를 입안에서 뒤로 말아서 내는 소리) 등 복잡한 음성 구조를 가지고 있다”면서 “AI 솔루션의 음성 합성을 위해 원어민 언어학자의 도움을 받아 데이터를 면밀히 검토했다’고 말했다.</p>
<p>그러면서 “힌디어의 모든 고유한 소리(음소)를 분석하고, 방언을 지원하기 위해 개별 데이터 세트를 만들었다”고 덧붙였다.</p>
<p> </p>
<p><strong>서로 윈-윈이 되는 산학 협업</strong></p>
<p>삼성전자와 학계의 협력은 특히 인도의 문화적 뉘앙스를 반영한 AI 언어 모델을 개발하는 데 중요한 역할을 했다.</p>
<p>갤럭시 AI개발에서 데이터는 매우 중요한 요소인데, VIT는 대화 음성, 단어, 명령어 등 100만 줄에 달하는 오디오 데이터를 수집하는 데 도움을 주었다.</p>
<p>VIT에는 인도 벵갈루루 연구소와 함께 미래형 오디오 연구실이 구축되어 있다.</p>
<p>인도 최초의 첨단 흡음 시스템, 상반신 로봇 시뮬레이터, 스테레오 마이크, 스피커 등이 갖춰져 있어 언뜻 하이엔드 hi-fi 오디오를 개발하는 것처럼 보인다. 하지만 바로 이곳에서 삼성 갤럭시 AI 언어 모델 개발에 필요한 데이터와 인사이트를 제공하고 있다.</p>
<p>지난 2021년 ‘삼성 SEED랩<a href="#_ftn1" name="_ftnref1"><sup>[1]</sup></a>’을 시작으로 VIT뿐만 아니라 다수의 인도 주요대학들의 교직원, 학생, 인턴 등이 삼성 관련 프로젝트에 참여해 왔다.</p>
<p>VIT 학생 ‘야시카 일란체지얀(Yashika Ilanchezhiyan)’은 “삼성과 같은 일류 기업의 다양한 프로젝트에 참여할 수 있어 영광”이라며, “새로운 기술을 실무적으로 배우면서 현재와 미래의 제품에 실질적인 변화를 가져올 수 있다고 자부한다”고 말했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457160 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B8%B0%EC%88%A0-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%B8%EB%8F%84-%EB%B2%B5%EA%B0%88%EB%A3%A8%EB%A3%A8-%EC%97%B0%EA%B5%AC%ED%8C%80-2-1.jpg" alt="갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 연구원들" width="1000" height="667" /></p>
<p>삼성전자 인도 벵갈루루 연구소의 기리다르 자키 언어 AI 팀장은 “우리의 협업은 동반 성장과 지역 사회의 이익을 모두 얻을 수 있는 윈윈 방식”이라며 “이러한 파트너십을 통해 지역 발전을 촉진하고 공익을 실현하며, 대학과의 협력을 통해 전문 지식과 맞춤형 데이터를 확보하면서도 대학에는 각 분야 전문가의 멘토링을 제공할 수 있다”고 말했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457162 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B8%B0%EC%88%A0-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%B8%EB%8F%84-%EB%B2%B5%EA%B0%88%EB%A3%A8%EB%A3%A8-%EC%97%B0%EA%B5%AC%ED%8C%80-4-1.jpg" alt="갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소" width="1000" height="667" /></p>
<p> </p>
<p><strong>글로벌 개방형 협업으로 이룬 AI 혁신과 성과 확산</strong></p>
<p>벵갈루루 연구소는 힌디어 도입 뿐 아니라 전 세계에 있는 갤럭시 AI 연구소와 협력해 영국, 인도, 호주 영어와 태국어, 베트남어, 인도네시아어 등의 AI 언어 모델을 개발하는 데도 큰 역할을 했다. 특히 타 지역 갤럭시 AI 연구팀이 인도에 직접 방문해 개발 자문을 구하기도 했다.</p>
<p>기리다르 팀장은 “모든 언어가 개발에 어려움이 있을 것이다. 우리 역시 힌디어 사용자들이 다른 언어를 사용하는 사람들과 하루 빨리 소통할 수 있도록 하는 것이 최종 목표였다”고 말했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457161 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B8%B0%EC%88%A0-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%B8%EB%8F%84-%EB%B2%B5%EA%B0%88%EB%A3%A8%EB%A3%A8-%EC%97%B0%EA%B5%AC%ED%8C%80-3-1.jpg" alt="갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 직원들이 벤치에 앉아있다." width="1000" height="667" /></p>
<p>이 프로젝트는 개방형 협업과 전문 지식 공유를 통해 혁신을 추구한다는 삼성전자의 철학을 잘 보여 준다.</p>
<p>벵갈루루 연구소는 혼자 개발하기 보다 개방적인 자세로 학계와 협력하면서 전 세계 삼성전자 연구소에 모범 사례를 남겼다.</p>
<p>기리다르 팀장은 “혼자가 아닌 함께 만들어가는 AI 혁신은 앞으로도 우리가 해야 할 일이며, 보다 많은 사람들이 갤럭시 AI를 만족해하며 이용할 수 있도록 계속해서 노력할 것”이라고 다짐했다.</p>
<p><img loading="lazy" class="alignnone wp-image-457163 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90-%EB%AA%A8%EB%B0%94%EC%9D%BC-%EA%B8%B0%EC%88%A0-%EA%B0%A4%EB%9F%AD%EC%8B%9C-AI-%EA%B8%80%EB%A1%9C%EB%B2%8C-%EC%97%B0%EA%B5%AC%EC%86%8C-%EC%9D%B8%EB%8F%84-%EB%B2%B5%EA%B0%88%EB%A3%A8%EB%A3%A8-%EC%97%B0%EA%B5%AC%ED%8C%80-5.jpg" alt="갤럭시 AI 글로벌 연구소 인도 벵갈루루 연구소 임직원들의 단체 사진" width="1000" height="667" /></p>
<p> </p>
<hr />
<div class="footnotes">
<p class="footnotes"><a href="#_ftnref1" name="_ftn1">[1]</a>Samsung Student Ecosystem for Engineered Data</p>
</div>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 5화: 브라질(SRBR)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-5%ed%99%94-%eb%b8%8c%eb%9d%bc%ec%a7%88srbr</link>
				<pubDate>Wed, 12 Jun 2024 17:00:18 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/The-Learning-Curve-Series-5-Brazil-TH.jpg" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[브라질 연구소]]></category>
                <guid isPermaLink="false">https://bit.ly/3yUYc5r</guid>
									<description><![CDATA[삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 4화 ‘중국 연구소(SRC) 편’에서 성조를 인식하고 학습하는 작업에 대해 살펴보았다면 이번에는 브라질 연구소(이하 SRBR)를 찾아가 문화와 국경을 넘은 협업 과정에 대해 […]]]></description>
																<content:encoded><![CDATA[<p><em><strong>삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 4화 ‘<a href="https://bit.ly/3RbuTly" target="_blank" rel="noopener">중국 연구소(SRC) 편</a>’에서 성조를 인식하고 학습하는 작업에 대해 살펴보았다면 이번에는 브라질 연구소(이하 SRBR)를 찾아가 문화와 국경을 넘은 협업 과정에 대해 알아본다.</strong></em></p>
<p> </p>
<p>남미 최대 국가인 브라질은 라틴아메리카에서 유일하게 포르투갈어를 사용하고 있다. 아르헨티나, 볼리비아 등 지리적으로 가까운 22개국의 공식 언어는 스페인어다</p>
<p>브라질의 포르투갈어와 주변 국가들의 스페인어는 모두 다양하게 변형되기 때문에 갤럭시 AI가 지역적 차이를 구별하도록 학습시키는 일은 복잡한 문제였다. 이 때문에 삼성 브라질 연구소(SRBR)는 SiDi와 Sidia 등 현지 연구기관들은 물론 스페인어권인 멕시코의 삼성 연구진과 함께 전문가 팀을 구성했다.</p>
<p> </p>
<p><strong>장벽은 낮추고 이해는 높이고</strong></p>
<p>연구팀은 수천 개의 언어 소스와 머신러닝을 활용해 포르투갈어와 스페인어 등 중남미 언어의 지역별 음성과 텍스트 변이 데이터를 AI 모델에 학습시켰다. 스포츠 선수, 연예인 등 유명 인사의 이름과 현지 전문 용어 등도 같은 언어권이라고 해도 지역마다 매우 다르게 쓰인다.</p>
<p><img loading="lazy" class="alignnone wp-image-456538 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/KR_The-Learning-Curve-Series-5-SA-Map-Key-Visual-e1718178955382.jpg" alt="AI로 라틴 아메리카 전역의 언어 해독" width="1000" height="563" /></p>
<p>예를 들어 같은 스페인어라고 해도 멕시코에서는 수영장을 ‘알베르카(alberca)’라고 말하지만 아르헨티나, 파라과이, 우루과이에서는 ‘필레타(pileta)’라고 부른다. 하지만 콜롬비아, 볼리비아, 베네수엘라에서는 브라질(piscina)이 쓰는 포르투갈어와 비슷하지만 약간의 발음 차이가 있는 ‘피시나(piscina)’라고 한다. 콜롬비아 사람들은 멋진 것을 가리킬 때 ‘체베레(chévere)’라고 하지만, 멕시코 사람들은 ‘파드레(padre)’라고 한다.</p>
<p>AI 언어 모델이 원활하게 번역을 수행하려면 이러한 현지 데이터가 필요하기 때문에 지역적 언어 차이는 큰 걸림돌이었다. 하지만 연구팀은 국경과 시차를 넘어선 협업으로 언어 모델과 프로세스 툴을 차근차근 개선해 나갔다.</p>
<p>브라질 연구소의 마테우스 페드로소 소프트웨어품질랩장은 “개발팀과 QA(품질검증)팀의 긴밀한 협업으로 현지어와 다양한 표현법을 반영한 모델을 개발하고 테스트를 진행했다”고 말했다.</p>
<p>그는 “브라질은 멕시코보다 3시간 빠르고 한국 본사보다 12시간 늦기에 새로운 커뮤니케이션 방식과 프로세스를 구축해 결과를 조율하고 진행 상황을 공유 해야했다”며 “문화를 넘어선 협업으로 갤럭시 AI에 관한 아이디어와 솔루션이 쏟아져 나왔다”고 밝혔다.</p>
<p> </p>
<p><strong>성공적인 커뮤니케이션</strong></p>
<p>삼성전자의 개방형 협업 철학과 앞선 기술력을 바탕으로 연구팀은 지치지 않고 꾸준히 개발 과정을 이어갔다. 언어와 문화적 장벽을 극복하기 위해 오디오와 텍스트 소스를 중심으로 방대한 양의 데이터를 수집, 관리, 정제하고 지속적으로 개선했다.</p>
<p>연구팀은 삼성 중남미 법인 모두가 축적된 기술을 활용할 수 있도록 업무 프로세스를 수립했다. 브라질 연구소의 개발팀이 프로젝트의 중심이 되어 삼성 본사 지침에 따른 AI 모델 신규 업데이트 개발과 다양한 사용 사례에 대한 테스트를 수행했다.</p>
<p>파트너 기관 SiDi에서 소프트웨어 개발 책임을 맡은 레안드로 플로레스 데 모우라는 “테스트 단계에서 QA팀과의 끊임없는 소통과 협업으로 사용자 경험을 개선했고, 업무별로 추가적인 테스트와 연구를 진행했다”고 밝혔다. SiDi QA팀의 네이선 카스트로는 “갤럭시 AI의 언어 능력은 기술력 뿐 아니라 소통과 협업을 기반으로 한다”고 말했다.</p>
<p> </p>
<p><strong>문화로 이끄는 길</strong></p>
<p>연구팀에게 이 프로젝트는 단순히 통번역이 아니라, 민족의 유산과 정체성을 보여주는 문화 안내서로서의 언어를 연구한다는 점에서 흥미로웠다. SiDi QA팀의 에스테파니아 카스트로 수아레즈는 “우리는 다양한 문화를 하나로 엮어 서로 다른 언어로 소통하는 어려움을 극복해 세상을 변화시킬 수 있다는 기대와 자부심을 갖고, 주도적으로 업무에 임했다”고 밝혔다.</p>
<p>페드로소 랩장은 “서로 다른 언어를 사용하더라도 자유롭게 소통하고, 공유하고, 상호 작용해 세상을 하나로 만들겠다는 갤럭시 AI의 목표를 브라질 연구소 연구팀이 협업 과정에서 잘 보여줬다”며, “앞으로 갤럭시 AI의 지원 언어가 확대될수록 다가올 미래의 모습”이라고 덧붙였다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-456539" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/The-Learning-Curve-Series-5-Brazil-THUMBNAIL-e1718179027203.jpg" alt="" width="1000" height="667" /></p>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 4화: 중국(SRC)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-4%ed%99%94-%ec%a4%91%ea%b5%adsrc</link>
				<pubDate>Tue, 04 Jun 2024 17:00:49 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/SRC_KV-%EB%B3%B5%EC%82%AC%EB%B3%B8-728x410.jpg" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[삼성 리서치 중국 연구소]]></category>
		<category><![CDATA[삼성리서치]]></category>
                <guid isPermaLink="false">https://bit.ly/3RbuTly</guid>
									<description><![CDATA[삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 3화 ‘베트남 연구소(SRV) 편’에서 성조를 인식하고 학습하는 작업에 대해 살펴보았다면 이번에는 중국 연구소(이하 SRC)를 찾아가 표준 중국어와 광둥어에 특화된 작업에 대해 […]]]></description>
																<content:encoded><![CDATA[<p><img loading="lazy" class="alignnone wp-image-456314 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/1.Galaxy-AI-e1717484232227.jpg" alt="갤럭시 AI 글로벌 중국 연구소 연구원들" width="1000" height="667" /></p>
<p><em><strong>삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 3화 ‘<a href="https://bit.ly/3VddACQ" target="_blank" rel="noopener">베트남 연구소(SRV) 편</a>’에서 성조를 인식하고 학습하는 작업에 대해 살펴보았다면 이번에는 중국 연구소(이하 SRC)를 찾아가 표준 중국어와 광둥어에 특화된 작업에 대해 알아본다.</strong></em></p>
<p> </p>
<p>전 세계에서 거대언어모델(LLM)을 활용한 AI 툴이 쏟아져 나오는 가운데, 중국에서도 바이두의 ‘어니봇’, 메이투의 ‘미라클 비전’ 등이 인기를 끌고 있다. 중국 시장에서는 바이두와 메이투가 업계 선두를 달리고 있어, SRC는 갤럭시 AI 기능 구현을 위한 현지 LLM 공급자로 이들을 선정했다.</p>
<p>중국연구소의 광저우와 베이징 연구팀은 중국 사용자들이 갤럭시 AI 경험을 누릴 수 있도록 엄격한 개발 일정을 수립해 나갔다. 이로써 바이두와 메이투의 중국어 방언 리소스를 활용하여 중국어에 특화된 갤럭시 AI 솔루션을 구축했다.</p>
<p>“광저우 연구팀은 글로벌 선진 경험을 중국 현지 상황에 맞게 적용할 뿐 아니라, 중국 소비자와 끊임없는 소통을 통해 신규 기능을 개발하고 지속적으로 서비스를 개선하고 있다”고 장 헤이롱 SRC 광저우 소프트웨어 혁신 그룹 리더가 말했다. 이어 “갤럭시 S24를 통한 풍부한 개발 경험을 바탕으로 바이두, 메이투 등 중국 현지 AI 기업과 협력해 중국 시장에 큰 반향을 일으킬 수 있었다”고 덧붙였다.</p>
<p><img loading="lazy" class="alignnone wp-image-456315 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/2.-SRC-G-e1717484053967.jpg" alt="중국연구소 연구원들 사진" width="1000" height="656" /></p>
<p>초기에는 LLM 공급자와 업무 방식을 조율하고 원활하게 정보를 주고받는 데 어려움을 겪었다. 장 다이준 베이징 R&D 센터장은 삼성의 제품 수명 주기와 맞지 않는 개발 일정 등의 문제를 해결하기 위해 T/F팀을 구성하고 신속하게 목표를 향해 프로젝트를 이끌었다.</p>
<p><img loading="lazy" class="alignnone wp-image-456320 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/3.-SRC-B-e1717484080281.jpg" alt="장 다이준 베이징 R&D 센터장" width="1000" height="667" /></p>
<p>마침내, 베이징 연구팀의 개발 경험과 LLM 공급자와 협업으로 중국에서 갤럭시 AI의 모든 기능을 구현하는 데 성공했다. ‘터치 투 서치(Touch to Search)’ 등 중국 시장에 특화된 기능이 탄생한 것이다.</p>
<p> </p>
<p><strong>중국 방언까지 아우르는 갤럭시 AI</strong></p>
<p>그렇게 2024년 1월 갤럭시 S24 출시와 함께 갤럭시 AI에 중국어가 탑재되었다. 삼성전자 중국 연구소(SRC)는 더 나아가 광둥어 AI 모델 개발에 돌입했다. 기본적으로 표준 중국어 모델을 기반으로 했지만, 완전히 다른 형태의 언어 기능 분석이 필요했다.</p>
<p><img loading="lazy" class="alignnone wp-image-456321 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/4.-SRC-B-AI-Team-e1717484111910.jpg" alt="중국 연구소(SRC) 연구팀" width="1000" height="667" /></p>
<p>연구팀은 광둥어 서비스를 개발하기 위해 여러 가지 문화적인 요소를 고려했다. 먼저, 문어체와 구어체가 다르다는 점이다. 홍콩 현지인들은 글을 쓸 때 표준 중국어와 비슷한 문법과 표현을 사용하지만, 일상적인 의사소통에서는 완전히 다른 구어체 문법을 사용한다. 또한, 표준 중국어에는 4가지 성조가 있지만, 광둥어는 무려 9가지 성조로 구성되어 있다.</p>
<p>이에 더해 광둥어 또한 시대에 따라 변화 되었으며, 영어를 섞어 쓰는 경우가 많아 테스트 사례 생성과 언어 팩 검증이 복잡했다.</p>
<p><img loading="lazy" class="alignnone wp-image-456313 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/KRAILanguage_4_Cantonese-R3_v0604-e1717484161723.jpg" alt="광둥어 AI 개발 비슷한 문법, 다른 언어 구조 구어 표준 중국어는 구어와 문어가 일치함 문어 광둥어는 구어와 문어가 항상 일치하지는 않음 표준 중국어의 영어 혼종어 표준 중국어는 외래어를 덜 사용함 광둥어의 영어 혼종오 광둥어는 외래어를 더 자주 사용함 표준 중국 발음 표준 중국어 4성 광둥어 발음 광둥어 9성 "언어와 의사소통은 지역과 계층을 막론하고 매우 중요하다. 어떤 언어든 사람들이 의사소통할 수 있는 도구는 모두 유용하기 때문에, 우리의 연구는 의미 있는 일" - 헨리 와트 SEHK 홍콩 엔지니어링 그룹" width="1000" height="571" /></p>
<p>광둥어 AI 솔루션 테스트를 리드한 징 리는 “광둥어는 사용 지역에 따라 달라지는 매우 독특한 방언”이라며 “속어, 문구, 어휘, 심지어 성조도 상황에 따라 달라지는 경우가 많다”고 말했다. 이어 “홍콩 지역에 국한된 데이터를 검증하고 수만 건의 관련 테스트 사례를 검수하는 데 많은 노력을 기울였다”고 설명했다.</p>
<p><img loading="lazy" class="alignnone wp-image-456319 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/5.SRC-G_SQE-e1717484183173.jpg" alt="베이징과 광저우 연구팀" width="1000" height="667" /></p>
<p>베이징과 광저우 연구팀은 광둥어의 이러한 언어적 복잡성을 인지하면서 음성 인식에서 광둥어와 영어를 혼합하여 사용하는 심층코드믹스(deep code mix) 현상을 지원했다. 또한 기계번역에서 문어와 음성 표현을 동시에 지원하고 음성 합성에서는 현재 시점의 발음을 반영한다는 목표로 협업을 진행했다.</p>
<p> </p>
<p><strong>커뮤니케이션의 문화적 영향</strong></p>
<p>홍콩과 중국에서 갤럭시 AI가 출시된 후 시장의 뜨거운 반응이 이어지면서 삼성전자 중국연구소의 노력이 입증되었다.</p>
<p>중국과 홍콩의 갤럭시 AI 개발 스토리는 위상과 전문성을 갖춘 글로벌 브랜드와 개방형 협업을 추진한 사례로, 현지 파트너사와의 협업이 얼마나 중요한지를 잘 보여준다. 홍콩에서 광둥어는 현지인들에게 있어 문화적 정체성의 핵심이다. 따라서 정확한 AI 언어 모델의 개발이 매우 중요했다.</p>
<p>헨리 와트 SRC 홍콩 엔지니어링 그룹 리더는 “언어와 의사소통은 지역과 계층을 막론하고 매우 중요하다”며 “어떤 언어든 사람들이 의사 소통할 수 있는 도구는 모두 유용하기 때문에, 우리의 연구는 의미 있는 일”이라고 강조했다.</p>
<p><img loading="lazy" class="alignnone wp-image-456318 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/06/5.SEHK_-e1717484210479.jpg" alt="갤럭시 AI 글로벌 연구소 팀원들 단체 사진" width="1000" height="750" /></p>
<p>다음 편에서는 브라질 연구소를 방문해, 문화와 국경을 넘은 협업 과정을 조명할 예정이다.</p>
]]></content:encoded>
																				</item>
					<item>
				<title><![CDATA[갤럭시 AI 글로벌 연구소 3화: 베트남(SRV)]]></title>
				<link>https://news.samsung.com/kr/%ea%b0%a4%eb%9f%ad%ec%8b%9c-ai-%ea%b8%80%eb%a1%9c%eb%b2%8c-%ec%97%b0%ea%b5%ac%ec%86%8c-3%ed%99%94-%eb%b2%a0%ed%8a%b8%eb%82%a8srv</link>
				<pubDate>Thu, 23 May 2024 17:14:12 +0000</pubDate>
								<media:content url="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/SRV_TH.jpg" medium="image" />
				<dc:creator><![CDATA[삼성전자 뉴스룸]]></dc:creator>
						<category><![CDATA[기술]]></category>
		<category><![CDATA[기업뉴스]]></category>
		<category><![CDATA[모바일]]></category>
		<category><![CDATA[제품뉴스]]></category>
		<category><![CDATA[AI 언어]]></category>
		<category><![CDATA[SRV]]></category>
		<category><![CDATA[갤럭시 AI]]></category>
		<category><![CDATA[갤럭시 AI 글로벌 연구소]]></category>
		<category><![CDATA[삼성 리서치 베트남 연구소]]></category>
		<category><![CDATA[삼성리서치]]></category>
                <guid isPermaLink="false">https://bit.ly/3VddACQ</guid>
									<description><![CDATA[삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사 소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 2화 ‘요르단 연구소(SRJO)편’에서 언어의 방언을 인식하고 학습하는 복잡한 작업에 대해 살펴보았다면 이번에는 베트남 연구소(SRV)를 찾아가 성조를 인식하고 학습하는 작업에 대해 […]]]></description>
																<content:encoded><![CDATA[<p><em><strong>삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사 소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 2화 <a href="https://bit.ly/3UR3MgO" target="_blank" rel="noopener">‘요르단 연구소(SRJO)편’</a>에서 언어의 방언을 인식하고 학습하는 복잡한 작업에 대해 살펴보았다면 이번에는 베트남 연구소(SRV)를 찾아가 성조를 인식하고 학습하는 작업에 대해 알아본다.</strong></em></p>
<p><img loading="lazy" class="alignnone wp-image-455945 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/01.-SRV-team-e1716446417582.jpg" alt="삼성전자 베트남 연구소(SRV) 연구원들의 단체사진" width="1000" height="667" /></p>
<p>베트남어는 베트남을 포함해 전 세계 약 9천7백여 만 명이 사용하는 언어로, 중국어, 태국어 등 인근 지역 언어와 비슷한 성조 체계를 지니고 있다. 예를 들어 베트남어 단어 ‘Ma’는 성조에 따라 무덤(Ma), 귀신(Mả) 엄마(Má) 등 전혀 다른 의미를 갖는다.</p>
<p>이러한 언어적 특징은 문맥이나 발화자의 의도, 감정을 직접 인지하지 못하는 AI 모델이 언어를 학습하는 게 매우 어려울 수 있음을 시사한다.</p>
<p>삼성전자 베트남 연구소(SRV)는 이를 극복하기 위해 AI 모델을 학습시킬 때 언어의 미세한 차이를 인식할 수 있도록 매우 정교하게 다듬은 데이터를 활용했다. 이때 활용된 데이터는 자동 음성 인식(Automatic Speech Recognition, 이하 ASR), 신경망 기계 번역(Neural Machine Translation, 이하 NMT), 텍스트 음성 변환(Text to Speech, 이하 TTS) 등 AI 모델의 결과물과 정확도에 직접적 영향을 미친다.</p>
<p>고품질 데이터를 활용한 갤럭시 AI는 실시간 번역, 통역, 챗 어시스트, 노트 어시스트 등 실생활에 자주 활용되는 경험을 제공해 사용자의 언어 장벽을 크게 낮출 수 있었다.</p>
<p> </p>
<p><strong>6개 성조에 따라 달라지는 단어의 의미</strong></p>
<p>“베트남어는 음성 구조가 복잡하고 표현도 풍부해 개발자들에게 매우 도전적인 과제였습니다.” 베트남 연구소에서 NMT 모델 개발을 리드한 응오 홍 타이는 갤럭시 AI의 16개 언어 중에서, 베트남어의 난이도가 특히 높아 개발자로서 매우 도전적인 과제였다고 말했다.</p>
<p><img loading="lazy" class="alignnone wp-image-455947 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/03.-Ng%C3%B4-H%E1%BB%93ng-Th%C3%A1i_Head-of-NMT-e1716446439425.jpg" alt="베트남 연구소에서 NMT 모델 개발을 리드한 응오 홍 타이" width="1000" height="667" /></p>
<p>“제게는 이번 개발 과정이 악명 높은 베트남의 태풍보다 더 무서웠다”며 웃음을 보인 그는 베트남어 AI 언어를 개발하는 과정에서 팀이 직면하고 극복해야 했던 장애물과 어려움에 대해 설명했다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-455976" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/008-The-Learning-Curve-Part-3-Taking-AI-Data-from-Good-to-Great_Infographic1-e1716451845645.jpg" alt="The Challenges of Developing Al with the Vietnamese Language Tone Disambiguation Analyzes 6 distinct tones Ambiguity Resolution Many homophones & homonyms Word Segmentation Context is key: identifying compound words Limited Resources Draws from limited voice data & other sources Loan Words Words borrowed from another language Cultural Nuances Unique idioms, proverbs, and expressions Orthographic Complexity Additional characters and diacritic marks" width="1000" height="571" /></p>
<p>개발 과정이 호락호락하지 않았던 첫 번째 이유는 앞서 언급했던 것처럼 베트남어가 여섯 가지 성조를 가진 음조 언어라는 데 있었다. 발성의 작은 차이가 단어의 의미를 크게 바꿀 수 있기에 더욱 세밀한 접근이 필요했다.</p>
<p>“서로 비슷하게 들리는 단어도, 매우 짧은 세그먼트로 나누면 한 단어당 여러 프레임 세트씩 구성됩니다.” 삼성전자 베트남 연구소에서 ASR 개발을 리드하고 있는 부이 응옥 뚱의 말이다.</p>
<p><img loading="lazy" class="alignnone wp-image-455946 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/02.-Bui-Ngoc-Tung-and-ASR-team-e1716446486645.jpg" alt="삼성전자 베트남 연구소(SRV) 연구원들의 모습" width="1000" height="667" /></p>
<p>그는 “AI 모델은 0.02초 전후의 짧은 프레임을 구분해 연속된 프레임 세트에 해당하는 단어가 무엇인지 인식하기 때문에 초기 AI 학습 과정에 심혈을 기울여야 한다”고 부연 설명했다.</p>
<p>개발자들은 두 번째 어려움으로, 발음은 같지만 의미가 다른 동음이의어와 철자가 같지만 의미가 다른 동형이의어가 흔한 점을 꼽았다.</p>
<p>사람끼리 대화할 때는 유사한 소리나 문자를 분위기나 발화자의 비언어적 요소에 따라 구분해 알아들을 수 있지만, AI 모델은 그렇지 않다. 따라서 AI 모델이 성조와 유사한 단어를 정확히 구분하도록 트레이닝시키는 것이 필수적이다. 응오 홍 타이는 이 과정이 말처럼 간단하지 않았다고 덧붙였다.</p>
<p>“AI 모델을 학습시킬 때 사용되는 데이터의 양뿐 아니라 데이터의 정확성도 매우 중요해요. 그래야만 베트남어에 존재하는 미묘한 차이를 AI 모델이 인지할 수 있기 때문이죠.”</p>
<p><img loading="lazy" class="alignnone wp-image-455948 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/04.-AI-data-preparation-e1716446504114.jpg" alt="삼성전자 베트남 연구소(SRV) 연구원들이 AI 모델을 개발하고 있는 모습" width="1000" height="667" /></p>
<p> </p>
<p><strong>엄격한 데이터 정제 과정</strong></p>
<p>데이터 정제 과정은 크게 세 단계로 구성된다.</p>
<p>먼저, 트레이닝에 사용될 오디오와 텍스트 데이터를 검토하고 이를 수정한다.</p>
<p>다음으로, 데이터 세트의 전반적인 품질을 한 차례 더 확인하기 위해 무작위 검사를 수행하고, 마지막으로, 트레이닝이 시작되기 전 데이터 세트를 최종 정리한다.</p>
<p><img loading="lazy" class="alignnone size-full wp-image-455977" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/008-The-Learning-Curve-Part-3-Taking-AI-Data-from-Good-to-Great_Infographic2-e1716451864285.jpg" alt="Steps of data refinement *for ASR(Automatic Speech Recognition) 1. Data Review • Review text and audio • Spelling check • Correct the sentence structure • Match audio and text 2. Data Verification • Statistical testing on the overall quality of dataset and failure rate 3. Normalizing & Cleansing • Normalize and clean dataset before Al model training" width="1000" height="615" /></p>
<p>데이터베이스 생성을 총괄하고 TTS 모델 개발을 담당한 응우웬 마인 쥬이는 “데이터 세트의 정확도를 확인하기 위해 정제 활동을 철저히 수행했다”고 밝히며, “녹음 중 스크립트 속의 오타를 발견하거나 소음이 유입되거나, 발음이 부정확해지는 등 예상치 못한 많은 문제가 발생했고, 그런 만큼 정제 과정에 많은 시간을 쏟아 트레이닝 데이터를 개선했다”며 그동안의 어려움에 대해 회고했다.</p>
<p><img loading="lazy" class="alignnone wp-image-455949 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/05.-Nguyen-Manh-Duy_Head-of-TTS-e1716446581492.jpg" alt="TTS 모델 개발을 담당한 응우웬 마인 쥬이" width="1000" height="667" /></p>
<p>갤럭시 AI 베트남어 개발에 있어 또 다른 어려움으로 데이터 소스가 제한적이라는 점도 있었다. 응우웬은 “이는 데이터 정제 단계가 매우 중요한 또 다른 이유”라고 덧붙이며, “사용할 수 있는 외부 소스가 제한적이기 때문에 우리가 갖고 있던 데이터의 신뢰도를 높여야 했다. 데이터에 오류가 발견되면 ‘실패’라는 비장한 마음가짐으로 임했다”고 말했다. 응우웬의 목소리에는 우리가 해냈다는 자부심과 자신감이 가득 차 있었다.</p>
<p><img loading="lazy" class="alignnone wp-image-455950 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/06-SRV-team-e1716446597424.jpg" alt="삼성 베트남 연구소 개발팀의 모습" width="1000" height="679" /></p>
<p>베트남어 AI 모델은 언어의 지역적 차이도 극복해야 했다. 이를 위해 개발팀은 베트남 북부는 물론, 중부와 남부 악센트에 대한 대량의 데이터를 수집했고, 이 방대한 양의 데이터를 정제하고 검증하기 위해 전 팀원들이 치열하게 노력했다.</p>
<p> </p>
<p><strong>끝이 아니라 시작</strong></p>
<p>삼성전자 베트남 연구소 담당자들은 각고의 노력 끝에 개발을 완료했고, 베트남어는 이제 갤럭시 AI와 함께 출시된 최초의 언어 중 하나가 되었다. 이러한 성취에도 불구하고, 팀은 계속해서 베트남어 갤럭시 AI 경험을 낫게 하기 위해 끊임없이 노력하고 있다.</p>
<p>SRV의 AI 언어 개발 프로젝트 팀장 쩐 뚜언 밍은 “갤럭시 AI에서 단어와 구절의 관련성에 대한 사용자의 피드백을 받으며 AI 모델은 지속적으로 진화하고 있다”, “우리는 이제 첫 걸음을 내디뎠고 앞으로도 더 나은 사용 경험을 소비자들에게 제공하도록 노력할 것”이라고 각오를 다졌다.</p>
<p><img loading="lazy" class="alignnone wp-image-455978 size-full" src="https://img.kr.news.samsung.com/kr/wp-content/uploads/2024/05/007-The-Learning-Curve-Part-3-Taking-AI-Data-from-Good-to-Great-e1716451953893.jpg" alt="베트남 연구소(SRV)의 AI 언어 개발 프로젝트 팀장 쩐 뚜언 밍" width="1000" height="667" /></p>
<p>다음 편에서는 중국연구소를 방문해, 데이터 학습 이후 AI 모델을 빌드하는 과정을 자세하게 조명할 예정이다.</p>
]]></content:encoded>
																				</item>
			</channel>
</rss>