【回顧】學習曲線:三星全球研發中心如何使Galaxy AI至臻完善

08.08.2024
Share open/close
連結已複製.

Galaxy AI基於大型語言模型(LLM)的智慧終端AI功能,如通話即時翻譯、翻譯助理、筆記智慧助理與網頁瀏覽助理等,至今已造福全球數百萬用戶,實現熱絡的人際互動與交流。其目前共支援16種語言,預計年底前將陸續擴增4種語言。

 

由於每種語言皆有其獨特的結構和文化,為Galaxy AI建構語言功能的歷程是一條漫長而艱辛的道路。三星新聞中心帶領讀者回顧精彩點滴,透過來自世界各地三星研究員的分享-包括巴西、中國、印度、印尼、日本、約旦、波蘭與越南,了解Galaxy AI開發的幕後甘苦。

 

 

開發翻譯模型

諸如通話即時翻譯等Galaxy AI功能由三項核心處理作業構成:自動語音辨識(ASR)、神經機器翻譯(NMT)以及文字轉語音(TTS)。

 

▲自動語音辨識(ASR)、神經機器翻譯(NMT)以及文字轉語音(TTS)各別仰賴獨特的訓練資訊集

 

越南文是一種具有六種聲調的語言,因此越南三星研發中心(SRV)在建置自動語音辨識(ASR)模型上面臨了重重挑戰。由於聲調為語言的細微差異增添了複雜性,使AI難以辨識聲調語言。SRV建置的模型可區分20毫秒左右的短音訊訊框,成功克服此挑戰。

 

歐洲大陸文化璀璨多元,因此波蘭三星研發中心(SRPOL)在訓練神經機器翻譯(NMT)模型上面臨無數的難關。SRPOL具備豐富的語言專案經驗,橫跨全球四大時區、涵蓋30多種語言,此深厚的底蘊成功跨越重重障礙,包括克服特定用語的不可譯性,以及不同語言間所缺乏的同等俚語表達。

 

約旦三星研發中心(SRJO)將阿拉伯語導入Galaxy AI,目前有逾20個地區使用阿拉伯語,區域內共發展出約30種方言。母語者雖然普遍能識讀變音符號,但並不會標記於日常書寫中,因此為阿拉伯語建立文字轉語音(TTS)模型並非易事。基於對缺失變音符號的複雜預測模型,SRJO開發出能理解所有方言,並使用標準阿拉伯語應答的語言模型。

 

 

數據占有舉足輕重的地位

與當地機構建立開放的合作關係,是各個語言版本Galaxy AI訓練過程的重中之重。數據的品質將直接影響自動語音辨識(ASR)、神經機器翻譯(NMT)以及文字轉語音(TTS)的精準度。因此,三星積極與各領域的夥伴合作,取得和檢視能反映當地俚語、方言和其他變體的數據。

 

▲每一種語言皆有其獨特性,使AI語言模型的建置充滿挑戰。 例如越南語等聲調語言,因聲調的多重變化提升複雜程度。

 

印度邦加羅爾三星研發中心(SRI-B)與韋洛爾理工學院(Vellore Institute of Technology)展開合作,收集近百萬行關於會話語音、詞彙和指令的分段音訊與經過整理的音檔資料。學生獲得參與專案的實戰經驗,並得到三星專家的指導;得益於充沛的數據源,SRI-B順利以印度語訓練Galaxy AI,涵蓋20種以上的區域方言、語調變化、標點符號和俚語。

 

拉丁美洲西班牙語的複雜變化,反映其使用族群的多元性,因此對當地語言學的深度洞察,是建置該語言模型的重要關鍵。以「游泳池」一詞為例,各國說法不一,在墨西哥當地稱「alberca」,哥倫比亞、玻利維亞和委內瑞拉稱之為「piscina」,阿根廷、巴拉圭和烏拉圭則為「pileta」。巴西三星研發中心(SRBR)與SiDi和Sidia等科技機構展開合作,收集和管理大量數據,並持續細化、優化音訊和文字資源,使Galaxy AI拉丁美洲西班牙語模型漸趨完善。

 

隨著百度的「文心一言」聊天機器人,和美圖的「MiracleVision(奇想智能)」成為當紅炸子雞,北京(SRC-B)及廣州(SRC-G)的中國三星研發中心與百度和美圖等中國企業合作,借助其在大型語言模型(LLM)領域的專業長才開發漢語及粵語版Galaxy AI功能。

 

除了積極展開外部合作,盡職調查與內部資源亦極其關鍵。

 

印尼語是一門極具挑戰性的語言,其對上下文脈絡和隱義的廣泛應用,仰賴於社會和情境線索。因此,印尼三星研發中心(SRIN)研究員走進咖啡店或工作場所,在各處錄製會干擾輸入的真實環境噪音。此舉有助於模型學習,從語言輸入源當中識別出必要的資訊,進而提升語音辨識的準確性。

 

由於日語的母音和子音較少,因此同音異義詞相對較多,大多仰賴上下文來判斷詞義。日本三星研發中心(SRJ)使用三星的大型語言模型(LLM)Samsung Gauss,以不同情境的相關字詞或短語建構脈絡化語句,協助AI模型區分同音異義詞。

 

 

三星全球研究資源網

來自各地的三星研發中心專業人員亦充分運用三星的全球研究資源網。

 

為Galaxy AI導入印度語之前,印度邦加羅爾三星研發中心(SRI-B)與全球各地的團隊合作,開發適用於英國英語、印度英語、澳洲英語、泰語、越南語和印尼語的AI語言模型。此外,亦有來自其他三星研究院的工程師前往印度邦加羅爾取經,將越南語、泰語和印尼語導入Galaxy AI。

 

▲工作人員與合作夥伴齊聚一堂,在印度邦加羅爾三星研發中心(SRI-B)前合影

 

波蘭三星研發中心(SRPOL)曾為多種語言開發ASR、NMT和TTS模型,在該領域累積多年的豐富經驗。SRPOL是Galaxy AI語言拓展的重要一員,藉由橫跨歐陸的合作,協助約旦三星研發中心開發阿拉伯語的多種方言,另為巴西三星研發中心提供巴西葡萄牙語、拉丁美洲西班牙語的相關協助。

 

三星的各地開發人員,掌握跨越國界與時區的合作之道。印尼三星研發中心開發人員與印度邦加羅爾三星研發中心同仁會晤時,觀察到印度當地的齋戒習俗。回顧豐碩的工作成果,許多同仁內心感到無比自豪和感激,深深體悟此專案對語言、文化、傳承、身份認同的深遠影響。

 

 

步伐堅毅、向前邁進

三星自今年初Galaxy AI發表以來,已導入超過1億台裝置,包括新款摺疊機與穿戴裝置。三星電子行動通訊事業部執行副總裁暨行動研發處負責人Won-Joon Choi在近期的專題研討會表示:「我們期望能在2024年底前觸及2億台裝置。」

 

三星致力推動AI普及,催生安全無虞、兼容並蓄的技術,造福人類並改善生活。在持續向前邁進的同時,一路以來的豐碩成果亦值得細細回顧。藉由建構支援更多功能與語言版本、因地制宜的Galaxy AI生態圈,三星積極透過前所未見的方式促進跨文化交流與合作,實現其所擘畫的「AI for All」願景。

品牌 > 科技

產品 > 行動通訊

關於消費者服務相關詢問,請洽三星客服專線 : 0800-32-9999
任何媒體需求及詢問,請聯繫 tw.newsroom@samsung.com.

了解更多關於三星最新新聞

了解更多
置頂