Кривая обучения, часть 8: Создание бесед между Японией и миром
Исследование Samsung в Японии - часть серии статей о людях и инновациях, стоящих за демократизацией мобильного ИИ
Компания Samsung продолжает создавать первоклассные мобильные устройства с искусственным интеллектом. Мы посетили исследовательские центры Samsung по всему миру, чтобы узнать, как Galaxy AI позволяет все большему числу пользователей максимально раскрыть свой потенциал. Galaxy AI теперь поддерживает 16 языков, поэтому больше людей могут расширить свои языковые возможности даже в автономном режиме благодаря переводу на устройстве в таких функциях, как Live Translate, Interpreter, Note Assist и Browsing Assist. Но что включает в себя разработка языка ИИ? В прошлый раз мы посетили Польшу, чтобы узнать, как европейские страны сотрудничают для достижения своей цели. В этот раз мы отправились в Японию, чтобы увидеть, как разработчики постоянно адаптируются к новым сценариям и случаям использования.
Японский научно-исследовательский институт Samsung (SRJ) был создан как центр исследований и разработок, ориентированный на аппаратное обеспечение, такое как бытовая техника и дисплеи. Поскольку спрос на инновации в области искусственного интеллекта растет во всем мире, с конца прошлого года в SRJ в Йокогаме работает лаборатория по разработке программного обеспечения для создания Galaxy AI Live Translate, который автоматически переводит голосовые вызовы в режиме реального времени.
«Live Translate особенно эффективен в сценариях путешествий, например, для посетителей Олимпийских игр в Париже в этом году», – говорит Такаюки Акасако (Takayuki Akasako), руководитель отдела искусственного интеллекта компании SRJ. «В настоящее время мы разрабатываем программу распознавания речи для людей, которые одновременно осматривают достопримечательности и наблюдают за Олимпийскими играми в Париже; обучая программу распознавания речи узнавать об играх и расположении стадионов в Париже 2024 года».
Понимание контекста при распознавании голоса
Для тех, кто уже пользуется функциями перевода в Galaxy AI, такой функционал может показаться очень полезным. Но разработчики, воплотившие эти функции в жизнь, знают, что возможность общаться во время путешествий за границей – это не то, что можно воспринимать как должное.
Команда отметила, что в японском языке больше омонимов, чем в некоторых других языках. Например, «палочки для еды» (Хаси, 箸) и «мост» (Хаси, 橋) относительно легко различить из-за разницы в интонации, Но такие слова, как «осмотр достопримечательностей» (Канко, 観光), «обычаи» (Канко, 慣行), «общественность» (Кокё, 公共) и «процветание» (Кокё, 好況), следует определять, исходя из контекста.
«Судить становится сложнее, когда контекст неоднозначен, например, названия местностей и людей, собственные существительные, диалекты и числа», – говорит Акасако. «Поэтому для повышения точности распознавания речи необходимо большое количество данных».
«Мы всегда ищем способы своевременной настройки модели ИИ для ключевых событий и моментов», – продолжает Акасако. «С большим количеством новых комбинаций названий мест и видов деятельности важно, чтобы контекст оставался понятным, когда люди используют Galaxy AI».
Трудности сбора эффективных данных
Хотя осознание типов необходимых данных также важно, сбор данных сам по себе является сложной задачей.
Ранее команда SRJ использовала записанные человеком данные для обучения механизма распознавания речи для Live Translate, что не приводило к сбору достаточного количества данных.
Samsung Gauss, разработанная компанией Большая языковая модель (LLM), использует скрипты для структурирования предложений со словами или фразами, относящимися к каждому сценарию. Данные, собранные с помощью Samsung Gauss, не только записываются людьми, но и генерируются синтезатором речи text-to-speech (TTS), с помощью которого люди осуществляют окончательную проверку качества. Используя этот метод, команда добилась значительного повышения эффективности сбора данных.
«Каждый раз, когда проблема выявляется и решается, точность распознавания речи значительно повышается», – говорит Акасако. «Независимо от того, где находятся люди, наша цель – соединить их друг с другом, а инструменты на базе Galaxy AI обеспечат более увлекательное и эффективное общение».
Продукты > Мобильные устройства
Новости компании > Технологии
По любым вопросам, связанным с сервисным обслуживанием, пожалуйста, обращайтесь на сайт samsung.com/kz_ru/support.
По вопросам сотрудничества со СМИ, пожалуйста, пишите на info.kz@samsung.com.