¿Por qué la enseñanza de nuevos lenguajes de IA comienza con datos?

28-06-2024

El centro de investigación de Samsung en Indonesia trabaja en innovaciones que impulsan la democratización de la inteligencia artificial móvil.

A medida que Samsung continúa siendo pionera en experiencias móviles de inteligencia artificial de primera calidad, muestra sus centros de investigación en todo el mundo para aprender cómo la IA de Galaxy está permitiendo que más usuarios maximicen su potencial.

Ahora, la IA de Galaxy es compatible en 16 idiomas, permitiendo que más personas puedan expandir sus capacidades lingüísticas, incluso sin conexión, gracias a funciones en el dispositivo como Traducción Simultánea, Modo Intérprete, Asistente de Notas y Asistente de Navegación. ¿Pero en qué consiste el desarrollo del lenguaje de la IA? Estos son los desafíos de trabajar con IA móvil.

De acuerdo con el equipo del Samsung R&D Institute Indonesia (SRIN), “una gran IA comienza con datos relevantes y de buena calidad. Cada idioma exige una manera diferente de procesar esto, por lo que nos sumergimos profundamente para comprender las necesidades lingüísticas y las condiciones únicas de nuestro país. El desarrollo de idiomas locales debe estar liderado por datos y la ciencia, por lo que cada proceso para agregar idiomas a Galaxy AI comienza con la planificación de la información que necesitamos y podemos obtener legal y éticamente”, explica Junaidillah Fadlil, Head de IA en SRIN, cuyo equipo recientemente agregó soporte para Bahasa Indonesia a Galaxy AI.

Funciones de Galaxy AI, como Traducción Simultánea, realizan tres procesos principales: reconocimiento automático de voz (ASR, su sigla en inglés), traducción automática neuronal (NMT, su sigla en inglés) y texto a voz (TTS, su sigla en inglés). Cada proceso necesita un conjunto distinto de información.

ASR, por ejemplo, necesita grabaciones extensas de voz en numerosos entornos, cada una de ellas acompañada de una transcripción precisa del texto. Los diferentes niveles de ruido de fondo ayudan para tener en cuenta los diferentes entornos.

“No basta con añadir ruidos a las grabaciones. Además de los datos lingüísticos que se obtienen de terceros, debemos salir a cafeterías o entornos de trabajo para grabar nuestras propias voces. Esto nos permite capturar de forma auténtica sonidos únicos de la vida real, como las voces de la gente o el ruido de los teclados”, señala Muchlisin Adi Saputra, Head de ASR del equipo.

También hay que tener en cuenta la naturaleza siempre cambiante de las lenguas. Saputra añade: “tenemos que estar al día de la jerga más reciente y de cómo se utiliza, ¡y la mayoría de las veces la encontramos en las redes sociales!”.

NMT requiere datos de entrenamiento de traducción. “Traducir el bahasa indonesio es todo un reto. Su uso extensivo de significados contextuales e implícitos se basa en señales sociales y situacionales, por lo que necesitamos numerosos textos traducidos a los que la IA pueda hacer referencia para nuevas palabras, términos extranjeros, nombres propios y modismos, cualquier información que ayude a la IA a comprender el contexto y las reglas de comunicación”, afirma Muhamad Faisal, líder del equipo de NMT.

Luego, TTS requiere grabaciones que abarquen una variedad de voces y tonos, con un contexto adicional sobre cómo suenan partes de palabras en diferentes circunstancias. “Buenas grabaciones de voz podrían hacer la mitad del trabajo y cubrir todos los fonemas requeridos para el modelo de IA. Si un actor de voz hizo un gran trabajo en la fase anterior, el enfoque se desplaza hacia el perfeccionamiento del modelo de IA para pronunciar claramente palabras específicas”, agrega Harits Abdurrohman, líder de TTS.

Juntos somos más fuertes

Se necesitan diversos recursos para planificar tantos datos, y el SRIN trabajó en estrecha colaboración con expertos en lingüística. “Este desafío requiere creatividad, ingenio y experiencia tanto en Bahasa Indonesia como en aprendizaje automático. La filosofía de colaboración abierta de Samsung jugó un papel importante en lograr que se hiciera el trabajo, al igual que nuestra escala de operaciones y nuestra historia en el desarrollo de IA”, reflexiona Fadlil.

Trabajando con otros centros de investigación de Samsung en todo el mundo, el equipo del SRIN pudo adoptar rápidamente las mejores prácticas y superar las complejidades de establecer objetivos de datos. Además, la colaboración fue beneficiosa para avanzar no solo en tecnología, sino también en cultura. Cuando el equipo del SRIN se unió a sus contrapartes en Bangalore, India, observaron las costumbres locales de ayuno, creando conexiones más profundas y expandiendo su comprensión de diferentes culturas.

Para el equipo, el proyecto de expansión del lenguaje de Galaxy AI adquirió un nuevo significado. “Estamos orgullosos de nuestros logros, ya que este fue nuestro primer proyecto de IA, y no será el último mientras continuemos refinando nuestros modelos y mejorando la calidad de la entrega. Esta expansión no solo refleja nuestros valores de apertura, sino que también respeta e incorpora nuestras identidades culturales a través del lenguaje”, concluye Fadlil.

Materiales de Prensa Comunicados

Corporativo Tecnología e Innovación

Para temas relacionados a servicio de atención al cliente, por favor ingrese a samsung.com/co/support
Para consultas sobre medios y prensa, favor de contactar a colombia.pr@samsung.com.

¿Por qué la enseñanza de nuevos lenguajes de IA comienza con datos?

Juntos somos más fuertes

Artículos relacionados