Hành trình tri thức – Phần 1: Vì sao việc huấn luyện ngôn ngữ mới cho AI bắt đầu từ cơ sở dữ liệu

15/05/2024
Share open/close
Sao chép URL.

Samsung Research tại Indonesia sẽ mang đến câu chuyện đầu tiên của series về các nhân tài và cải tiến đã thúc đẩy quá trình dân chủ hóa AI trên thiết bị di động

 

Đồng hành cùng quá trình tiên phong tạo ra những trải nghiệm AI trên thiết bị di động cao cấp của Samsung, chúng tôi đã đến tham quan các trung tâm Nghiên cứu của Samsung trên khắp thế giới để tìm hiểu cách Galaxy AI giúp nhiều người dùng khai thác tối đa tiềm năng của họ hơn nữa. Galaxy AI hiện hỗ trợ đến 16 ngôn ngữ, giúp người dùng mở rộng khả năng ngôn ngữ của mình ngay cả khi ngoại tuyến nhờ vào các tính năng phiên dịch trên thiết bị như Phiên dịch trực tiếp, Trợ lý Phiên dịch, Trợ lý Note quyền năng và Trình duyệt thông minh. Nhưng việc phát triển ngôn ngữ cho AI đòi hòi những yếu tố gì? Series này sẽ khám phá những thách thức trong quá trình phát triển AI trên thiết bị di động và cách họ vượt qua những khó khăn này. Đầu tiên, chúng tôi đã đặt chân đến đất nước Indonesia để tìm hiểu cách các nhà nghiên cứu huấn luyện AI học một ngôn ngữ mới.

 

 

Theo nhóm nghiên cứu tại Trung tâm Nghiên cứu & Phát Triển (R&D) của Samsung tại Indonesia (SRIN), thiết lập mục tiêu rõ ràng là bước đầu tiên trong quá trình này. Junaidillah Fadlil, Giám đốc Bộ phận AI tại SRIN, và nhóm của mình gần đây đã bổ sung tiếng Indonesia vào hệ thống các ngôn ngữ được hỗ trợ của Galaxy AI, cho biết, “Một mô hình AI xuất sắc yêu cầu nguồn dữ liệu chất lượng và phù hợp. Mỗi ngôn ngữ đòi hỏi cách giải quyết vấn đề khác nhau, vì vậy chúng tôi đã nỗ lực tìm hiểu sâu hơn về nhu cầu ngôn ngữ và nét văn hóa độc đáo của đất nước. Việc phát triển ngôn ngữ địa phương cần được dẫn dắt bởi sự hiểu biết sâu sắc và khoa học. Do đó, bổ sung ngôn ngữ mới vào Galaxy AI cũng bắt đầu bằng việc lên kế hoạch về những thông tin cần thiết và cách thu nhập dữ liệu tuân thủ theo đúng pháp luật và nguyên tắc đạo đức.” 

 

Các tính năng của Galaxy AI như Phiên dịch trực tiếp đều thực hiện ba quy trình cốt lõi: Nhận diện giọng nói tự động (ASR), Dịch máy bằng nơ-ron (NMT) và Chuyển văn bản thành giọng nói (TTS). Mỗi quá trình đều yêu cầu một bộ thông tin riêng biệt.

 

 

Ví dụ, quy trình Nhận diện giọng nói tự động (ASR) yêu cầu rất nhiều bản ghi âm giọng nói trong nhiều môi trường khác nhau, mỗi bản ghi âm đều đi kèm với một bản phiên âm văn bản chính xác. Việc sử dụng nhiều mức độ tiếng ồn xung quanh cũng giúp AI thích ứng với các môi trường khác nhau. Manylisin Adi Saputra, trưởng nhóm ASR giải thích: “Bản ghi âm không chỉ cần thêm vào tiếng ồn xung quanh. Ngoài dữ liệu ngôn ngữ mà chúng tôi thu thập từ các đối tác được ủy quyền, chúng tôi cũng ghi âm giọng nói của chính mình ở các quán cà phê hoặc môi trường làm việc để ghi lại những âm thanh độc đáo trong cuộc sống một cách chân thực, như tiếng mọi người gọi tên nhau hay tiếng gõ bàn phím.”

 

 

Ngoài ra, bản chất luôn thay đổi của ngôn ngữ cũng cần được chú trọng. Saputra đề cập: “Chúng tôi phải luôn cập nhật các thuật ngữ mới, tiếng lóng và cách sử dụng chúng, và phần lớn chúng tôi tìm thấy những từ ngữ này trên mạng xã hội!”

 

Tiếp theo, quy trình Dịch máy bằng nơ-ron (NMT ) yêu cầu dữ liệu huấn luyện dịch thuật. Muhamad Faisal, trưởng nhóm NMT cho biết: “Phiên dịch tiếng Indonesia là một thách thức rất lớn. Ngôn ngữ này sử dụng rộng rãi các ý nghĩa dựa trên ngữ cảnh và ẩn ý tùy thuộc vào các tình huống khác nhau. Vì vậy, chúng tôi cần các văn bản dịch sẵn mà AI có thể tham khảo và học hỏi các từ mới, từ mượn, tên riêng hay thành ngữ – và bất kỳ thông tin nào có thể giúp AI hiểu rõ bối cảnh và quy tắc giao tiếp”.

 

 

Cuối cùng, quy trình Chuyển văn bản thành giọng nói (TTS) yêu cầu các bản ghi âm với nhiều loại giọng nói và ngữ điệu, cùng các ngữ cảnh bổ sung về cách phát âm các từ ngữ trong những tình huống khác nhau. Harits Abdurrohman, trưởng nhóm TTS bổ sung: “Việc sở hữu các bản ghi âm giọng nói chất lượng có thể hoàn thành nửa công việc của chúng tôi và nó sẽ bao gồm tất cả các âm vị (đơn vị âm thanh trong lời nói) cần thiết cho mô hình AI. Nếu một diễn viên lồng tiếng đã làm tốt công việc ở giai đoạn trước, thì trọng tâm sẽ chuyển sang qua trình tinh chỉnh mô hình AI để phát âm rõ ràng các từ cụ thể.”

 

 

 

Cùng nhau phát triển mạnh mẽ 

Để lên kế hoạch chuẩn bị cho khối lượng dữ liệu khổng lồ, SRIN đã hợp tác chặt chẽ với các chuyên gia ngôn ngữ học. Fadlil chia sẻ: “Thử thách này đòi hỏi sự sáng tạo, tính linh hoạt và chuyên môn sâu sắc trong cả tiếng Indonesia và học máy (Machine Learning). Triết lý hợp tác cởi mở của Samsung đóng vai trò quan trọng trong việc hoàn thành công việc này, bên cạnh quy mô hoạt động và lịch sử phát triển AI của chúng tôi.”

 

Quan hệ hợp tác với các trung tâm Nghiên cứu khác của Samsung trên khắp thế giới đã giúp nhóm SRIN có thể nhanh chóng áp dụng các phương pháp tốt nhất và vượt qua trở ngại phức tạp khi thiết lập các mục tiêu dữ liệu. Hơn nữa, điều này không chỉ mang lại lợi ích trong việc thúc đẩy sự phát triển của công nghệ mà còn cả văn hóa. Khi nhóm SRIN tham gia cùng các đối tác tại Bangalore, Ấn Độ, họ đã quan sát các phong tục về ăn uống của người địa phương, tạo ra những kết nối sâu sắc hơn và mở rộng hiểu biết về các nền văn hóa khác nhau.

 

 

Với nhóm nghiên cứu, việc mở rộng ngôn ngữ cho Galaxy AI mang một ý nghĩa vô cùng quan trọng. Fadlil chia sẻ: “Chúng tôi vô cùng tự hào về về những thành tựu ở thời điểm hiện tại vì đây là dự án AI đầu tiên của nhóm, và đây chỉ là bước khởi đầu. Chúng tôi sẽ tiếp tục cải tiến các mô hình của chúng tôi để nâng cao chất lượng trải nghiệm cho người dùng. Sự phát triển này không chỉ thể hiện giá trị cởi mở của Samsung mà còn thể hiện sự tôn trọng và tôn vinh bản sắc văn hóa của người dùng thông qua ngôn ngữ.”

 

 

Trong tập tiếp theo của Hành trình tri thức, chúng tôi sẽ khám phá Trung tâm R&D của Samsung tại Jordan để trò chuyện cùng nhóm phụ trách dự án bổ sung tiếng Ả Rập cho Galaxy AI. Hãy theo dõi để tìm hiểu về những thác thức của việc xây dựng và huấn luyện mô hình AI cho một ngôn ngữ với nhiều phương ngữ đa dạng.

Doanh nghiệp > Công nghệ

Sản phẩm > Di động

Nếu có thắc mắc liên quan đến dịch vụ khách hàng, xin truy cập https://www.samsung.com/vn/info/contactus để được trợ giúp.
Nếu có các câu hỏi liên quan đến báo chí, xin liên hệ qua địa chỉ xinchao.samsung@samsung.com.

Xem qua những câu chuyện mới nhất về Samsung

Tìm hiểu thêm
Lên đầu trang