Hành trình tri thức – Phần 6: Con đường hợp tác phát triển các đổi mới sáng tạo trong lĩnh vực AI
Tiếp nối loạt bài về những nhân tài và đổi mới đằng sau quá trình phổ cập AI trên thiết bị di động, câu chuyện lần này sẽ đưa chúng ta đến với Samsung Research tại Ấn Độ
Với nỗ lực tiên phong mang đến trải nghiệm AI cao cấp trên thiết bị di động, chúng tôi đã ghé thăm các Trung tâm Nghiên cứu của Samsung trên khắp thế giới để tìm hiểu cách Galaxy AI hỗ trợ nhiều người dùng khai phóng tiềm năng của mình hơn nữa. Galaxy AI hiện hỗ trợ 16 ngôn ngữ, mở ra cánh cửa giao tiếp không giới hạn ngay cả khi không có kết nối internet, nhờ vào các tính năng dịch thuật trên thiết bị như Phiên dịch trực tiếp, Trợ lý phiên dịch, Trợ lý Note quyền năng, và Hỗ trợ duyệt Web. Nhưng để đạt được những thành tựu ấn tượng đó, quá trình phát triển ngôn ngữ AI đòi hỏi những yếu tố nào? Trong phần trước, chúng ta đã đến thăm Brazil và tìm hiểu cách các nhóm nghiên cứu phối hợp xuyên văn hóa và biên giới để mang Galaxy AI đến với nhiều người dùng hơn. Ở phần này, chúng ta sẽ có mặt tại Ấn Độ để để khám phá giá trị của việc hợp tác với các đối tác địa phương trong hành trình phát triển Galaxy AI.
Bên trong Viện Công nghệ Vellore ở Chennai, Ấn Độ, là một phòng thí nghiệm được trang bị đầy đủ các thiết bị âm thanh tân tiến. Tại đây, bạn sẽ nhìn thấy những mô hình mô phỏng đầu và thân người, cùng với các micro thu âm binaural và thiết bị trợ thính. Tất cả được đặt trong những buồng đặc biệt được trang bị hệ thống tiêu âm tiên tiến, biến nơi đây trở thành phòng thí nghiệm đầu tiên thuộc loại hình này tại Ấn Độ. Còn gì lý tưởng hơn một cơ sở như vậy được sử dụng để phát triển các thiết bị âm thanh cao cấp tân tiến có độ chân thực cao (Hi-Fi).
Đây là nơi Viện Công nghệ Vellore hợp tác với Samsung để sản xuất và phát triển dữ liệu cũng như các thông tin chuyên sâu để xây dựng nền tảng cho các mô hình AI mới nhất, nâng cao khả năng ngôn ngữ của Galaxy AI. Cơ sở này thuộc dự án Phòng thí nghiệm Samsung SEED (Hệ sinh thái dữ liệu kĩ thuật dành cho sinh viên) – một sáng kiến cho phép nhân viên, sinh viên và thực tập sinh tại Ấn Độ tham gia vào các dự án triển khai bởi Samsung từ năm 2021. Đây chỉ là một trong số nhiều chương trình đại học do Samsung tài trợ, mang đến cho sinh viên cơ hội làm việc trong các dự án cùng với các chuyên gia kỹ thuật của công ty.
Yashika Ilanchezhiyan, một sinh viên tại Samsung SEED chia sẻ: “Là một sinh viên, tôi mong muốn được tham gia nhiều dự án khác nhau tại một công ty danh tiếng và uy tín như Samsung. Chương trình đã giúp tôi tự tin học hỏi các kỹ năng mới một cách thực tế và cảm thấy mình đang thật sự tạo ra sự khác biệt với những đóng góp vào các sản phẩm hiện tại và tương lai.”
Theo ông Giridhar Jakki, Giám đốc Ngôn ngữ AI tại Viện Nghiên cứu và Phát triển Samsung Ấn Độ – Bangalore (SRI-B): “Hình thức hợp tác này mang lại lợi ích cho cả đôi bên. Nhờ vào những dự án với các trường đại học, chúng tôi có thể tiếp cận thêm nguồn nhân lực có chuyên môn và các tập dữ liệu tùy chỉnh. Đồng thời, các trường đại học đối tác sẽ nhận được nguồn đầu tư, các ưu đãi tài chính và hướng dẫn chuyên môn từ Samsung.”
Giảm thiểu rào cản ngôn ngữ
SRI-B đã hợp tác với các đội ngũ trên toàn cầu để phát triển mô hình ngôn ngữ AI cho tiếng Anh Anh, tiếng Anh Ấn Độ, tiếng Anh Úc, cũng như tiếng Thái, tiếng Việt và tiếng Indonesia. Gần đây, các kỹ sư nòng cốt từ các trung tâm nghiên cứu Samsung ở các quốc gia khác đã đến thăm Bangalore, Ấn Độ – nơi đội ngũ SRI-B nâng cấp công nghệ để đưa tiếng Việt, tiếng Thái và Indonesia vào Galaxy AI, khiến cho SRI-B là lựa chọn lý tưởng để phát triển ngôn ngữ Hindi cho Galaxy AI.
Jakki chia sẻ rằng: “Mỗi ngôn ngữ đều có những thách thức riêng. Tuy nhiên, khi nghĩ đến mục tiêu cuối cùng là giúp mọi người giao tiếp với nhau bằng nhiều ngôn ngữ khác nhau, mọi nỗ lực đều trở nên xứng đáng. Chúng tôi rất háo hức khi có thể mang tiếng Hindi đến với Galaxy AI”.
Việc phát triển mô hình AI tiếng Hindi không hề đơn giản. Đội ngũ phát triển phải đảm bảo mô hình bao quát được hơn 20 phương ngữ vùng miền, ngữ điệu, dấu câu và các cách nói thông tục khác nhau. Ngoài ra, người nói tiếng Hindi thường pha trộn các từ ngữ tiếng Anh vào trong các cuộc trò chuyện của họ. Điều này yêu cầu đội ngũ phải thực hiện nhiều vòng huấn luyện mô hình AI với sự kết hợp của dữ liệu dịch thuật và phiên âm.
Jakki giải thích: “Hindi có cấu trúc ngữ âm phức tạp bao gồm retroflex — các âm được tạo ra bằng cách uốn cong lưỡi về phía sau trong miệng — yếu tố mà các ngôn ngữ khác hầu như không có. Để xây dựng yếu tố tổng hợp giọng nói cho giải pháp AI này, chúng tôi đã cẩn thận xem xét dữ liệu với các nhà ngôn ngữ học bản địa để có thể hiểu tất cả các âm thanh độc đáo, và tạo ra một bộ âm vị đặc biệt để hỗ trợ các phương ngữ cụ thể của ngôn ngữ này”.
Những nỗ lực hợp tác giữa Samsung và các đối tác học thuật đóng vai trò then chốt trong việc phát triển thành công mô hình ngôn ngữ AI phản ánh các sắc thái văn hóa của các vùng miền ở Ấn Độ. Viện Công nghệ Vellore đã giúp thu thập gần một triệu dòng dữ liệu âm thanh được phân đoạn và tuyển chọn về lời nói hội thoại, từ vựng và mệnh lệnh. Dữ liệu là thành phần quan trọng trong nhiệm vụ vô cùng quan trọng này: tích hợp ngôn ngữ được sử dụng nhiều thứ tư trên thế giới vào Galaxy AI. Việc hợp tác với các trường đại học giúp đảm bảo rằng Samsung đang sử dụng nguồn dữ liệu chất lượng cao nhất cho quá trình phát triển.
Tác động lớn từ việc kết nối toàn cầu
Dự án này là minh chứng cho triết lý hợp tác cởi mở của Samsung và niềm tin của hãng rằng việc chia sẻ kiến thức chuyên môn và góc nhìn sẽ mang đến những cải tiến hữu ích. Đối với SRI-B, điều này không chỉ bao gồm việc hợp tác với giới học thuật mà còn chia sẻ những hiểu biết và phương pháp tốt nhất với các trung tâm nghiên cứu Samsung khác trên toàn thế giới.
Jakki nhấn mạnh: “Tôi vô cùng tự hào về những thành tựu chúng tôi đã đạt được với sự giúp đỡ của các đối tác. Hợp tác để đổi mới sáng tạo trong lĩnh vực AI là một phần quan trọng trong chiến lược phát triển của chúng tôi. Chúng tôi sẽ tiếp tục tìm hiểu, thu thập và phân tích dữ liệu ngôn ngữ để tất cả mọi người đều có thể tiếp cận các công cụ AI trong tương lai”.
Nếu có thắc mắc liên quan đến dịch vụ khách hàng, xin truy cập https://www.samsung.com/vn/info/contactus để được trợ giúp.
Nếu có các câu hỏi liên quan đến báo chí, xin liên hệ qua địa chỉ xinchao.samsung@samsung.com.