Hành Trình Tri Thức – Phần 4: Phát triển mô hình AI mới cho một ngôn ngữ đang phát triển

06/06/2024
Share open/close
Sao chép URL.

Câu chuyện tiếp theo trong loạt bài về những nhân tài và đổi mới đằng sau quá trình dân chủ hóa AI trên thiết bị di động sẽ mang chúng ta đến với Samsung Research tại Trung Quốc

 

Với nỗ lực tiên phong mang đến trải nghiệm AI cao cấp trên thiết bị di động, chúng tôi đã ghé thăm các Trung tâm Nghiên cứu của Samsung trên khắp thế giới để tìm hiểu cách Galaxy AI hỗ trợ nhiều người dùng khai phóng tiềm năng của mình hơn nữa. Galaxy AI hiện hỗ trợ 16 ngôn ngữ, mở ra cánh cửa giao tiếp không giới hạn ngay cả khi không có kết nối internet, nhờ vào các tính năng dịch thuật trên thiết bị như Phiên dịch trực tiếp, Trợ lý phiên dịch, Trợ lý Note quyền năng, và Hỗ trợ duyệt Web. Nhưng để đạt được những thành tựu ấn tượng đó, quá trình phát triển ngôn ngữ AI đòi hỏi những yếu tố nào? Trong phần trước, chúng ta đã đến thăm Việt Nam để tìm hiểu về quá trình chuẩn bị dữ liệu để đào tạo các mô hình AI. Tiếp nối hành trình này, chúng ta sẽ khám phá cách các đội ngũ chuyên gia tại Samsung đã mang đến trải nghiệm Galaxy AI độc đáo nhằm chinh phục cả thị trường Trung Quốc đại lục và Hồng Kông.

 

Sự phát triển nhanh chóng của các công cụ AI sử dụng những mô hình ngôn ngữ lớn (LLM) đang lan rộng trên toàn thế giới và Trung Quốc cũng không phải là ngoại lệ. Với sự ra mắt của ERNIE Bot của Baidu và MiracleVision của Meitu, Trung tâm R&D của Samsung tại Trung Quốc đã hợp tác với cả hai công ty này để phát triển các tính năng Galaxy AI dành riêng cho thị trường trong nước.

 

Trung tâm R&D của Samsung tại Quảng Châu (SRC-G) và Bắc Kinh (SRC-B) đã nỗ lực không ngừng để đảm bảo người dùng nói tiếng Quan Thoại ở Trung Quốc có thể tiếp cận trải nghiệm Galaxy AI như mọi người dùng khác trên toàn cầu, bất chấp sự khác biệt về công nghệ nền tảng. Bằng cách tận dụng nguồn dữ liệu chuyên sâu về các phương ngữ tiếng Trung từ đối tác, đội ngũ đã xây dựng thành công một giải pháp Galaxy AI độc đáo cho thị trường Trung Quốc.

 

Hairong Zhang, Giám đốc nhóm Phát triển Phần mềm tại SRC-G, cho biết: “Chúng tôi sở hữu lợi thế riêng biệt khi kết hợp những phương pháp tối ưu trên toàn cầu với văn hóa địa phương của Trung Quốc, đồng thời tạo nên các tính năng mới và không ngừng cải tiến chúng thông qua giao tiếp hàng ngày với người tiêu dùng Trung Quốc. Với kinh nghiệm dày dặn tích lũy từ quá trình phát triển Galaxy S24, tôi tự hào về cách đội ngũ của chúng tôi đã hợp tác với các công ty AI địa phương của Trung Quốc như Baidu và Meitu để tạo nên một giải pháp AI trên thiết bị di động đột phá, được đón nhận tích cực ở Trung Quốc”.

 

 

Từ ban đầu, các nhóm phải dành thời gian để làm quen với cách làm việc của nhau và giải quyết những bất đồng ban đầu do sự khác biệt về thông tin. Daijun Zhang, Giám Đốc SRC-B, đã thành lập một nhóm đặc nhiệm để đảm bảo dự án tuân theo tiến độ phát triển và nhanh chóng đạt được các mục tiêu đề ra. 

 

 

Nhờ kinh nghiệm của đội ngũ Bắc Kinh trong việc tạo ra các mô hình quy mô lớn và sự hợp tác thành công với các đối tác bên thứ ba, tất cả các tính năng AI tạo sinh đã được ra mắt thành công ở Trung Quốc, tạo ra một giải pháp phù hợp với thị trường như tính năng Chạm để tìm kiếm (Touch to Search).

 

 

Phát triển phương ngữ Quảng Đông dựa trên tiếng Quan Thoại

Tiếng Trung Quốc phổ thông (Quan Thoại), đã được tích hợp thành công vào Galaxy AI khi Galaxy S24 ra mắt vào tháng 1 năm 2024. Tuy nhiên, công việc của Trung tâm Samsung R&D tại Trung Quốc vẫn chưa hoàn tất. Đội ngũ tiếp tục đảm nhận công việc đầy thách thức: phát triển mô hình AI cho tiếng Trung Quốc tại Hồng Kông (tiếng Quảng Đông), một phương ngữ có gốc từ tiếng Quan Thoại nhưng lại sở hữu những đặc trưng ngôn ngữ độc đáo và khác biệt.

 

 

Trong quá trình phát triển mô hình AI tiếng Quảng Đông, đội ngũ R&D tại Trung Quốc đã phải đối mặt với những rào cản văn hóa đáng kể. Thách thức đầu tiên đến từ sự tồn tại của hai hệ thống chữ viết và nói riêng biệt. Người dân Hồng Kông sử dụng ngữ pháp và cách diễn đạt tương đồng với tiếng Quan Thoại khi viết, nhưng lại chuyển sang một hệ thống ngữ pháp hoàn toàn khác trong giao tiếp hàng ngày. Bên cạnh đó, tiếng Quảng Đông có hệ thống âm điệu phức tạp với chín thanh, trong khi tiếng Quan Thoại chỉ có bốn.

 

Một yếu tố văn hóa khác cũng cần lưu ý là sự phát triển của tiếng Quảng Đông theo thời gian. Người dân Hồng Kông thường kết hợp tiếng Quảng Đông với tiếng Anh trong giao tiếp, khiến việc xây dựng các trường hợp thử nghiệm và xác nhận các gói ngôn ngữ trở nên phức tạp hơn.

 

 

Jing Li, người dẫn đầu hoạt động thử nghiệm giải pháp AI tiếng Quảng Đông, cho biết: “Tiếng Quảng Đông là một phương ngữ đặc sắc với sự đa dạng về biến thể vùng miền. Từ tiếng lóng, cụm từ, từ vựng đến ngữ điệu đều có thể khác biệt đáng kể giữa các khu vực. Do đó, để đảm bảo tính chính xác và phù hợp với thị trường Hồng Kông, đội ngũ đã tiến hành một quá trình xác minh dữ liệu quy mô lớn, bao gồm việc kiểm tra hàng chục nghìn trường hợp thử nghiệm liên quan”.

 

 

Nhận thức được sự phức tạp này, SRC-G và SRC-B đã hợp tác chặt chẽ để phát triển một mã code kết hợp chuyên sâu giữa tiếng Quảng Đông và tiếng Anh, để không chỉ nâng cao khả năng nhận diện giọng nói mà còn hỗ trợ cả văn viết và nói trong dịch máy, đồng thời phản ánh chính xác cách phát âm hiện tại trong quá trình tổng hợp giọng nói.

  

 

Tác động văn hóa của việc giao tiếp

Khi Galaxy AI ra mắt với ngôn ngữ Trung Quốc (Hồng Kông), sự đón nhận nồng nhiệt của người dùng là minh chứng rõ nét cho những nỗ lực không ngừng nghỉ của đội ngũ tại Trung tâm Samsung R&D.

 

Thành công của Galaxy AI tại Trung Quốc đại lục và Hồng Kông chứng minh rằng, một thương hiệu toàn cầu như Samsung cần phải am hiểu văn hóa và ngôn ngữ địa phương cũng như hợp tác với các tổ chức khác để phát triển sản phẩm phù hợp. Đặc biệt, ở Hồng Kông, tiếng Quảng Đông không chỉ là ngôn ngữ giao tiếp mà còn là một phần không thể thiếu trong bản sắc văn hóa của người dân. Chính vì vậy, việc phát triển một mô hình ngôn ngữ AI chính xác và phù hợp với tiếng Quảng Đông là rất quan trọng.

 

Henry Wat, người đứng đầu nhóm kỹ thuật tại Samsung Electronics Hồng Kông, chia sẻ rằng: “Ngôn ngữ và giao tiếp đóng vai trò then chốt ở mọi khu vực và trong mọi lĩnh vực của cuộc sống. Bất kể ngôn ngữ nào hay công cụ nào có thể giúp mọi người giao tiếp đều có giá trị vô cùng to lớn. Tôi tin rằng công việc của chúng tôi đã góp phần mang lại những giá trị ý nghĩa cho cộng đồng.”

 

 

Trong phần tiếp theo của Hành Trình Tri Thức, chúng ta sẽ đến với Brazil để khám phá cách đội ngũ tại đây làm việc xuyên văn hóa và biên giới để mang Galaxy AI đến với người dùng.

Doanh nghiệp > Công nghệ

Sản phẩm > Di động

Nếu có thắc mắc liên quan đến dịch vụ khách hàng, xin truy cập https://www.samsung.com/vn/info/contactus để được trợ giúp.
Nếu có các câu hỏi liên quan đến báo chí, xin liên hệ qua địa chỉ xinchao.samsung@samsung.com.

Xem qua những câu chuyện mới nhất về Samsung

Tìm hiểu thêm
Lên đầu trang