[Chia sẻ từ Chuyên gia về AI – 3] Tầm nhìn là sự nhận thức về thế giới
Bạn có thể tưởng tượng ra một thế giới mà trợ lý AI cá nhân trên chiếc điện thoại thông minh có khả năng hiểu nhiều về thế giới như bạn không? Thế còn viễn cảnh mà việc giao tiếp với trợ lý AI trở nên tự nhiên và dễ dàng như tương tác với một người khác thì sao? Phát triển các khả năng đó chính là những gì mà Trung tâm AI của Samsung ở Toronto đang nỗ lực nghiên cứu.
Samsung Newsroom đã có một buổi trò chuyện cùng với Sven Dickinson, Giám đốc Trung tâm AI của Samsung tại Toronto để tìm hiểu thêm về các lĩnh vực thú vị này và ý nghĩa của chúng trong tương lai.
Tầm nhìn về thị giác
Trung tâm AI Samsung tại Toronto là Trung tâm AI Samsung thứ hai được thành lập ở Bắc Mỹ, đứng đầu bởi Tiến sĩ Sven Dickinson, một chuyên gia về thị giác máy tính và là cựu chủ tịch của Khoa Khoa học Máy tính tại Đại học Toronto.
Tại tâm điểm của quá trình nghiên cứu và phát triển AI, Trung tâm AI Samsung tại Toronto chủ yếu tập trung vào phát triển các khả năng hiểu trực quan, cho phép thiết bị Samsung hiểu được thế giới xung quanh nó. Ngoài ra, nhóm còn đang nghiên cứu về các tương tác đa phương thức, đó là các tương tác giữa người dùng và máy móc liên quan đến thị giác, ngôn ngữ và kiến thức.
“Việc cho phép các thiết bị của Samsung ‘quan sát thế giới’ thông qua thị giác máy tính giúp các đoạn hội thoại của AI với người dùng trở nên thực tế, tạo ra một trải nghiệm đa phương thức tự nhiên hơn nhiều so với một thiết bị chỉ dựa trên hình ảnh hoặc văn bản” Dickinson, chuyên gia trong việc khám phá các vấn đề xung quanh khả năng nhận thức hình dạng và nhận dạng vật thễ, cho biết.
Nhắc đến lợi ích của công nghệ đa phương thức, Dickinson tuyên bố rằng, “Tôi không cần phải đọc hướng dẫn sử dụng để tìm ra nút nào cần ấn trên thiết bị của mình và theo thứ tự nào. Thay vào đó, tôi có thể chỉ cho thiết bị của mình những gì tôi muốn và nói với thiết bị tôi muốn làm gì, bằng ngôn ngữ tự nhiên dễ hiểu trong cuộc sống hằng ngày của tôi.
Suy đoán về sự tương tác giữa thị giác máy tính và tương tác đa phương thức, ông tiếp tục nói rằng, “Để đạt được sự hiểu biết sâu rộng này, thiết bị phải có một mô hình về sự hiểu biết của tôi về thế giới, khả năng giao tiếp mạnh mẽ và tự nhiên với tôi, và khả năng nhìn và hiểu cùng một thế giới mà tôi thấy.
Nhận xét về các ứng dụng cho công nghệ này, Dickinson cho rằng ứng dụng này có thể được miểu tả như là “một trợ lý cá nhân mà bạn không chỉ có thể nói chuyện mà còn có cách nhìn thế giới giống như bạn”. Nói về tầm quan trọng của tương tác thiết bị đa phương thức, Dickinson chỉ ra việc hủy bỏ một trong các phương thức giao tiếp (âm thanh, lời nói, thị giác, v.v.) sẽ cản trở việc giao tiếp giữa hai bên và nói rằng điều đó cũng áp dụng cho các thiết bị cá nhân.
Trải nghiệm người dùng được nâng cao là yếu tố chính
Tại Triển lãm Điện tử tiêu dùng 2019 (CES), Samsung đã tiết lộ kế hoạch của họ về Connected Living, bao gồm việc kết nối 500 triệu thiết bị mà công ty bán ra mỗi năm và khiến chúng trở nên thông minh. Dickinson nhấn mạnh rằng danh mục sản phẩm to lớn của Samsung sẽ là công cụ để thực hiện tầm nhìn này, và nói rằng “điểm khác biệt của Samsung là họ tạo ra vô số thiết bị gia dụng, bao gồm cả thiết bị kỹ thuật số, TV và điện thoại di động. Samsung có cơ hội độc nhất để tận dụng các thiết bị này nhằm mang lại trải nghiệm đa thiết bị theo người dùng từ thiết bị này sang thiết bị khác và phòng này sang phòng khác. Điều này sẽ giúp hiện thực hoá tiềm năng đầy đủ của từng thiết bị để giao tiếp hiệu quả, giúp người dùng thực hiện các tác vụ cụ thể của thiết bị và tìm hiểu thói quen và sở thích của người dùng để những lần giao tiếp tiếp theo không trở nên phiền phức mà thay vào đó, ‘luôn hữu ích.’”
Nói về những gì mà trung tâm của ông sẽ cần phải làm để hiện thực hoá thị giác máy tính và tương tác đa phương thức, Dickinson nhận xét rằng, “Thị giác ở đây không phải là khả năng hiểu hình hảnh; mà có thể được hiểu là sự nhận thức về thế giới xung quanh. Các hệ thống AI tốt phải có sự hiểu biết về thế giới của chúng ta, về vật lý và quan hệ nhân quả, về hình học và động lực học của nó. Hệ thống AI còn phải có khả năng bắt chước và hiểu hành vi của con người.” Ông còn chỉ ra rằng, “nếu các thiết bị có thể nhìn thấy thế giới ở dạng 3D mà chúng ta đang sống, nghĩa là hiểu các hình dạng 3D, vị trí và đặc tính của các đối tượng trong môi trường chung của chúng ta, thì các thiết bị có thể trải nghiệm thế giới giống con người. Một viễn cảnh như vậy sẽ rất quan trọng trong việc phát triển các trợ lý cá nhân có nhận thức đầy đủ.
Dickinson nói rằng Samsung đang dẫn đầu về khả năng hiểu biết trực quan thông minh và xác định ‘khoanh vùng trực quan’ là điều kiện tiên quyết cần thiết cho khả năng hiểu hình ảnh toàn diện. “Samsung đang dẫn đầu trong quá trình phát triển khả năng tương tác giữa người và thiết bị nhằm mô phỏng chính xác tương tác giữa người và người,” ông Dickinson cho biết, “Chúng tôi mong muốn cung cấp nền tảng trực quan và nền móng cho dịch vụ tương tác dựa trên hộp thoại. Nếu không có những quá trình này, người dùng sẽ thất vọng với các dịch vụ và nhanh chóng ngưng sử dụng.
Tương tác giữa người với thiết bị dựa trên chia sẻ thông tin mở
Dickinson tiếp tục giải thích rằng AI cũng cần có khả năng tự giải thích cho người dùng. Ông lưu ý rằng, sau khi không thực hiện một tác vụ hoặc đưa ra phản hồi phù hợp, “một thiết bị có thể phản ánh chính xác với người dùng về cách thức và lý do tại sao nó đưa ra phản hồi đó (hoặc không đưa ra phản hồi). Lý tưởng nhất là thiết bị có thể tiếp tục giao tiếp với người dùng bằng cách đặt câu hỏi hoặc nhờ người dùng điều chỉnh máy ảnh hoặc các chế độ tương tác khác để có thể thu thập thêm thông tin và tạo ra phản hồi thích hợp.” Ông Dickinson cho biết tính chất mở và sự chia sẻ thông tin này sẽ là chìa khóa cho sự tinh vi hơn nữa trong việc tương tác giữa người và thiết bị, ông lưu ý rằng “lĩnh vực mà chúng ta gọi là ‘đối thoại tích cực và tầm nhìn tích cực’ là nơi hệ thống có thể xây dựng một mô hình tinh thần về những gì người dùng hiểu và dựa vào đó có thể mở ra mô hình tinh thần của chính mình để người dùng có thể hiểu được các quá trình suy nghĩ của thiết bị.”
Lợi ích của việc đặt trụ sở tại Toronto
Khi được hỏi về việc trụ sở tại Toronto ảnh hưởng đến trung tâm AI như thế nào, Dickinson nhận xét rằng trung tâm này có rất nhiều lợi ích do nằm gần các tổ chức liên quan đến AI đẳng cấp thế giới, bao gồm Đại học Toronto, Đại học York và Đại học Ryerson. “Việc có trụ sở tại Toronto mang đến cho chúng tôi lợi thế to lớn,” Ông nhận xét, “chúng tôi nằm đối diện Đại học Toronto, ngôi nhà của khoa Khoa học Máy tính (DCS), vốn là một trong 10 trung tâm khoa học máy tính quốc tế hàng đầu. Hơn một nửa số thành viên Trung tâm AI của chúng tôi là giảng viên, sinh viên tốt nghiệp hoặc sinh viên đang theo học tại DCS.
Về chủ đề hợp tác giữa các trung tâm AI toàn cầu của Samsung, Dickinson cho biết, “bảy trung tâm AI toàn cầu đang nỗ lực tạo ra các giải pháp hàng đầu trong lĩnh vực trọng tâm của họ, đồng thời phối hợp để đạt được mục tiêu chung là hiện thực hóa ý tưởng về AI của Samsung. Nhắc đến chủ đề trung tâm AI ở Toronto hợp tác với các trung tâm AI tại các quốc gia khác, Dickinson nói rằng, “Chúng tôi hiện đang bắt đầu lên kế hoạch hợp tác nghiên cứu với các trung tâm AI toàn cầu khác. Và cùng với đó, chúng tôi hy vọng sẽ tạo ra những giá trị cùng với Samsung và các sản phẩm, dịch vụ của hãng.”
TAGSAIAI Expert VoicesAI ExpertsSamsung AI CenterSamsung ResearchSven DickinsonToronto AI CenterVisual Understanding
Doanh nghiệp > Con người & Văn hóa
Doanh nghiệp > Công nghệ
Nếu có thắc mắc liên quan đến dịch vụ khách hàng, xin truy cập https://www.samsung.com/vn/info/contactus để được trợ giúp.
Nếu có các câu hỏi liên quan đến báo chí, xin liên hệ qua địa chỉ xinchao.samsung@samsung.com.