लर्निंग कर्व 6 – इंडिया : एआई आविष्कारों के लिए सहयोग की राह
भारत में सैमसंग रिसर्च मोबाइल एआई के लोकतंत्रीकरण के पीछे के लोगों और नवाचारों के बारे में एक श्रृंखला का हिस्सा है
जैसा कि सैमसंग प्रीमियम मोबाइल एआई अनुभवों में अग्रणी बना हुआ है, हम यह जानने के लिए दुनिया भर के सैमसंग रिसर्च सेंटरों का दौरा करते हैं कि कैसे गैलेक्सी एआई अधिक उपयोगकर्ताओं को उनकी क्षमता को अधिकतम करने में सक्षम बना रहा है। गैलेक्सी एआई अब 16 भाषाओं का समर्थन करता है, इसलिए लाइव अनुवाद, इंटरप्रेटर, नोट असिस्ट और ब्राउजिंग असिस्ट जैसी सुविधाओं में ऑन-डिवाइस अनुवाद के कारण अधिक लोग ऑफ़लाइन होने पर भी अपनी भाषा क्षमताओं का विस्तार कर सकते हैं। लेकिन AI भाषा विकास में क्या शामिल है? पिछली बार, हमने यह जानने के लिए ब्राजील का दौरा किया था कि गैलेक्सी एआई को अधिक लोगों तक पहुंचाने के लिए टीमें संस्कृतियों और सीमाओं के पार कैसे काम करती हैं। इस बार, हम स्थानीय भागीदारों के साथ सहयोग के महत्व की खोज के लिए भारत में हैं।
भारत के चेन्नई में वेल्लोर इंस्टीट्यूट ऑफ टेक्नोलॉजी के अंदर भविष्य के ऑडियो उपकरणों से भरी एक प्रयोगशाला छिपी हुई है। किसी को पुतले मिलेंगे – जिन्हें उद्योग में सिर और धड़ सिमुलेटर के रूप में जाना जाता है – साथ ही बाइन्यूरल माइक्रोफोन और श्रवण उपकरण भी मिलेंगे। इन्हें उन्नत ध्वनि अवशोषण प्रणाली से उपचारित विशेष कक्षों में संग्रहित किया जाता है, जिससे यह प्रयोगशाला भारत में अपनी तरह की पहली प्रयोगशाला बन जाती है। कल्पना कीजिए कि ऐसी सुविधा का उपयोग नवीनतम उच्च-स्तरीय उच्च निष्ठा (हाई-फाई) उपकरण विकसित करने के लिए किया जाता है।
यहीं पर वेल्लोर इंस्टीट्यूट ऑफ टेक्नोलॉजी सैमसंग के साथ मिलकर डेटा और अंतर्दृष्टि का उत्पादन और विकास करता है जो गैलेक्सी एआई की भाषा क्षमताओं के लिए नवीनतम एआई मॉडल को शक्ति प्रदान करता है। यह सुविधा सैमसंग SEED (स्टूडेंट्स इकोसिस्टम फॉर इंजीनियर्ड डेटा) लैब्स के हिस्से के रूप में विकसित की गई थी – एक पहल जो भारत में विश्वविद्यालय के कर्मचारियों, छात्रों और प्रशिक्षुओं को 2021 से सैमसंग द्वारा अनुरोधित परियोजनाओं पर काम करने में सक्षम बनाती है। यह कई विश्वविद्यालय कार्यक्रमों में से एक है जो वित्त पोषित है। सैमसंग जिसमें छात्रों को कंपनी के तकनीकी विशेषज्ञों के साथ परियोजनाओं पर काम करने का अवसर मिलता है।
सैमसंग SEED की छात्रा याशिका इलनचेझियान कहती हैं, “एक छात्र के रूप में, मुझे सैमसंग जैसी प्रसिद्ध और सम्मानित कंपनी के साथ कई परियोजनाओं पर काम करना पसंद है।” “मुझे व्यावहारिक तरीके से नए कौशल सीखने का आत्मविश्वास मिला है और मुझे ऐसा महसूस हो रहा है कि मैं वर्तमान और भविष्य के उत्पादों में वास्तविक अंतर ला रहा हूं।”
सैमसंग आर एंड डी इंस्टीट्यूट इंडिया – बेंगलुरु (एसआरआई-बी) में भाषा एआई के प्रमुख गिरिधर जक्की कहते हैं, “इस तरह का सहयोग एक जीत की स्थिति है।” “विश्वविद्यालयों के साथ हमारी परियोजनाओं से ही हम अतिरिक्त विशेषज्ञता और कस्टम डेटासेट तक पहुंचने में सक्षम हैं। परिणामस्वरूप भागीदार विश्वविद्यालयों को सैमसंग से निवेश, वित्तीय प्रोत्साहन और विशेषज्ञ परामर्श प्राप्त होता है।”
भाषा संबंधी बाधाओं को कम करना
एसआरआई-बी ने ब्रिटिश, भारतीय और ऑस्ट्रेलियाई अंग्रेजी के साथ-साथ थाई, वियतनामी और इंडोनेशियाई के लिए एआई भाषा मॉडल विकसित करने के लिए दुनिया भर की टीमों के साथ सहयोग किया है। हाल ही में, अन्य सैमसंग अनुसंधान केंद्रों के कोर इंजीनियरों ने बैंगलोर, भारत का दौरा किया – जहां एसआरआई-बी टीम ने वियतनामी, थाई और इंडोनेशियाई को गैलेक्सी एआई में लाने के लिए प्रौद्योगिकी को बढ़ाने में मदद की। इसलिए एसआरआई-बी गैलेक्सी एआई के लिए हिंदी भाषा विकसित करने के लिए आदर्श स्थिति में था।
जक्की कहते हैं, ”हर भाषा की अपनी चुनौतियाँ होती हैं लेकिन जब आप लोगों को अन्य भाषाओं में संवाद करने की क्षमता लाने के अंतिम लक्ष्य पर विचार करते हैं, तो यह हर प्रयास के लायक है। हम गैलेक्सी एआई में हिंदी लाने के लिए उत्साहित थे।”
हिंदी AI मॉडल विकसित करना आसान नहीं था। टीम को यह सुनिश्चित करना था कि 20 से अधिक क्षेत्रीय बोलियाँ, तानवाला विभक्तियाँ, विराम चिह्न और बोलचाल की भाषाएँ शामिल हों। इसके अतिरिक्त, हिंदी भाषियों के लिए अपनी बातचीत में अंग्रेजी शब्दों का मिश्रण करना आम बात है। इसके लिए टीम को अनुवादित और लिप्यंतरित डेटा के संयोजन के साथ एआई मॉडल प्रशिक्षण के कई दौर आयोजित करने की आवश्यकता थी।
जक्की कहते हैं, “हिंदी में एक जटिल ध्वन्यात्मक संरचना है जिसमें रेट्रोफ़्लेक्स ध्वनियाँ शामिल हैं – जीभ को मुँह में वापस घुमाकर बनाई गई ध्वनियाँ – जो कई अन्य भाषाओं में मौजूद नहीं हैं। एआई समाधान के भाषण संश्लेषण तत्व का निर्माण करने के लिए, हमने सभी अद्वितीय ध्वनियों को समझने के लिए देशी भाषाविदों के साथ डेटा की सावधानीपूर्वक समीक्षा की और भाषा की विशिष्ट बोलियों का समर्थन करने के लिए फिनोम का एक विशेष सेट बनाया।”
सैमसंग और अकादमिक साझेदारों के बीच सहयोगात्मक प्रयास एआई भाषा मॉडल विकसित करने में सहायक थे जो भारत के क्षेत्रों की सांस्कृतिक बारीकियों को दर्शाता है। वेल्लोर इंस्टीट्यूट ऑफ टेक्नोलॉजी ने बातचीत के भाषण, शब्दों और आदेशों पर खंडित और क्यूरेटेड ऑडियो डेटा की लगभग दस लाख पंक्तियों को सुरक्षित करने में मदद की। दुनिया में चौथी सबसे अधिक बोली जाने वाली भाषा को गैलेक्सी एआई में शामिल करने जैसे महत्वपूर्ण कार्य के लिए डेटा एक महत्वपूर्ण घटक था। विश्वविद्यालयों के साथ काम करके यह सुनिश्चित किया गया कि सैमसंग उच्चतम गुणवत्ता वाले डेटा का उपयोग कर रहा है।
वैश्विक कनेक्शन बड़ा प्रभाव डालते हैं
यह प्रोजेक्ट सैमसंग के खुले सहयोग के दर्शन और कंपनी के इस विश्वास को पूरी तरह से समाहित करता है कि विशेषज्ञता और दृष्टिकोण साझा करने से सार्थक नवाचार सुनिश्चित होता है। एसआरआई-बी के मामले में, इसमें न केवल शिक्षा जगत के साथ काम करना शामिल है, बल्कि दुनिया भर के अन्य सैमसंग अनुसंधान केंद्रों के साथ अंतर्दृष्टि और सर्वोत्तम प्रथाओं को साझा करना भी शामिल है।
जक्की कहते हैं, ”हमने अपने साझेदारों की मदद से जो हासिल किया है, उस पर मुझे बेहद गर्व है। सहयोग के माध्यम से एआई नवाचार हम जो करते हैं उसका एक बड़ा हिस्सा है। हम भाषा डेटा को बेहतर ढंग से समझना, एकत्र करना और विश्लेषण करना जारी रखेंगे ताकि भविष्य में अधिक लोगों को एआई टूल तक पहुंच मिल सके।”
टैग्सGalaxy AIInterpreter languageLive TranslateSamsung R&D InstituteSamsung R&D Institute India-BangaloreText-to-speechVellore Institute of Technology
कॉरपोरेट > टेक्नोलॉजी
प्रोडक्ट्स > मोबाइल फोन
ग्राहक सेवा से संबंधित शिकायतों के लिए, samsung.com/in/support पर जाएं।
मीडिया से जुड़ी जानकारी के लिए, कृपया संपर्क करें corpcommindia@samsung.com