काठमाडौं विश्वविद्यालयको त्रैभाषिक मेसिन अनुवाद परियोजना सफलतापूर्वक सम्पन्न
Advertisement 1

ललितपुर, असार २ गते । काठमाडौं विश्वविद्यालयअन्तर्गत सूचना तथा भाषा प्रशोधन अनुसन्धान प्रयोगशाला (ILPRL) ले गुगलको सहयोगमा सञ्चालन गरेको ‘त्रैभाषिक मेसिन अनुवाद (TMT)’ परियोजना सफलतापूर्वक सम्पन्न गरेको छ। परियोजनाको समापन समारोह मंगलबार ललितपुरको कुपण्डोलस्थित हिमालय होटलमा आयोजना गरिएको थियो।
गुगल एकेडेमिक रिसर्च अवार्ड २०२४ अन्तर्गत ‘सोसाइटी–सेन्टर्ड एआई’ पहलमार्फत वित्तीय सहयोग प्राप्त उक्त परियोजनाले नेपालका भाषिक समुदायबीचको डिजिटल दूरी कम गर्ने दिशामा महत्वपूर्ण उपलब्धि हासिल गरेको आयोजकले जनाएको छ। कार्यक्रममा शैक्षिक क्षेत्र, सरकारी निकाय, गैरसरकारी संस्था, उद्योग क्षेत्र तथा कूटनीतिक नियोगका प्रतिनिधिसहित एक सयभन्दा बढी विशिष्ट व्यक्तिहरूको सहभागिता रहेको थियो।
परियोजनाअन्तर्गत विकसित त्रिभाषिक मेसिन अनुवाद प्रणालीले नेपाली, तामाङ र अंग्रेजी भाषाबीच स्वचालित रूपमा अनुवाद गर्न सक्ने क्षमता राख्छ। यसले विशेषगरी भाषिक रूपमा पछाडि परेका समुदायलाई सूचना, ज्ञान तथा सार्वजनिक सेवामा सहज पहुँच पुर्याउने लक्ष्य लिएको छ।

काठमाडौं विश्वविद्यालयले त्रिभुवन विश्वविद्यालयको केन्द्रीय भाषा विज्ञान विभाग तथा तामाङ राष्ट्रिय पुस्तकालय (TaRaaPu) सँगको सहकार्यमा दुई वर्षको अवधिमा एक लाखभन्दा बढी समानान्तर वाक्यहरूको ‘गोल्ड स्ट्यान्डर्ड’ कोर्पस निर्माण गरेको थियो। उक्त सामग्री कृषि, शिक्षा, स्वास्थ्य, संस्कृति तथा पर्यटन र सामान्य सञ्चारलगायत पाँच प्रमुख क्षेत्रमा आधारित रहेको जानकारी दिइयो।
समारोहमा परियोजनाका प्रमुख अनुसन्धानकर्ता प्रा. डा. बालकृष्ण बलले परियोजनाको विस्तृत प्रस्तुति तथा प्रत्यक्ष प्रदर्शन गर्दै समुदायको सहभागितामा विकसित गरिएको यो प्रणालीले स्थानीय सरकार, विद्यालय तथा मातृभाषा संरक्षणका क्षेत्रमा महत्वपूर्ण योगदान पुर्याउने विश्वास व्यक्त गरे।
परियोजनामा मेटा एआईको खुला स्रोत NLLB-200 (No Language Left Behind) मोडेललाई अनुसन्धान टोलीले तयार पारेको डाटासेटमार्फत थप परिष्कृत गरिएको छ। हाल सार्वजनिक रूपमा सञ्चालनमा रहेको प्रणालीले वास्तविक समयमै पाठ अनुवाद, वेबसाइटका सम्पूर्ण पृष्ठहरूको अनुवाद, PDF तथा DOCX फाइल अनुवाद र प्रयोगकर्ताबाट प्रतिक्रिया संकलन गर्ने सुविधा प्रदान गर्दछ।
परियोजनाको सफलतामा समुदायको सक्रिय सहभागिता महत्वपूर्ण रहेको बताइएको छ। सन् २०२५ मा बीटा परीक्षण, ह्याकाथन तथा भाषा आयोग, प्रधानमन्त्री तथा मन्त्रिपरिषद्को कार्यालयअन्तर्गतको सूचना प्रविधि विभाग (DoIT) र बागमती प्रदेश सरकारसँग परामर्शात्मक कार्यक्रमहरू सञ्चालन गरिएको थियो।
यस परियोजनासँग सम्बन्धित विभिन्न अनुसन्धानात्मक लेखहरू अन्तर्राष्ट्रियस्तरका प्रतिष्ठित सम्मेलनहरू LREC 2026, SPELL 2025 र EAMT 2026 मा प्रकाशित तथा स्वीकृत भएका छन्।
कार्यक्रममा वरिष्ठ भाषाविद् तथा तामाङ भाषा अभियन्ता अमृत योञ्जन तामाङले परियोजनासँग जोडिएका अनुभव साझा गरेका थिए। साथै प्रा. डा. मनीष पोखरेल र प्रा. डा. सुदन झाले परियोजनाको उपलब्धि र यसको दीर्घकालीन प्रभावबारे धारणा राखेका थिए।
समारोहका प्रमुख अतिथि वरिष्ठ भाषाविद् प्रा. डा. माधव पोखरेलले आधुनिक प्रविधिमार्फत भाषाको संरक्षण, प्रवर्द्धन र पुस्तान्तरणमा परियोजनाले खेलेको भूमिकाको प्रशंसा गर्दै यस्ता अनुसन्धानले नेपालका भाषिक सम्पदाको संरक्षणमा नयाँ सम्भावना सिर्जना गरेको बताए।
सह-प्रमुख अनुसन्धानकर्ता प्रा. डा. बलराम प्रसाईंको धन्यवाद मन्तव्यसँगै सम्पन्न कार्यक्रममा आगामी दिनमा थप आदिवासी तथा स्थानीय भाषाहरूलाई प्रणालीमा समेट्ने, स्वचालित वाणी पहिचान (ASR) र टेक्स्ट-टु-स्पिच (TTS) प्रविधि विकास गर्ने तथा भविष्यमा उक्त प्रणालीलाई Google Translate मा समावेश गराउने सम्भावनाबारे समेत जानकारी गराइएको थियो।
नेपालका स्थानीय भाषालाई आधुनिक प्रविधिसँग जोड्दै डिजिटल समावेशीकरणको नयाँ अध्याय सुरु गरेको यो परियोजनालाई भाषा संरक्षण तथा कृत्रिम बुद्धिमत्ता क्षेत्रमा महत्वपूर्ण कोशेढुङ्गाका रूपमा हेरिएको छ।



प्रतिक्रिया दिनुहोस्