त्रिभुवन विश्वविद्यालयअन्तर्गतको एमएससी सीएसआईटीका उपप्राध्यापक हुन्, तेजबहादुर शाही । उनी डेटा साइन्स एन्ड मेसिन लर्निङ कम्युनिटी नेपाल (एमएलडीएसएन)को क्रिएटिभ टिमका सदस्य पनि हुन् । डेटा साइन्स र मेसिन लर्निङ जस्तो प्राविधिक विषयमा काम गर्दै आएको यो संस्था २०१८ मा उपप्राध्यापक शाही, सहकर्मी सूर्य बस्नेत र जर्मनीमा डेटा साइन्टिस्टका रुपमा कार्यरत डा. झनक पराजुलीको पहलमा स्थापना भएको हो । सोही संस्था एमएलडिएसएनले जुलाई १० देखि १४ गतेसम्म किस्ट कलेजमा डेटा साइन्स एन्ड मेसिन लर्निङको नेसनल वर्कसपको दोस्रो संस्करण आयोजना गरेको थियो । सोही सन्दर्भमा डेटा साइन्स र मेसिन लर्निङको अवधारणा, प्रयोग, क्षेत्र र भविष्यबारे शाहीसँग क्यापिटल नेपालकी युजु खालिङले गरेको कुराकानीको सम्पादित अंश :
मेसिन लर्निङ र डेटा साइन्सलाई सर्वसाधारणले कसरी बुझ्ने ?
डेटा साइन्स भनेको विशेषगरी डेटा एक्सप्लोरेसन हो । विभिन्न सेन्सर, मिडियाबाट मानिसले डेटा संकलन गरिरहेका हुन्छन् । तिनलाई इन्साइटफुल ज्ञान अर्थात् उपयोगी हुने किसिमका तथ्यांकहरुमा कसरी रुपान्तरण गर्ने विषय नै डेटा साइन्स हो । जस्तो कसैले फेसबुक प्रयोग गर्छ र उसले फेसबुकमा लाइक गर्ने पेज, सेयर र पोस्ट गर्ने कन्टेन्ट र पढ्ने सामग्री आदिका आधारमा फेसबुकले उसको डेटा संकलन गरेर उसैलाई उपयुक्त हुने विज्ञापन र कनेन्ट पठाइरहेको हुन्छ । त्यो पनि एक प्रकारको डेटा साइन्स नै हो । यो केसमा फेसबुकको दृष्टान्त डेटा साइन्सको एउटा एप्लिकेसन हो । यो कार्य ब्याक इन्डमा फेसबुकको कर्पोरेट अफिसमा बसिरहेका डेटा साइनटिस्टहरुले गर्छन् । उनीहरुले डेटलाई एनालिसिस एक्सप्लोर गर्छन् । त्यसपछि सेवाग्राहीलाई वर्गीकरण गरेर त्यसैअनुसारको कुन सेवाग्राहीले के एप चलाइरहेको छ, कस्तो फोटो र विज्ञापनहरुमा लाइक गरिरहेको छ, त्यसको अध्ययन गरेर त्यहीअनुसारको सामग्री र उत्पादन कम्पनीले सेवाग्राहीलाई प्रदान गर्छ ।

डेटालाई एनालिसिस गरिसकेपछि आएको परिणामलाई कम्प्युटरले अटोमेटिक रुपमा कसरी सेवाग्राही अथवा प्रयोगकर्तासम्म पुर्याउँछ, प्रयोगकर्तालाई कसरी फिल्टर गर्ने त्यो कुरा मेसिन लर्निङको पाटोमा आउँछ । हामी डेटा मेसिनलाई दिन्छौं, गलत डेटा दियो भने मेसिनले गलत नै पढ्छ । हामीले मेसिनलाई करेक्ट डेटा दिनुपर्यो र त्यो करेक्ट डेटा बनाउने काम डेटा साइन्टिस्टहरुले गर्छन् । यसलाई डेटा क्लिनिङ, डेटा प्रिप्रोसेसिङ भनिन्छ । डेटाका काम नलाग्ने तत्वहरु हटाउने र राम्रो स्वरुपमा ल्याउने काम डेटा साइन्टिस्टले गर्छन् । डेटा साइन्सको काम सकिसकेपछि त्यो डेटा मेसिनलाई दिएर लर्न गराउनुपर्छ, जसलाई मेसिन लर्निङ भनिन्छ । सामान्य मानिसहरुले बुझ्ने भाषामा मेसिन लर्निङलाई एआई अर्थात् आर्टिफिसियल इन्टेलिजेन्स, रोबोटिक्स भनिन्छ । रोबोटलाई पनि सुरुमा सिकाउनुपर्यो, सिकाउनका लागि सुरुमा हामीले त्यसलाई डेटा, इन्फर्मेसन अथवा त्यससम्बन्धी ज्ञान दिनुपर्छ । त्यो ज्ञान दिइसकेपछि उसले केही कुरा सिक्छ । उसले सिक्ने तरिका नै मेसिन लर्निङ हो ।
हाम्रोमा म्याथम्याटिक्स, लिनियर अल्जेब्रा, स्टाटिस्टिक्स , कम्प्युटर साइन्स र आर्टिफिसियल इन्टेलिजेन्स (एआई) आदि सबैको कम्बिनेसनलाई हामी मेसिन लर्निङ भन्छौं । मेसिन लर्निङ कम्प्युटर साइन्सको एउटा विशिष्टीकृत पाटो हो, जसले कम्प्युटरलाई, सफ्टवेयरलाई कसरी इन्टेलिजेन्ट बनाउने भन्ने मात्र कुरा गर्छ । यो इन्टेलिजेन्स भनेको हामीले कम्प्युटर वा सफ्टवेयरलाई पर्याप्त डेटा दियौं भने त्यसले डेटाबाट अटोमेटिक रुपमा केही कुरा सिक्न सक्छ कि सक्दैन भन्ने हो । पहिले पहिले कम्प्युटरलाई हामीले केही प्रोग्राम लेखिदिन्थ्यौं । तब कम्प्युटरले त्यो प्रोग्राममा जस्तो कोड लेखेको छ, त्यसअनुसार मात्र काम गर्छ । यसको अर्थ प्रत्येक कुरा कम्प्युटरको प्रोग्रामरले कम्प्युटरलाई लेखिदिनुपर्यो, कम्प्युटरसँग आफ्नो दिमाग केही पनि थिएन, कम्प्युटरले प्रोग्रामरले जे भन्यो त्यहीँ मात्र गर्न सक्छ भन्ने थियो । तर योभन्दा एक कदम अघि मेसिन लर्निङ विकास भएको छ, जहाँ कम्प्युटरलाई सबै कुरा प्रोग्रामरले प्रोग्राम गरिदिँदैन, प्रोग्रामरले डेटा मात्र दिन्छ र मेसिन लर्निङ एल्गोरिदम डिजाइन गरिदिन्छ । त्यो एल्गोरिदमले डेटाअनुसार अटोमेटिक लर्न गर्न थाल्छ । जस्तो उदाहरणका लागि कसैले एउटा एल्गोरिदम यस्तो डिजाइन गर्याे, जहाँ पाँचओटा तस्बिर देखाउँदा त्यो तस्बिरमा भएका नक्सा देखेर कम्प्युटरले यस्तो नक्साहरु देखापर्यो भने त्यो बिरालो हुँदो रहेछ भनेर त्यसले सिक्न सकोस् । पहिले त्यहाँ पाँचओटा बिरालोको तस्बिर देखाइन्छ र कम्प्युटरले बिरालोको शारीरिक ढाँचा सिक्छ । त्यसपछि फेरि नयाँ तस्बिर देखाइयो भने त्यसमा बिरालोको नक्सा ढाँचा छ वा छैन भन्ने कुरा कम्प्युटरले सजिलै भन्न सक्छ ।
नेपालमा कहिलेदेखि औपचारिक रुपमा डेटा साइन्सको विषय पढाइ हुन थालेको हो ?
विभिन्न विश्वविद्यालय र कलेजले कम्प्युटर साइन्स, कम्प्युटर इन्जिनियरिङ सुरु भएदेखि यो एआई अथवा प्रोग्रामिङ जस्ता विषय पढाउँदै आएका छन् । तर यो मेसिन लर्निङ र डेटा साइन्स भनेर स्पेसल कोर्स धेरै कमले मात्र चलाएका छन् । स्नातक तहमा त छँदै छैन । मास्टर्सको कुरा गर्दा त्रिभुवन विश्वविद्यालयको एमएससी सीएसआईटीको कोर्समा मेसिन लर्निङको कोर्स नै छ हामीसँग, डेटा साइन्सको भने हाम्रोमा छैन । डेटा साइन्स भर्खरै आएको हुनाले यो भिन्दै कोर्सका रुपमा लन्च भइसकेको छैन । तर मलाई लाग्छ अब सायद निकट भविष्यमा यो लन्च हुनेछ । डेटा साइन्समा धेरै विद्यार्थीको रुचि र स्कोप पनि धेरै भएको कारण सायद केही विश्वविद्यालय वा हाम्रै विश्वविद्यालयले पनि यसलाई चलाउन सक्छन् ।
हाम्रो विश्वविद्यालयले डेटा साइन्स नै भनेर त मास्टर्स ब्याचलर्समा कुनै कोर्स राखेको छैन । तर यसलाई सहयोग गर्ने केही कोर्स स्टाटिस्टिक्स, म्याथमेटिक्स भने यहाँ अध्ययनअध्यापन हुने गरेको छ ।
डेटा साइन्सको विषयमा बुझ्दा यो अहिलेको व्यापक मागमा रहेको ट्रेन्डिङको विषय देखियो, किन यसको माग यति व्यापक र ट्रेन्डिङमा छ ?
गत वर्ष स्विट्जरल्यान्डमा सम्पन्न वल्र्ड इकोनमिक फोरम २०१८ को ४८औं संस्करणमा विश्वकै अत्यधिक माग रहेको पेसाको सूचीमा डेटा साइटिस्ट पहिलो स्थानमा सूचीकृत भएको थियो । यसबाट पनि हामी बुझ्न सक्छौं यसको क्षेत्र कति व्यापक र विस्तार हुँदै गएको छ । यो किन व्यापक भयो भन्ने प्रश्नमा अहिले इन्टरनेटका कारण धेरै उपकरण इन्टरनेटमा जोडिएका हुन्छन् । इन्टरनेट प्रयोगकर्ता पनि विश्वमा धेरै छन् । ती प्रयोगकर्ताले प्रत्येक दिन केही न केही डेटा इन्टरनेटमा फिड गरिरहेकै हुन्छन् । जस्तो सामाजिक सञ्जाल वा सर्च इन्जिनका माध्यमबाट हरेक किसिमले डेटाहरु ठुल्ठूला सफ्टवेयर कम्पनीहरुमा पुगिरहेको छ । उनीहरु डेटालाई इन्धनका रुपमा मान्छन् ।
हाम्रोमा म्याथम्याटिक्स, लिनियर अल्जेब्रा, स्टाटिस्टिक्स , कम्प्युटर साइन्स र आर्टिफिसियल इन्टेलिजेन्स (एआई) आदि सबैको कम्बिनेसनलाई हामी मेसिन लर्निङ भन्छौं । मेसिन लर्निङ कम्प्युटर साइन्सको एउटा विशिष्टीकृत पाटो हो, जसले कम्प्युटरलाई, सफ्टवेयरलाई कसरी इन्टेलिजेन्ट बनाउने भन्ने मात्र कुरा गर्छ ।
डेटा भएपछि त्यसलाई प्रोसेसिङ गरेर हामी केही काम लाग्ने आउटपुट निकाल्न सक्छौं । पर्याप्त मात्रामा डेटा उपलब्धताका कारण त्यसबाट इन्फर्मेसन र उपयोगी आउटपुट निकाल्न आवश्यक पर्ने भएकाले बजारमा डेटा साइन्टिस्टको माग बढेको छ । विशेषगरी यसको प्रयोग डिजिटल मार्केटिङ र विज्ञापनमा हुन्छ । अनुसन्धानमा पनि यो काम लाग्छ । जस्तै वैज्ञानिकहरुले इमेज प्रोसेसिङका माध्यमबाट इमेज डेटालाई एनालिसिस गरेर मङ्गल वा अरु ग्रहहरुमा पानी छ वा छैन अथवा अरु कुराहरु छन् वा छैनन् भन्ने कुराहरुको पनि एनालिसिस गर्न सकिन्छ । जस्तै पछिल्लो एउटा विकास ‘ब्ल्याक होल’ हो । त्यो पनि डेटा साइन्सकै उपलब्धि हो । जुन ब्ल्याक होलको तस्बिर उनीहरुले क्रिएट गरे । त्यो इमेज खिचेर ल्याएको रियल इमेज होइन । त्यो त डेटाको प्रोसेसिङ गरेर कम्प्युटरले जेनेरेट गरेको इमेज हो । त्यस्तो काममा पनि यो प्रयोग भइरहेको छ । मार्केटिङ, विज्ञापन र बिजनेसमा त यो व्यापक नै छ । साथै वैज्ञानिक अनुसन्धान र गेमिङ पनि यसमा प्रयोग भएको देखिन्छ ।
गेमिङहरुमा यसको प्रयोग कसरी हुन्छ ?
गेमिङहरुमा आर्टिफिसियल इन्टेलिजेन्स एल्गोरिदमहरु प्रयोग गरिन्छ । त्यसका लागि पहिले एआईलाई कुनै पनि एल्गोरिदमको प्रशिक्षण गराउनुपर्छ । यसकारण धेरै डेटा आवश्यक हुन्छ । जस्तो पछिल्लो समय अल्फा गो भन्ने गेम आइबीएमको कम्प्युटरले वल्र्ड च्याम्पियनलाई पनि हरायो भन्ने समाचार आइरहेका थिए । त्यो कसरी भयो भन्दा उनीहरुले अल्फा गो भन्ने कम्प्युटरलाई धेरै दिनदेखि सेल्फ कम्पिटिसन अर्थात् स्वप्रतिस्पर्धामा रन गराएका थिए सिमुलेटेड डेटामा । यस्तो मुभमेन्ट आयो भने यस्तो चल्ने भनेर प्रशिक्षित गराइएको थियो । यसका लागि उनीहरुले डेटा पनि आर्टिफिसियल नै बनाएका थिए । त्यसैमा कम्प्युटरलाई ट्रेन्ड गराए । यसर्थ त्यहाँ पनि डेटा चाहिन्छ, डेटा साइन्सको काम हुन्छ ।
नेपालका कुनकुन क्षेत्रमा डेटा साइन्स र मेसिन लर्निङलाई प्रयोग गर्न सकिन्छ ?
बैङ्कहरुले यसको धेरै प्रयोग गर्न सक्छन् । अहिले बैङ्कहरुसँग डिजिटलाइज डेटा छ । डेटा साइन्सको काम कम्प्युटरका माध्यमबाट गर्ने हो भने कम्प्युटराइज डेटा चाहियो । पुरानो ढड्डामा भएको डेटाले भएन । तर बैङ्क र वित्तीय संस्थासँग डिजिटलाइज डेटा भएकाले उनीहरुले आफ्नो बिजनेस बढाउन डेटा एनालिसिस, सेन्थेसिस गरेर नयाँनयाँ स्किम लन्च गर्न सक्छन् । केही हदसम्म गरिरहेका हुन सक्छन् । मेरो जानकारीमा यही एप्लिकेसन भनेर त थाहा छैन । तर पक्कै पनि उनीहरुसँग जानेर, नजानेर डेटा साइन्स नै भनेर नगरे पनि उनीहरुको रुटिन प्रोसेसमा यो गरिरहेको हुनुपर्छ । यसको कारण यस्तो हुन सक्छ, इन्स्योरेन्स कम्पनीले कुनै नयाँ स्किम लन्च गर्नुपर्यो, बिजनेस प्लान बनाउने समय सर्वेक्षण वा केही एनालिसिस त पक्कै पनि गरेकै हुन्छ । एनालिसिस गरीसकेपछि फोरकास्ट गर्छ, ‘हामी यति समयमा यति सेवाग्राही बढाएर यति फाइदा कमाउँछौं ।’
नेपालमा पनि थुप्रै कम्पनी एआईमा काम गरिरहेका हुन्छन् । जस्तै ट्रिलिफ, फ्युज मेसिन, एम–पर्सेप्टलगायत संस्था छन् । अवश्य पनि, अरु क्षेत्रमा काम गर्दा भन्दा यो क्षेत्रमा काम गर्न अलिक बढि रिसर्च र मिहिनेतको खाँचो छ । नयाँ फिल्ड भएकाले यसमा काम गर्दा तपाईंले भने जस्तो संसाधन पाउन सक्नुहुँदैन ।
अहिले यिनीहरुले म्यानुअल्ली गरिरहेका हुन सक्छन् । तर अब डेटा साइन्सका माध्यमबाट हामीले अटोमेटेड गर्न सक्छौं । मौसमहरुको पूर्वानुमान मिलेको पनि यसैको प्रयोगका कारणले हो । एउटा डेटाकै कारणले यो सम्भव भएको हो । पहिलो हाम्रो फोरकास्टिङ विभागसँग त्यति धेरै डेटा थिएन । तर अहिले डेटा पर्याप्त मात्रामा उपलब्ध छ । त्यसो हुँदा मेसिनले ती डेटाहरुको ढाँचा हेरेर सही ढाँचाको अनुमान गर्न सक्छ । यो पनि प्रेडिक्सनकै पाटो हो । तर प्रेडिक्सन र फोरकास्टिङमा अलिकति फरक छ । फोरकास्टिङ टाइम सिरिजमा हुन्छ । जस्तो आजको डेटा लिएर भोलिको फोरकास्टिङ गर्ने, भोलिको लिएर पर्सि गर्ने । यसरी सिरिजमा एक हप्ताको मौसमी पूर्वानुमान हामी गर्न सक्छौं । स्टक मार्केट पूर्वानुमान गर्छौं । बितेको समयको डेटा लिएर भोलिको अनुमान गर्ने काम नै प्रडिक्सन हो । त्यसमा समय निर्भरता हुँदैन । डेटा साइन्सको कामचाहिँ प्रेडिक्सन र फोरकास्टिङ दुवैमा हुन्छ । मेसिन लर्निङको काम पनि फोरकास्टिङ र प्रेडिक्सन दुवैमा हुन्छ ।
अहिले जति पनि ई–पेमेन्ट सेवा, स्टार्टअपहरु पठाओ, टुटल आइरहेका छन्, यिनीहरु पनि डेटा साइन्सकै परिणाम हुन् ?
यी स्टार्टअप र सेवाहरुले लजिस्टिकहरुमा डेटा साइन्सको प्रयोग गर्न सक्छन् । लजिस्टिक भनेको अर्डर लिने त्यसलाई डेलिभरी गर्ने काम हो । यो कामका लागि उनीहरुले ब्याक इन्डमा मेसिन लर्निङ, डेटा साइन्स प्रयोग गरेर केही हदसम्म सिस्टमलाई अटोमेटेड गरेका हुन सक्छन् । जस्तो सबैभन्दा धेरै डेटा साइन्सको प्रयोग गर्ने भनेको ट्याक्सी सेवा प्रदायक कम्पनी उबर र ओलाले हो । यिनीहरुले त डेटा साइटिस्ट नै राखेर यो काम गराइरहेका हुन्छन् । किनभने उनीहरुले कुन सिजनमा कति सेवाग्राहीलाई हामीले सेवा प्रदान गर्नुपर्छ भन्ने कुरा पहिल्यै प्रेडिक्ट गर्छन् । र त्यसअनुसार जनशक्ति तयार पारेर र पुरानो डेटा एवम् प्याटर्नहरुको एनालिसिस गरेर प्रेडिक्ट गर्छन् । जस्तो कि जुन, जुलाईमा हाम्रो कति माग आउँछ, कति सेवा डेलिभरी गर्नुपर्ला भन्ने कुराको प्रेडिक्सन गर्छन् । ती सेवा डेलिभरी गर्न हामीलाई कति कर्मचारी चाहिन्छ भनेर त्योअनुसारले तयारी गर्छन् । त्यो गरेका कारण उनीहरुको सेवा सहज हुन्छ । हामीले त्यस्तो प्रेडिक्सन गरेनौं, पुरानै कर्मचारी मात्र राख्यो र माग ह्वात्तै बढ्यो भने तपार्इंले सेवा प्रदान गर्न सक्नुहुँदैन, सेवामा ढिलाइ हुन्छ । सेवाग्राहीको विश्वास घट्छ । यसले तपाईंको व्यापार भविष्यमा खुम्चिन सक्छ । त्यसकारण टुटल जस्तो यातायात सेवा प्रदायकहरुले यसको प्रयोग गर्न सक्छन् । अझै इन्टरनेट सेवा प्रदायक आईएसपीहरुले प्रयोग गर्न सक्छन् । कुन सिजनमा हाम्रो इन्टरनेको माग घटबढ हुन्छ भनेर प्याटर्नहरुको अध्ययन गरेर आफूले किन्नुपर्ने ठाउँबाट म्यानेज गर्न सक्छन् । यसमा यस्ता धेरै अवसर छन् ।
डेटा साइन्स र मेसिन लर्निङको क्षेत्रमा कुनै संस्थामा आबद्ध नभई स्वरोजगार बन्न यसको स्कोप र प्रोस्प्रेक्टस कस्तो छ ?
यो पनि एउटा आईटीकै पाटो हो भनेर बुझ्नुपर्यो । स्वरोजगार हुने कुरा त्यसैको एउटा अङ्ग हो । र स्वरोजगार हुने कुरामा तपाईं आफैंले नयाँ उद्यमशीलताको विकास गर्न सक्नुहुन्छ । त्यसका लागि तपाईंले नयाँ फिल्ड र नयाँ आइडिया लिएर आउनुपर्यो । र बजारलाई एनालिसिस गर्नुपर्यो । त्यसअनुसार बिजनेस मोडलहरु बनाउनुपर्यो । हामी देख्छौं, नेपालमा पनि थुप्रै कम्पनी एआईमा काम गरिरहेका हुन्छन् । जस्तै ट्रिलिफ, फ्युज मेसिन, एम–पर्सेप्टलगायत संस्था छन् । अवश्य पनि, अरु क्षेत्रमा काम गर्दा भन्दा यो क्षेत्रमा काम गर्न अलिक बढि रिसर्च र मिहिनेतको खाँचो छ । नयाँ फिल्ड भएकाले यसमा काम गर्दा तपाईंले भने जस्तो संसाधन पाउन सक्नुहुँदैन । र त्यस्तो बेलामा आफूले बढी रिसर्च गरेर काम गर्नुपर्ने हुनसक्छ । नयाँनयाँ बाटो आफै पत्ता लगाउनुपर्छ ।
यो कोर्स पढ्न नेपाली विद्यार्थी बाहिर नै जानु पर्ने अवस्था हो ?
अहिले कोर्सको सन्दर्भमा त्यही नै देखिन्छ । डेटा साइन्समै मास्टर्स गर्छु भन्यो भने यहाँ अहिले त्यो सुविधा छैन । तर त्योसँग सम्बन्धित डिग्री पढ्नका लागि कम्प्युटर साइन्स, आईटी, एमटेक, एमआइटी त यहाँ छ । तर डेटा साइन्समा नै म स्पेसलाइज गरेर जान्छु भन्यो भने त्यो यहाँ अहिलेसम्म लन्च गरिएको छैन ।
कुनै पनि प्रोग्राम, विषय विश्वविद्यालयले लन्च गर्ने भनेको बजारको माग, विद्यार्थीहरुको रुचि र त्यो पढिसकेपछि रोजगारीको बजारमा प्लेसमेन्ट यी कुराहरुले पनि नयाँ कोर्सहरु लन्च गर्ने कुरालाई निर्धारण गर्छ । तर अब यो डेटा साइन्स भन्ने कुरा हाम्रो परिवेशमा एकदमै नयाँ भयो । तर बाहिरतिर हेर्ने हो भने उनीहरुले यसमा धेरै रिसर्च गरेर र केही टेन्जेबल प्रोडक्ट पनि लन्च गरे र कोर्स पनि सुरु गरे । अब अस्ट्रेलिया अमेरिका, युरोपमा त डेटा साइन्समा मास्टर्स पीएचडी पनि गराउँछन् ।
बजारको माग, विद्यार्थीका रुचि र जब मार्केटमा प्लेसमेन्टकै कुराले हो त्रिभुवन विश्वविद्यालयले हालसम्म यो विषयलाई लन्च गर्न नसकेको कि अन्य विषय पनि छन् ?
त्यहीँ नै हो भनेर त भन्न सकिँदैन । सायद चेतनाको पनि कमी होला । डेटा साइन्सबारे सबै सम्बन्धित निकायलाई यो विषयमा जानकारी नहुन सक्छ । यो विषयमा कसरी अगाडि बढाउने भन्ने हुन सक्छ अथवा विश्वविद्यालयहरुले योजना पनि बनाइरहेका हुन सक्छन् । त्रिभुवन विश्वविद्यालयको कुरा गर्दा हाम्रो विभागमा पनि यसको बेलाबेला कुरा उठ्ने गर्छ । डेटा साइन्स डिमान्डिङ विषय हो, हामीले किन सुरु नगर्ने भन्ने कुराहरु आउँछन् । तर अब कुनै कोर्स बनाउने विषयमा विश्वविद्यालयका आफ्नै प्रक्रिया हुन्छन् । त्यसमा जाँदा लामो समय पनि लाग्न सक्छ । तर मलाई लाग्छ चाँडै यसका कोर्स नेपालमा सुरु हुन्छ र हुनुपर्छ । कुनै न कुनै विश्वविद्यालयले सुरु गर्छ ।
हामीले गरेको यही वर्कसपमा पनि तीन सय सहभागीको आवेदन आएको थियो, जसमा हामीले चाहिँ ५६ जनालाई मात्र सिट अफर गर्न सक्यौं ।
यो वर्कसपबारे पनि केही बताइदिनुस् न ?
यो वर्कसप हाम्रो मेसिन लर्निङ एन्ड डेटा साइन्सको नेसनल वर्कसपको दोस्रो संस्करण हो । यसअघि सन् २०१८ मा म, सुर्य बस्नेत र जर्मनीमा डेटा साइटिस्टका रुपमा काम गर्दै आएका डा. झनक पराजुलीको संयुक्त पहलमा पहिलो संस्करण सम्पन्न भएको थियो । नेपालमा डेटा साइन्सको विषयमा जानकारी नभएको अवस्थामा नेपाल आएको अवसरमा डा. पराजुलीले एउटा प्रस्ताव राख्नुभयो । विश्वभर डेटा साइन्समा धेरै काम भइरहेको अवस्थामा नेपालमा पनि म केही योगदान दिन चाहन्छु भनेपछि हामीले पहिलो नेसनल वर्कसप सुरु गर्यौं ।
अहिलेको दोस्रो संस्करणको यो वर्कसप हाम्रो समर स्कुल या भनौं सर्ट टर्म स्कुल जस्तो थियो । ट्रेनिङ वर्कसप पनि भन्न सकिन्छ यसलाई । आईटी, कम्प्युटर साइन्स, इन्जिनियरिङमा स्नातक तह अध्ययन गरिरहेको वा डेटा साइन्समा केही प्रि क्वालिफिकेसन भएको विद्यार्थी समावेश गरिएको थियो । डेटा साइन्समा प्रि क्वालिफिकेसन भन्नाले बीएससी स्टाटिस्टिक्स, फिजिक्स, म्याथम्याटिक्स पढेका विद्यार्थीले पनि डेटा साइन्समा काम गर्न सक्छन् । किनभने डेटा एनालिसिस, म्यानुपुलेसन, प्रेजेन्टेसन भन्ने कुरा यी सबै विषयमा आउँछन् । यसैले यी विषय र आइटी विषयको ब्याकग्राउन्ड भएका विद्यार्थीलाई हामीले चयन गरेका थियौं । यसको सुरुवात हामीले बेसिक लेभलदेखि नै गरेका थियौं । डेटा साइन्सको बेसिकदेखि सुरु गरेर इन्डस्ट्रीमा डेटा साइन्स कसरी प्रयोग हुन्छ भन्ने किसिमको एउटा पूर्ण केस स्टडी गराएका थियौं । र अन्तिम दिनमा हामीले विद्यार्थीहरुलाई प्रोजेक्ट प्रेजेन्टेसन पनि गराएका थियौं ।
पाँच दिनको अवधिमा अन्तिम दिन प्रोजेक्ट प्रेजेन्टेसन गरेका थिए । ५६ जना विद्यार्थीको १० ओटा टोली बनाएर प्रोजेक्ट असाइन गरेका थियौं ।
विद्यार्थीलाई केकस्ता प्रोजेक्ट असाइन गर्नुभयो ?
हामीले असाइन गरेका प्रोजेक्टमा केहीलाई क्रेडिट कार्ड फ्रड डिटेक्सनका डेटा दिएका थियौं । जसको डेटा सार्वजनिक रुपमा नै उपलब्ध छ । डेटा रिपोजेटरी हुन्छ । विश्वभरका मान्छेहरुले आफूले बनाएका डेटालाई त्यहाँ राखेका हुन्छन् । अर्को इमेज प्रोसेसिङबाट डिजिटल रिकग्नाइजेसनको डेटा दिइएको थियो । त्यस्तै आगामी महिनामा कस्तो किसिमको रोजगारीको माग आउला भन्ने किसिमको प्रेडिक्सन गर्न असाइन गरेका थियौं ।
अति कम विकसित मुलुकका सरकारले पनि यस्ता प्रविधिबाट कसरी फाइदा लिन सक्छन् । तर त्यसका लागि ई गभर्नेन्सको काम अघि बढाउनुपर्छ । त्यसका लागि सरकारी सेवाको आपूर्ति, निजी तथा सार्वजनिक क्षेत्र, पर्यटन, उद्योगलगायतमा एआईलाई कसरी एक्सप्लोर गर्न सकिन्छ भनेर रणनीति बनाउन आवश्यक छ । यसो भएको खण्डमा यसले देशको समग्र विकासमा पनि टेवा पुर्याउन सक्छ ।
क्रेडिट कार्ड फ्रड डिटेक्सनको प्रोजेक्टमा उनीहरुले त्यो डेटालाई लिएर अब क्रेडिट कार्डबाट नयाँ ट्रान्जेक्सन भयो भने त्यो फ्रड हो वा वैधानिक हो भनेर छुट्याउने डिटेक्ट गर्न सक्ने प्रोटोटाइप बनाएको थियो । पाँच दिनको वर्कसपका साथै ती विद्यार्थीमा आइटीको एल्गोरिदम, डेटा स्ट्रक्चरबारे पहिले नै थाहा थियो । तर त्यो डेटा हामीले त्यही पहिलो दिन दियौं र उनीहरुले ती डेटालाई एनालिसिस गरेर अन्तिम दिन प्रोजेक्ट प्रेजेन्टेसन गरे । अब त्यो प्रोटोटाइपलाई भोलि गएर कुनै संस्थाले प्रयोग अथवा कमर्सियलाइज पनि गर्न सक्छ । १० मध्ये तीन चार ओटा प्रोजेक्ट राम्रै थिए । हामीले बेस्ट प्रोजेक्ट भनेर अवार्ड पनि वितरण गरेका थियौं ।
डेटा साइन्स र मेसिन लर्निङका विषयमा काम गर्ने अन्य संस्था पनि छन् कि ?
संस्थाहरु छन् । एआईमा अध्ययन गर्ने भनेर एउटा संस्था खोलिएको छ— नामी रिसर्च सेन्टर । गत वर्ष एआई विन्टर स्कुल भनेर यो संस्थाले १० दिनको कार्यक्रम गरेको थियो । जसले आर्टिफिसियल इन्टेलिजेन्सबारे प्रशिक्षण दिन्छ । यसबाट विद्यार्थीहरुले भविष्यमा यो क्षेत्रमा काम गर्न सक्छन्, करिअर विकास गर्न सक्छन् । विभिन्न आइटीसँग सम्बन्धित संस्था पनि यहाँ खुलेका छन् । जस्तै कम्प्युटर्स एसोसिएसन नेपाल (क्यान महासङघ)ले पनि केही इभेन्ट गरिरहेको हुन्छ । डेटा साइन्स, ब्लकचेन प्रविधि यावत् विषयमा उसले कार्यक्रम गरिरहेको छ ।
डेटा साइन्सको क्षेत्रमा नेपालले के गर्नुपर्छ ?
आर्टिफिसियल इन्टेलिजेन्स विगत एक दशकयता अत्याधुनिक बन्दै गएको छ । एआईलाई हामीले अहिले अनुभूत गर्न सक्छौं । फेसबुकमा फेस अटोमेटिक ट्याग हुन्छ । गुगलमा गएर अङ्ग्रेजीलाई नेपाली वा चिनियाँ भाषामा अटोमेटिक रुपमा अनुवाद गर्न सकिन्छ । यस्तै सिरी, कोटोना जस्तो भर्चुर्अल असिस्टेन्ट छन्, जसले मान्छेको काम गर्र्दै आएका छन् । अर्को दसबीस वर्षमा यो क्षेत्र अझ विस्तार भएर जान्छ ।
विकसित मुलुकहरुमा हरेक वस्तु आर्टिफिसियल इन्टेलिजेन्सबाट प्रभावित भइरहेका छन् । उनीहरुले एआईबारे राष्ट्रिय रणनीति के हुने, पाँचदस वर्षपछि हामी कहाँ पुग्ने, कस्तो किसिमको हुने भनेर रणनीति बनाएर काम गरिरहेका छन् । नेपालले पनि त्यही अनुसार काम गर्नुपर्छ । तर नेपाल जस्ता मुलुकले प्रविधि आयात गरेर प्रयोग मात्र काम चलाइरहेका छन् । हामी आफैंले केही गरेका छैनौं । यहाँ पर्याप्त अनुसन्धान र अनुसन्धान रणनीति बनेका छैनन् । अनुसन्धान राष्ट्रिय प्राथमिकतामा पनि परेको छैन । जबसम्म उपयुक्त रणनीति बनाएर अघि बढ्दैनौं, तबसम्म अवस्था यस्तै रहिरहन्छ । त्यसैले अति कम विकसित मुलुकका सरकारले पनि यस्ता प्रविधिबाट कसरी फाइदा लिन सक्छन् । तर त्यसका लागि ई गभर्नेन्सको काम अघि बढाउनुपर्छ । त्यसका लागि सरकारी सेवाको आपूर्ति, निजी तथा सार्वजनिक क्षेत्र, पर्यटन, उद्योगलगायतमा एआईलाई कसरी एक्सप्लोर गर्न सकिन्छ भनेर रणनीति बनाउन आवश्यक छ । यसो भएको खण्डमा यसले देशको समग्र विकासमा पनि टेवा पुर्याउन सक्छ ।
डेटा साइन्स र मेसिन लर्निङका विषयमा एमएलडीएसएनले के गर्ने याेजना बनाएकाे छ ?
एमएलडीएसएन कम्युनिटीले निकट भविष्यमै ६ महिना वा एक वर्षमा अनलाइन र अफलाइन किसिमका डिप्लोमा इन डेटा साइन्स वा डिप्लोमा इन मेसिन लर्निङ कोर्स अध्यापन गराउने योजना बनाएको छ । यसमा विभिन्न देश विदेशमा रहेर यो फिल्डमा काम गरिरहेका व्यक्तिले तालिम दिनेछन् । यो योजनालाई कार्यान्वयनमा लैजान हामी कत्तिको सफल हुन्छौं, त्यो भविष्यले बताउनेछ । यो गैरनाफामुखी संस्था हो । यसले सामाजिक सेवाका लागि हरेक क्रियाकलाप गर्दै आएको छ ।