काठमाडौ । ओपनएआईको च्याटजीपीटी मोडेलले पछिल्लो दुई वर्षमा जुन गतिमा प्रगति गरेको छ त्यो अभूतपूर्व छ । भाषा मोडेलको रूपमा आर्टिफिसियल इन्टेलिजेन्सको यो प्रयोग क्रान्तिकारी साबित भयो र यसले लगभग सबै क्षेत्रमा प्रवेश गर्यो । उदाहरणका लागि, च्याटजीपीटी अब विद्यालय, अस्पतालदेखि अदालतसम्म प्रयोग भइरहेको छ ।
तर अब एआई कम्पनीहरूले आफ्नो नयाँ र ठूला भाषा मोडेलहरूको विकासमा ढिलाइ र चुनौतीहरूको सामना गरिरहेका छन् । यी कम्पनीहरूले एआई मोडेलहरूलाई तालिम दिन प्राविधिक विधिहरू सिर्जना गर्दैछन् जसले एल्गोरिदमहरूलाई मानव–जस्तै रूपमा ‘सोच्न’ मद्दत गर्दछ ।
धेरै एआई वैज्ञानिकहरू, अनुसन्धानकर्ताहरू, र लगानीकर्ताहरू विश्वास गर्छन् कि यी प्रविधिहरू, जसले ओपनएआईको हालसालै जारी गरिएको ०१ मोडेलको आधार बनाउँछ, जसले एआईको क्षेत्रमा ठूलो परिवर्तन ल्याउन सक्छ । यो परिवर्तनले ऊर्जा र कम्प्युटर चिप्स जस्ता स्रोतहरूको लागि कम्पनीहरूको मागलाई पनि असर गर्न सक्छ ।
दुई वर्षअघि भाइरल च्याटबट च्याटजीपीटी लन्च भएदेखि एआई–सम्बन्धित टेक्नोलोजी कम्पनीहरूले ठूलो मात्रामा डाटा र कम्प्युटिङ पावर थप्दा एआई मोडलहरूमा सुधार हुने कुरामा जोड दिइरहेका छन् । तर अब धेरै प्रमुख एआई वैज्ञानिकहरूले ‘ठूलो भनेको राम्रो’ सिद्धान्तको सीमालाई प्रश्न गरिरहेका छन् ।
ओपनएआईको सेफ सुपरइन्टिेलिजेन्ट (एसएसआइ) की सह–संस्थापक इल्या सुत्स्केभर ठूला स्तरको पूर्व–प्रशिक्षणको नतिजा अब त्यति प्रभावकारी नभएको बताउाछिन् । उनले भनिन, ‘सन् २०१० मापनको युग थियो, अब हामी खोज र आविष्कारको युगमा फर्केका छौँ । सही कुरालाई मापन गर्नु अहिले पहिलेभन्दा धेरै महत्त्वपूर्ण छ ।’
नयाँ बाटो खोज्दै
ठूला एआई ल्याबहरूमा अन्वेषकहरू ओपनएआई को जिपिटी–४ मोडेल भन्दा राम्रो मोडेलहरू विकास गर्न संघर्ष गरिरहेका छन् । ठूला मोडेलहरूको लागि ‘प्रशिक्षण रन’ मा लाखौं डलर खर्च हुन्छ र प्रक्रिया धेरै महिनासम्म चल्न सक्छ । साथै, ठूलो मात्रामा डाटाको माग र ऊर्जाको अभाव पनि ठूलो चुनौती बन्दै गएको छ । यससँग सम्झौता गर्न, अन्वेषकहरूले एआई मोडेलहरूको ‘अनुमान चरण’ सुधार गर्न ‘परीक्षण–समय गणना’ जस्ता विधिहरू खोजिरहेका छन् । यसले मोडेललाई जटिल गणनामा थप डाटा प्रशोधन गर्न अनुमति दिन्छ । ओपनएआईले आफ्नो नयाँ मोडल ०१ मा यो प्रविधि अपनाएको छ, जसले मानव–प्रेरित तर्कबाट समस्याहरू समाधान गर्छ । अन्य प्रमुख एआई ल्याबहरू, जस्तै एन्थ्रोपिक, ह्एआई र गुगल डिपमाइन्डले यस्तै प्रविधि विकास गर्न प्रयास गरिरहेका छन् ।
एआई विस्तारको वातावरणीय लागत
ठूलो भाषा मोडेल (एलएलएमएस) को प्रशिक्षणसंग सम्बन्धित पर्यावरण लागत एक प्रमुख चिन्ता भएको छ । धेरै अध्ययनहरूले पत्ता लगाएका छन् कि परिष्कृत एआई मोडेलहरूको प्रशिक्षणले धेरै ऊर्जा खपत गर्छ, जसले ठूलो मात्रामा कार्बन उत्सर्जन गर्दछ । युनिभर्सिटी अफ म्यासाचुसेट्स, एमहर्स्टले गरेको २०१९ को अध्ययनले एउटा ठूलो एआई मोडललाई तालिम दिँदा करिब ३०० टन कार्बन डाइअक्साइड उत्सर्जन गर्ने, पाँचवटा कारको जीवनकाल उत्सर्जन बराबर हुने बताएको छ ।
२०२० मा गरिएको एक अनुसन्धानले पत्ता लगायो कि ठूला भाषा मोडेलहरू तालिम दिन हजारौं किलोवाट बिजुली चाहिन्छ । अनुसन्धानकर्ताहरूले भाषा प्रशोधनको सबैभन्दा आधुनिक ब्रेट मोडेलको तालिमले लगभग १२३ मेट्रिक टन कार्बन उत्सर्जन भएको बताए । यी उत्सर्जनहरू परम्परागत प्राविधिक गतिविधिहरू भन्दा धेरै उच्च छन्, जसले ठूला मोडेलहरूको वातावरणीय प्रभावको बारेमा प्रश्नहरू खडा गर्दछ ।
स्रोत बाधा र विकल्पहरू
एआई चिप्सको ठूलो विश्वव्यापी माग, विशेष गरी एनभिडियाको जिपियु चिप्सले पनि स्रोत र आपूर्ति श्रृंखलाहरूमा दबाब दिएको छ । सेमीकन्डक्टरको अभावमा भर्खरैको अनुसन्धानले जिपियु र अन्य एआई–आधारित चिपहरू निर्माण गर्न धेरै पानी, ऊर्जा, र कोबाल्ट र लिथियम जस्ता दुर्लभ तत्वहरू चाहिन्छ, जुन प्राप्त गर्ने विधिहरू धेरै वातावरणमैत्री छैनन् भन्ने पत्ता लाग्यो ।
यही कारणले कम्पनीहरूले अब आर्टिफिसियल इन्टेलिजेन्सको तालिम र नयाँ हार्डवेयर विकास गर्ने वैकल्पिक विधिहरूमा जोड दिइरहेका छन् । २०२२ मा गरिएको एक अनुसन्धानले सुझाव दियो कि कम्पनीहरूले नयाँ प्रविधिहरू जस्तै ‘टेस्ट–टाइम कम्प्युट’ र कस्टम एआई एक्सलेरेटरहरू प्रयोग गर्ने दिशामा अघि बढिरहेका छन्, जसले परम्परागत न्एग् चिप्समा निर्भरता घटाउन सक्छ र स्रोत अवरोधहरू समाधान गर्न सक्छ ।
एआई हार्डवेयरमा परिवर्तनको सम्भावना
यो परिवर्तनले ल्खष्मष्ब जस्ता कम्पनीहरूबाट एआई चिप्सको मागलाई परिवर्तन गर्न सक्छ । हाल, एनभिडियाका चिप्सले एआई फिल्डमा प्रभुत्व जमाएको छ, तर यो नयाँ प्रविधिका कारण उनीहरूले अनुमान बजारमा प्रतिस्पर्धाको सामना गर्नुपर्ने हुन सक्छ । ‘यस परिवर्तनले हामीलाई ठूलो पूर्व–प्रशिक्षण क्लस्टरबाट इन्फरेन्स क्लाउडहरूमा लैजानेछ, जुन अनुमानका लागि क्लाउड–आधारित सर्भरहरू हुन्,’ सेक्वाया क्यापिटलका साझेदार सोन्या हुआङले भनिन ।
एनभिडियाले यसको नवीनतम एआई चिप्स, ब्ल्याकवेलको लागि अनुमानको बढ्दो मागमा टिप्पणी गरेको छ । कम्पनीका सीईओ जेन्सेन हुआङले भर्खरै भनिन, ‘हामीले अनुमान समयको लागि दोस्रो स्केलिंग कानून पत्ता लगाएका छौं । यसले ब्ल्याकवेलको माग बढेको छ ।’ अनुवाद गरिएको