एआई भाषा मोडलहरू किन अनुमान लगाउन गाह्रो छ भनेर गणितज्ञ टेरेन्स ताओले व्याख्या गरे
फिल्ड्स पदक विजेता टेरेन्स ताओले ठूला भाषा मोडलहरूको आधारभूत विडम्बनाका बारेमा जानकारी दिएका छन्, जसमा तिनले भनेका छन् कि यी मोडलहरू सरल गणितीय आधारमा बनेका भए पनि विभिन्न कामहरूमा तिनीहरूको प्रदर्शन अनुमान लगाउन कठिन छ।

तस्बिर: AI जेनेरेटेड (प्रतीकात्मक)
भौतिकशास्त्री डा ब्रायन केटिंगसँगको भर्खरैको अन्तर्वार्तामा ताओले भनेका छन् कि ठूला भाषा मोडलहरू (LLMs) को गणितमा स्नातक तहका विषयहरू जस्तै रैखिक बीजगणित, म्याट्रिक्स गुणन र क्याल्कुलस प्रयोग हुन्छ। गणितज्ञका अनुसार हामी यी एआई प्रणालीहरू कसरी बनाउने र सञ्चालन गर्ने भन्ने मेकानिकली बुझ्छौं, तर वास्तविक रहस्य यो छ कि तिनीहरू किन कुनै कामहरूमा उत्कृष्ट हुन्छन् र अरूमा असफल हुन्छन्।
UCLA का प्राध्यापक र संसारका महान् गणितज्ञहरूमध्ये एक मानिने टेरेन्स ताओले भने कि अनुसन्धानकर्ताहरूले विभिन्न कामहरूमा LLM को प्रदर्शन पहिले नै अनुमान लगाउन सक्दैनन्। यो अनुमान लगाउन नसकिने गुणले गर्दा एआई भाषा मोडलहरूमा प्रगति मुख्यतया प्रयोगात्मक भएको छ, सैद्धान्तिक समझको सट्टा प्रयोगमा आधारित छ।
गणितज्ञले प्राकृतिक पाठलाई शुद्ध शोर र पूर्ण संरचित डेटाको बीचमा रहेको बताएका छन्—आंशिक रूपमा संरचित र आंशिक रूपमा अनियमित। यो स्थितिले गणितीय चुनौतीहरू सिर्जना गर्छ जुन भौतिकशास्त्रमा मेसो-स्केलमा हुने समस्याहरूसँग मिल्दोजुल्दो छ।
ताओका अनुसार अनुसन्धानकर्ताहरूले LLMs कसरी काम गर्छ भन्ने मेकानिजम वर्णन गर्न सक्छन्, तर क्षमताको फड्को वा कार्य-स्तरको प्रदर्शनको भरपर्दो भविष्यवाणी दिन सक्दैनन्। यो सीमितताले एआई विकासमा महत्त्वपूर्ण प्रभाव पारेको छ, किनकि यसको मतलब प्रगति सैद्धान्तिक डिजाइनको सट्टा परीक्षण र त्रुटिमा निर्भर छ।
यी अन्तर्दृष्टि एआई भाषा मोडलहरूले विभिन्न क्षेत्रहरूमा आश्चर्यजनक क्षमताहरू प्रदर्शन गरिरहेका बेलामा आएको हो, सृजनशील लेखनदेखि गणितीय समस्या समाधानसम्म, जबकि सरल कामहरूमा अप्रत्याशित सीमिताहरू देखाउँदै।
स्रोत सन्दर्भ
यो समाचार विभिन्न अन्तर्राष्ट्रिय स्रोतहरूबाट संकलन र प्रमाणित गरिएको हो।
यो समाचार साझा गर्नुहोस्:
𝕏 मा साझा गर्नुहोस्यो समाचार विभिन्न स्रोतहरूबाट संकलन गरी उत्तम प्रयासमा प्रमाणित गरिएको हो। तथ्यहरू समयसँगै परिवर्तन हुन सक्छन् र नयाँ जानकारीसँगै अपडेट हुनेछन्।