चेहरे को गले लगाने से पता चलता है कि कैसे टेस्ट-टाइम कंप्यूट स्केलिंग एसएलएम को बड़े एआई मॉडल से बेहतर प्रदर्शन करने में मदद कर सकती है

हगिंग फेस ने पिछले सप्ताह एक नया केस अध्ययन साझा किया जिसमें दिखाया गया कि कैसे छोटे भाषा मॉडल (एसएलएम) बड़े मॉडल से बेहतर प्रदर्शन कर सकते हैं। पोस्ट में, प्लेटफ़ॉर्म के शोधकर्ताओं ने दावा किया कि कृत्रिम बुद्धिमत्ता (एआई) मॉडल के प्रशिक्षण समय को बढ़ाने के बजाय, परीक्षण-समय की गणना पर ध्यान केंद्रित करने से एआई मॉडल के लिए बेहतर परिणाम दिख सकते हैं। उत्तरार्द्ध एक अनुमान रणनीति है जो एआई मॉडल को किसी समस्या को हल करने पर अधिक समय बिताने की अनुमति देती है और आत्म-शोधन और एक सत्यापनकर्ता के खिलाफ खोज जैसे विभिन्न दृष्टिकोण प्रदान करती है जो उनकी दक्षता में सुधार कर सकती है।

टेस्ट-टाइम कंप्यूट स्केलिंग कैसे काम करती है

में एक डाकहगिंग फेस ने इस बात पर प्रकाश डाला कि एआई मॉडल की क्षमताओं में सुधार के लिए पारंपरिक दृष्टिकोण अक्सर संसाधन-गहन और बेहद महंगा हो सकता है। आमतौर पर, ट्रेन-टाइम कंप्यूट नामक एक तकनीक का उपयोग किया जाता है, जहां प्रीट्रेनिंग डेटा और एल्गोरिदम का उपयोग फाउंडेशन मॉडल द्वारा किसी क्वेरी को तोड़ने और समाधान तक पहुंचने के तरीके को बेहतर बनाने के लिए किया जाता है।

वैकल्पिक रूप से, शोधकर्ताओं ने दावा किया कि टेस्ट-टाइम कंप्यूट स्केलिंग पर ध्यान केंद्रित करना, एक ऐसी तकनीक है जहां एआई मॉडल को किसी समस्या को हल करने में अधिक समय बिताने की अनुमति मिलती है और उन्हें खुद को सही करने की अनुमति मिलती है, जो समान परिणाम दिखा सकता है।

ओपनएआई के ओ1 तर्क-केंद्रित मॉडल के उदाहरण पर प्रकाश डालते हुए, जो परीक्षण-समय गणना का उपयोग करता है, शोधकर्ताओं ने कहा कि यह तकनीक प्रशिक्षण डेटा या प्रीट्रेनिंग विधियों में कोई बदलाव नहीं करने के बावजूद एआई मॉडल को बढ़ी हुई क्षमताओं को प्रदर्शित करने दे सकती है। हालाँकि, एक समस्या थी. चूंकि अधिकांश तर्क मॉडल बंद हैं, इसलिए उपयोग की जा रही रणनीतियों को जानने का कोई तरीका नहीं है।

शोधकर्ताओं ने Google डीपमाइंड और रिवर्स इंजीनियरिंग तकनीकों के एक अध्ययन का उपयोग यह जानने के लिए किया कि एलएलएम डेवलपर्स प्रशिक्षण के बाद के चरण में परीक्षण-समय की गणना को कैसे माप सकते हैं। केस स्टडी के अनुसार, केवल प्रोसेसिंग समय बढ़ाने से जटिल प्रश्नों के आउटपुट में महत्वपूर्ण सुधार नहीं दिखता है।

इसके बजाय, शोधकर्ता एक स्व-शोधन एल्गोरिदम का उपयोग करने की सलाह देते हैं जो एआई मॉडल को बाद के पुनरावृत्तियों में प्रतिक्रियाओं का आकलन करने और संभावित त्रुटियों की पहचान करने और सही करने की अनुमति देता है। इसके अतिरिक्त, एक सत्यापनकर्ता का उपयोग करना जिसके विरुद्ध मॉडल खोज कर सकते हैं, प्रतिक्रियाओं को और बेहतर बना सकता है। ऐसे सत्यापनकर्ता एक सीखा हुआ इनाम मॉडल या हार्ड-कोडित अनुमानी हो सकते हैं।

अधिक उन्नत तकनीकों में सर्वोत्तम-से-एन दृष्टिकोण शामिल होगा जहां एक मॉडल प्रति समस्या कई प्रतिक्रियाएं उत्पन्न करता है और निर्णय लेने के लिए एक अंक प्रदान करता है जो बेहतर अनुकूल होगा। ऐसे दृष्टिकोणों को इनाम मॉडल के साथ जोड़ा जा सकता है। बीम खोज, जो चरण-दर-चरण तर्क और प्रत्येक चरण के लिए अंक निर्दिष्ट करने को प्राथमिकता देती है, शोधकर्ताओं द्वारा उजागर की गई एक और रणनीति है।

उपर्युक्त रणनीतियों का उपयोग करके, हगिंग फेस शोधकर्ता लामा 3बी एसएलएम का उपयोग करने में सक्षम थे और इसे MATH-500 बेंचमार्क पर लामा 70B, एक बहुत बड़े मॉडल से बेहतर प्रदर्शन करने में सक्षम बनाया।

Source link

Related Posts

एमआईटी के शोधकर्ताओं ने पहली बार ठोस पदार्थों में इलेक्ट्रॉनों की क्वांटम ज्यामिति को मापा

एक नए अध्ययन ने मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) के भौतिकविदों और सहयोगियों को ठोस पदार्थों में इलेक्ट्रॉनों की क्वांटम ज्यामिति को मापने की अनुमति दी है। यह शोध क्वांटम स्तर पर क्रिस्टलीय सामग्रियों के भीतर इलेक्ट्रॉनों के आकार और व्यवहार में अंतर्दृष्टि प्रदान करता है। अध्ययन के अनुसार, क्वांटम ज्यामिति, जो पहले सैद्धांतिक भविष्यवाणियों तक ही सीमित थी, अब प्रत्यक्ष रूप से देखी जा रही है, जिससे क्वांटम सामग्री गुणों में हेरफेर करने के लिए अभूतपूर्व रास्ते सक्षम हो गए हैं। क्वांटम सामग्री अनुसंधान के लिए नए रास्ते अध्ययन 25 नवंबर को नेचर फिजिक्स में प्रकाशित किया गया था। जैसा कि एमआईटी में 1947 कक्षा के कैरियर डेवलपमेंट एसोसिएट प्रोफेसर ऑफ फिजिक्स, रिकार्डो कॉमिन द्वारा वर्णित है, यह उपलब्धि क्वांटम सामग्री विज्ञान में एक बड़ी प्रगति है। एमआईटी की सामग्री अनुसंधान प्रयोगशाला के साथ एक साक्षात्कार में, कॉमिन ने इस बात पर प्रकाश डाला कि उनकी टीम ने क्वांटम सिस्टम के बारे में पूरी तरह से नई जानकारी प्राप्त करने के लिए एक खाका विकसित किया है। उपयोग की गई पद्धति संभावित रूप से इस अध्ययन में परीक्षण की गई विधि से परे क्वांटम सामग्रियों की एक विस्तृत श्रृंखला पर लागू की जा सकती है। तकनीकी नवाचार प्रत्यक्ष मापन को सक्षम बनाते हैं अनुसंधान नियोजित कोण-संकल्पित फोटो उत्सर्जन स्पेक्ट्रोस्कोपी (ARPES), एक तकनीक जो पहले क्वांटम गुणों की जांच के लिए कॉमिन और उनके सहयोगियों द्वारा उपयोग की जाती थी। टीम ने कैगोम धातु नामक सामग्री में क्वांटम ज्यामिति को सीधे मापने के लिए ARPES को अनुकूलित किया, जिसमें अद्वितीय इलेक्ट्रॉनिक गुणों के साथ एक जाली संरचना होती है। पेपर के पहले लेखक और कॉर्नेल विश्वविद्यालय में कावली पोस्टडॉक्टोरल फेलो मिंगु कांग ने कहा कि यह माप महामारी के दौरान दक्षिण कोरिया सहित कई संस्थानों के प्रयोगवादियों और सिद्धांतकारों के बीच सहयोग के कारण संभव हो सका। ये अनुभव इस वैज्ञानिक सफलता को साकार करने में शामिल सहयोगात्मक और संसाधनपूर्ण प्रयासों को रेखांकित करते हैं। जैसा कि नेचर फिजिक्स में…

Read more

टेटसुवान साइंटिफिक एआई-संचालित रोबोटिक वैज्ञानिकों का निर्माण कर रहा है जो प्रयोग कर सकते हैं

सैन फ्रांसिस्को स्थित स्टार्टअप टेटसुवान साइंटिफिक कृत्रिम बुद्धिमत्ता (एआई) रोबोटिक्स का निर्माण कर रहा है जो एक वैज्ञानिक के कार्य कर सकता है। सह-संस्थापक, सीईओ क्रिस्टियन पोंस और मुख्य प्रौद्योगिकी अधिकारी (सीटीओ) थियो शेफर ने सफल सीड राउंड फंडिंग के बाद नवंबर में स्टार्टअप को गुप्त दुनिया से बाहर निकाला। कंपनी का लक्ष्य ऐसे बुद्धिमान सॉफ्टवेयर का निर्माण करना है जिसे लैब रोबोटिक्स के साथ एकीकृत किया जा सके ताकि एक परिकल्पना बनाने से लेकर प्रयोग चलाने और निष्कर्ष निकालने तक वैज्ञानिक खोज और आविष्कार की पूरी प्रक्रिया स्वचालित हो सके। एआई-संचालित रोबोटिक्स वैज्ञानिकों का निर्माण 2023 में स्थापित, स्टार्टअप अपना पहला उत्पाद – एक एआई वैज्ञानिक जो प्रयोग चला सकता है – बनाने के लिए पिछले डेढ़ साल से गुप्त रूप से काम कर रहा था। यह अब गुप्त रूप से बाहर है और वर्तमान में आरएनए चिकित्सीय दवा विकास में ला जोला लैब्स के साथ काम कर रहा है। इस पर वेबसाइटस्टार्टअप ने अपने दृष्टिकोण और उस पहले उत्पाद के बारे में विस्तार से बताया है जिस पर वह काम कर रहा है। विशेष रूप से, इसका अभी तक सार्वजनिक डोमेन में कोई उत्पाद नहीं है। समस्या कथन पर प्रकाश डालते हुए जिसका समाधान वह करना चाहता है, स्टार्टअप का कहना है कि विज्ञान में स्वचालन उच्च विविधता के बजाय प्रयोगों की उच्च मात्रा पर केंद्रित है। ऐसा इसलिए है क्योंकि प्रयोगशाला रोबोटों को वर्तमान में विशिष्ट प्रोटोकॉल को दोहराने के लिए व्यापक प्रोग्रामिंग की आवश्यकता होती है। हालाँकि, इससे एक ऐसी प्रणाली का निर्माण हुआ है जो रोबोट के बजाय असेंबली लाइन बनाती है जो वैज्ञानिकों के लिए सहायक हो सकती है, कंपनी ने कहा। टेटसुवान साइंटिफिक ने कहा कि समस्या यह है कि रोबोट वैज्ञानिक इरादे को नहीं समझ सकते हैं, और इस प्रकार, अपने आप कोई प्रयोग नहीं कर सकते हैं। हालाँकि, जेनेरिक एआई मॉडल को देखते हुए, कंपनी का कहना है, अब इस संचार अंतर को पाटना और रोबोटों को एक वैज्ञानिक की तरह…

Read more

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

जम्मू-कश्मीर घाटी में सेना का वाहन गिरने से 5 सैनिकों की मौत, कई घायल | भारत समाचार

जम्मू-कश्मीर घाटी में सेना का वाहन गिरने से 5 सैनिकों की मौत, कई घायल | भारत समाचार

‘बेबी जॉन’ की बॉक्स ऑफिस पर पहले दिन की अग्रिम बिक्री: वरुण धवन अभिनीत फिल्म ने अग्रिम बिक्री में 3.5 करोड़ रुपये का आंकड़ा पार किया; क्रिसमस पर पहले दिन की संख्या दोहरे अंक में होने की उम्मीद | हिंदी मूवी समाचार

‘बेबी जॉन’ की बॉक्स ऑफिस पर पहले दिन की अग्रिम बिक्री: वरुण धवन अभिनीत फिल्म ने अग्रिम बिक्री में 3.5 करोड़ रुपये का आंकड़ा पार किया; क्रिसमस पर पहले दिन की संख्या दोहरे अंक में होने की उम्मीद | हिंदी मूवी समाचार

अपने क्रिसमस डिनर के लिए इन 5 बॉलीवुड सेलेब-अनुमोदित पोशाक विचारों को बुकमार्क करें

अपने क्रिसमस डिनर के लिए इन 5 बॉलीवुड सेलेब-अनुमोदित पोशाक विचारों को बुकमार्क करें

तनाव, थकावट और व्यक्तिगत समय की कमी: सारी चकाचौंध और ग्लैमर के पीछे, क्या बॉलीवुड असामयिक बर्नआउट का शिकार है? | हिंदी मूवी समाचार

तनाव, थकावट और व्यक्तिगत समय की कमी: सारी चकाचौंध और ग्लैमर के पीछे, क्या बॉलीवुड असामयिक बर्नआउट का शिकार है? | हिंदी मूवी समाचार

सबवे हत्याकांड के संदिग्ध सेबेस्टियन जैपेटा का नशे में बयान वायरल: ‘मैं लोगों के बारे में कुछ नहीं कहता’

सबवे हत्याकांड के संदिग्ध सेबेस्टियन जैपेटा का नशे में बयान वायरल: ‘मैं लोगों के बारे में कुछ नहीं कहता’

जवाब नहीं मिला तो भारत से बात करूंगा: शेख हसीना के प्रत्यर्पण पर बांग्लादेश

जवाब नहीं मिला तो भारत से बात करूंगा: शेख हसीना के प्रत्यर्पण पर बांग्लादेश