अलीबाबा ने हाल ही में मार्को-ओ1 नाम से एक तर्क-केंद्रित कृत्रिम बुद्धिमत्ता (एआई) मॉडल पेश किया है। मॉडल QwQ-32B बड़े भाषा मॉडल के समान है, जिसे उन्नत तर्क क्षमताओं की आवश्यकता वाले कार्यों के लिए भी अनुकूलित किया गया है, हालांकि, एक महत्वपूर्ण अंतर यह है कि मार्को-ओ1 एक छोटा मॉडल है और Qwen2-7B-इंस्ट्रक्ट मॉडल से डिस्टिल्ड है। . चीनी टेक दिग्गज ने दावा किया कि नए मॉडल को तर्क-केंद्रित बनाने के लिए कई फाइन-ट्यूनिंग अभ्यासों का उपयोग किया गया है। इसके अतिरिक्त, शोधकर्ताओं ने इस बात पर प्रकाश डाला कि यह जटिल वास्तविक दुनिया की समस्या-समाधान कार्यों के लिए अनुकूलित है।
अलीबाबा मार्को-ओ1 एआई मॉडल
एक शोध में नए एआई मॉडल के बारे में विस्तार से बताया गया है कागज़ एक ऑनलाइन प्री-प्रिंट जर्नल, arXiv पर प्रकाशित। विशेष रूप से, ऑनलाइन जर्नल में प्रकाशित पत्रों की सहकर्मी-समीक्षा नहीं की जाती है। इसके अतिरिक्त, अलीबाबा के पास भी है की मेजबानी हगिंग फेस पर एआई मॉडल और अपाचे 2.0 लाइसेंस के तहत व्यक्तिगत और व्यावसायिक उपयोग के मामलों के लिए इसे डाउनलोड करने और उपयोग करने की अनुमति दी गई है।
हालाँकि, यह पूरी तरह से खुला-स्रोत नहीं है क्योंकि केवल आंशिक डेटासेट ही उपलब्ध कराया गया है। इस प्रकार, उपयोगकर्ता आर्किटेक्चर या घटकों का विश्लेषण करने के लिए मॉडल को दोहराने या इसे तोड़ने में सक्षम नहीं होंगे।
मार्को-ओ1 की बात करें तो इसे Qwen2-7B-Instruct फाउंडेशन मॉडल से फाइन-ट्यून किया गया है। पेपर में, शोधकर्ताओं ने इस बात पर प्रकाश डाला कि एआई मॉडल चेन-ऑफ-थॉट (सीओटी) फाइन-ट्यूनिंग, मोंटे कार्लो ट्री सर्च (एमसीटीएस), प्रतिबिंब तंत्र और अन्य तर्क रणनीतियों द्वारा संचालित है।
परिणामस्वरूप, अलीबाबा का मार्को-ओ1 ओपन-एंडेड प्रश्नों को हल कर सकता है और प्रतिक्रियाओं के लिए प्रश्न ढूंढ सकता है “जहां स्पष्ट मानक अनुपस्थित हैं और पुरस्कारों को निर्धारित करना चुनौतीपूर्ण है।” हालाँकि, यह समझा जाना चाहिए कि उन्नत तर्क क्षमताएँ किसी हार्डवेयर या वास्तुशिल्प उन्नति से नहीं आई हैं।
इसके बजाय, आज सभी तर्कशील मॉडल टेस्ट-टाइम कंप्यूट नामक तकनीक का उपयोग करते हैं जो एआई मॉडल को एक ही क्वेरी पर अधिक प्रसंस्करण समय बिताने की सुविधा देता है। यह उन्हें समाधान खोजने और स्वयं तथ्यों की जांच करने के लिए विभिन्न सिद्धांतों का परीक्षण करने की अनुमति देता है। परिणामस्वरूप, ये मॉडल अधिक सटीक प्रतिक्रियाएँ प्रदान करने और जटिल कार्यों को पूरा करने के लिए तैयार हैं। शोधकर्ताओं के अनुसार, एक महत्वपूर्ण क्षेत्र जहां मार्को-ओ1 उत्कृष्ट है, वह है बोलचाल की बारीकियों को समझना और कठबोली अभिव्यक्तियों का अनुवाद करना।
शोधकर्ताओं के अनुसार, एआई मॉडल की एक सीमा में दावा किया गया है कि मार्को-ओ1 तर्क विशेषताओं को दिखाता है, लेकिन “इसका प्रदर्शन अभी भी पूरी तरह से महसूस किए गए” तर्क मॉडल से कम है।