मिस्ट्रल ने बुधवार को पिक्सट्रल 12बी नाम से अपना पहला मल्टीमॉडल आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया। ओपन-सोर्स लार्ज लैंग्वेज मॉडल (एलएलएम) के लिए जानी जाने वाली एआई फर्म ने नवीनतम एआई मॉडल को गिटहब और हगिंग फेस पर भी उपलब्ध कराया है, ताकि उपयोगकर्ता इसे डाउनलोड करके देख सकें। उल्लेखनीय रूप से, मल्टीमॉडल होने के बावजूद, पिक्सट्रल केवल कंप्यूटर विज़न तकनीक का उपयोग करके छवियों को संसाधित कर सकता है और उनके बारे में प्रश्नों का उत्तर दे सकता है। इस कार्यक्षमता के लिए दो विशेष एनकोडर जोड़े गए हैं। यह स्टेबल डिफ्यूजन मॉडल या मिडजर्नी के जेनरेटिव एडवर्सरील नेटवर्क (जीएएन) जैसी छवियां उत्पन्न नहीं कर सकता है।
मिस्ट्रल ने पिक्सल 12बी जारी किया
न्यूनतम घोषणाओं के लिए ख्याति प्राप्त करते हुए, मिस्ट्रल ऑन एक्स के आधिकारिक खाते (जिसे पहले ट्विटर के रूप में जाना जाता था) ने एआई मॉडल को एक नए अंदाज में जारी किया। डाक इसके मैग्नेट लिंक को साझा करके। पिक्सट्रल 12बी का कुल फ़ाइल आकार 24 जीबी है, और मॉडल को चलाने के लिए एनपीयू-सक्षम पीसी या शक्तिशाली जीपीयू वाले पीसी की आवश्यकता होगी।
पिक्सट्रल 12बी 12 बिलियन पैरामीटर के साथ आता है और इसे कंपनी के मौजूदा निमो 12बी एआई मॉडल का उपयोग करके बनाया गया है। मिस्ट्रल ने बताया कि उपयोगकर्ताओं को विज़न एडाप्टर के रूप में गॉसियन एरर लीनियर यूनिट (GeLU) और विज़न एनकोडर के रूप में 2D रोटरी पोजिशन एम्बेडिंग (RoPE) की भी आवश्यकता होगी।
विशेष रूप से, उपयोगकर्ता पिक्सट्रल 12बी पर छवि फ़ाइलें या यूआरएल अपलोड कर सकते हैं और यह छवि के बारे में प्रश्नों का उत्तर देने में सक्षम होना चाहिए जैसे कि वस्तुओं की पहचान करना, वस्तुओं की संख्या गिनना और अतिरिक्त जानकारी साझा करना। चूंकि यह निमो पर बनाया गया है, इसलिए मॉडल सभी सामान्य टेक्स्ट-आधारित कार्यों को पूरा करने में भी सक्षम होगा।
एक रेडिट उपयोगकर्ता की तैनाती पिक्सट्रल 12बी के बेंचमार्किंग स्कोर के बारे में एक छवि, और ऐसा प्रतीत होता है कि चार्टक्यूए बेंच पर मल्टीमॉडल क्षमताओं में एलएलएम क्लाउड-3 हाइकू और फी-3 विजन से बेहतर प्रदर्शन करता है। यह मल्टीमॉडल ज्ञान और तर्क के लिए मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (एमएमएलयू) बेंच पर दोनों प्रतिद्वंद्वी एआई मॉडल से भी बेहतर प्रदर्शन करता है।
कंपनी के प्रवक्ता टेकक्रंच के हवाले से रिपोर्टों मिस्ट्रल एआई मॉडल को बेहतर बनाया जा सकता है और अपाचे 2.0 लाइसेंस के तहत इस्तेमाल किया जा सकता है। इसका मतलब है कि मॉडल से आउटपुट का इस्तेमाल बिना किसी प्रतिबंध के व्यक्तिगत या व्यावसायिक उपयोग के लिए किया जा सकता है। इसके अलावा, मिस्ट्रल में डेवलपर रिलेशंस की प्रमुख सोफिया यांग ने एक लेख में स्पष्ट किया डाक पिक्सल 12बी जल्द ही ले चैट और ले प्लेटफार्म पर उपलब्ध होगा।
फिलहाल, यूज़र कंपनी द्वारा दिए गए मैग्नेट लिंक का इस्तेमाल करके सीधे AI मॉडल डाउनलोड कर सकते हैं। वैकल्पिक रूप से, मॉडल का वज़न भी बदल दिया गया है की मेजबानी हगिंग फेस और गिटहब पर लिस्टिंग.