
Openai ने बुधवार को दो नए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किए। डब किए गए O3 और O4-Mini, ये कंपनी के नवीनतम तर्क-केंद्रित मॉडल हैं, जिसमें दृश्य श्रृंखला-की-विचार (COT) हैं। सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि ये मॉडल दृश्य तर्क क्षमता के साथ आते हैं, जिसका अर्थ है कि वे अधिक जटिल उपयोगकर्ता प्रश्नों का उत्तर देने के लिए एक छवि के बारे में विश्लेषण और “सोच” सकते हैं। O1 और O3-Mini के उत्तराधिकारी, ये मॉडल वर्तमान में CHATGPT के भुगतान किए गए ग्राहकों के लिए उपलब्ध होंगे। विशेष रूप से, कंपनी ने इस सप्ताह के शुरू में AI मॉडल की GPT-4.1 श्रृंखला भी जारी की।
Openai के नए तर्क मॉडल बेहतर प्रदर्शन के साथ आते हैं
में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईएआई के आधिकारिक हैंडल ने नए बड़े भाषा मॉडल (एलएलएमएस) को जारी करने की घोषणा की। उन्हें कंपनी के “सबसे स्मार्ट और सबसे सक्षम मॉडल” कहते हुए, एआई फर्म ने इस बात पर प्रकाश डाला कि ये मॉडल अब दृश्य तर्क क्षमता के साथ आते हैं।
विज़ुअल रीजनिंग का अनिवार्य रूप से मतलब है कि ये एआई मॉडल उनसे प्रासंगिक और निहित जानकारी निकालने के लिए छवियों का बेहतर विश्लेषण कर सकते हैं। पर वेबसाइटOpenai ने कहा कि ये कंपनी के पहले मॉडल हैं जो चैट के भीतर हर टूल का उपयोग और संयोजन कर सकते हैं। इनमें वेब खोज, पायथन, छवि विश्लेषण, फ़ाइल व्याख्या और छवि पीढ़ी शामिल हैं।
इसका मतलब है कि O3 और O4-Mini AI मॉडल वेब पर छवि को देख सकते हैं, ज़ूमिंग, क्रॉपिंग, फ़्लिपिंग और उन्हें बढ़ाकर छवि में हेरफेर कर सकते हैं, और यहां तक कि जानकारी निकालने के लिए एक पायथन कोड भी चला सकते हैं। Openai ने कहा कि यह मॉडल को अपूर्ण छवियों से भी जानकारी खोजने की अनुमति देगा।
इन मॉडलों में से कुछ कार्यों में अब एक नोटबुक से लिखावट पढ़ना शामिल है, जो उल्टा है, एक दूर के पठनीय पाठ के साथ एक दूरगामी संकेत पढ़ना, एक बड़ी सूची से एक विशेष प्रश्न को पहचानना, एक बस की तस्वीर से एक बस अनुसूची ढूंढना, एक पहेली को हल करना, और बहुत कुछ।
प्रदर्शन के लिए, Openai ने दावा किया कि O3 और O4-Mini AI मॉडल MMMU, Mathvista, VLMs पर GPT-4O और O1 मॉडल से बेहतर प्रदर्शन करते हैं, जो अंधे हैं, और चारक्सिव बेंचमार्क हैं। कंपनी ने तीसरे पक्ष के एआई मॉडल के साथ किसी भी प्रदर्शन की तुलना को साझा नहीं किया।
Openai ने इन मॉडलों की कई सीमाओं को भी उजागर किया। एआई मॉडल अनावश्यक छवि हेरफेर कदम और उपकरण कॉल कर सकते हैं जो विचार की लंबी लंबी श्रृंखलाओं का कारण बन सकते हैं। O3 और O4-Mini भी धारणा त्रुटियों के लिए अतिसंवेदनशील हैं, और वे गलत प्रतिक्रिया देने के लिए दृश्य जानकारी की गलत व्याख्या कर सकते हैं। इसके अलावा, एआई फर्म ने इस बात पर प्रकाश डाला कि मॉडल में विश्वसनीयता से संबंधित मुद्दे भी हो सकते हैं।
O3 और O4-MINI AI दोनों मॉडल CHATGPT PLUS, PRO, और टीम उपयोगकर्ताओं को उपलब्ध कराए जा रहे हैं। वे मॉडल चयनकर्ता में O1, O3-Mini और O3-Mini-High मॉडल की जगह लेंगे। एंटरप्राइज और ईडीयू उपयोगकर्ताओं को अगले सप्ताह उन तक पहुंच मिलेगी। डेवलपर्स चैट कम्प्लीटेशन्स एंड रिस्पॉन्स एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) के माध्यम से मॉडल का उपयोग कर सकते हैं।