ओपनएआई ने सोमवार को अपना बहुप्रतीक्षित स्प्रिंग अपडेट इवेंट आयोजित किया, जिसमें उसने चैटजीपीटी के लिए एक नया डेस्कटॉप ऐप, चैटजीपीटी के वेब क्लाइंट में मामूली यूजर इंटरफेस बदलाव और जीपीटी-4o नामक एक नए फ्लैगशिप-लेवल आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल की घोषणा की। इस इवेंट को YouTube पर ऑनलाइन स्ट्रीम किया गया और एक छोटे से लाइव ऑडियंस के सामने आयोजित किया गया। इवेंट के दौरान, एआई फर्म ने यह भी घोषणा की कि सभी GPT-4 सुविधाएँ, जो अब तक केवल प्रीमियम उपयोगकर्ताओं के लिए उपलब्ध थीं, अब सभी के लिए निःशुल्क उपलब्ध होंगी।
OpenAI का ChatGPT डेस्कटॉप ऐप और इंटरफ़ेस रिफ़्रेश
ओपनएआई की मुख्य तकनीकी अधिकारी मीरा मुराती ने कार्यक्रम की शुरुआत की और नया चैटजीपीटी डेस्कटॉप ऐप लॉन्च किया, जो अब कंप्यूटर विज़न के साथ आता है और उपयोगकर्ता की स्क्रीन को देख सकता है। उपयोगकर्ता इस सुविधा को चालू और बंद कर सकेंगे, और एआई जो कुछ भी दिखाया जाएगा उसका विश्लेषण और सहायता करेगा। सीटीओ ने यह भी खुलासा किया कि चैटजीपीटी के वेब संस्करण को एक मामूली इंटरफ़ेस रिफ्रेश मिल रहा है। नया यूआई एक न्यूनतम उपस्थिति के साथ आता है और उपयोगकर्ता वेबसाइट में प्रवेश करते समय सुझाव कार्ड देखेंगे। आइकन भी छोटे हैं और पूरे साइड पैनल को छिपाते हैं, जिससे स्क्रीन का एक बड़ा हिस्सा बातचीत के लिए उपलब्ध होता है। विशेष रूप से, चैटजीपीटी अब वेब ब्राउज़र तक भी पहुँच सकता है और रियल-टाइम खोज परिणाम प्रदान कर सकता है।
GPT-4o विशेषताएँ
ओपनएआई इवेंट का मुख्य आकर्षण कंपनी का सबसे नया फ्लैगशिप-ग्रेड एआई मॉडल था जिसे GPT-4o कहा जाता है, जहाँ ‘o’ का मतलब ओमनी-मॉडल है। मुराती ने बताया कि नया चैटबॉट GPT-4 टर्बो मॉडल की तुलना में दोगुना तेज़, 50 प्रतिशत सस्ता और पाँच गुना ज़्यादा दर सीमा वाला है।
GPT-4o प्रतिक्रियाओं की विलंबता में भी महत्वपूर्ण सुधार प्रदान करता है और स्पीच मोड में भी वास्तविक समय की प्रतिक्रियाएँ उत्पन्न कर सकता है। AI मॉडल के लाइव डेमो में, OpenAI ने दिखाया कि यह वास्तविक समय में बातचीत कर सकता है और उपयोगकर्ता को प्रतिक्रिया दे सकता है। GPT-4o-संचालित चैटGPT को अब किसी अलग प्रश्न का उत्तर देने के लिए भी बाधित किया जा सकता है, जो पहले असंभव था। हालाँकि, अनावरण किए गए मॉडल में सबसे बड़ी वृद्धि भावनात्मक आवाज़ों का समावेश है।
अब, जब चैटजीपीटी बोलता है, तो इसकी प्रतिक्रियाओं में विभिन्न आवाज़ें शामिल होती हैं, जिससे यह अधिक मानवीय और कम रोबोटिक लगता है। एक डेमो ने दिखाया कि एआई भाषण में मानवीय भावनाओं को भी पकड़ सकता है और उन पर प्रतिक्रिया कर सकता है। उदाहरण के लिए, यदि कोई उपयोगकर्ता घबराई हुई आवाज़ में बोलता है, तो यह चिंतित आवाज़ में बोलेगा।
इसके कंप्यूटर विज़न में भी सुधार किए गए हैं, और लाइव डेमो के आधार पर, यह अब डिवाइस के कैमरे से लाइव वीडियो फ़ीड को प्रोसेस और रिस्पॉन्ड कर सकता है। यह उपयोगकर्ता को गणितीय समीकरण हल करते हुए देख सकता है और चरण-दर-चरण मार्गदर्शन प्रदान कर सकता है। यदि उपयोगकर्ता कोई गलती करता है तो यह वास्तविक समय में उसे सही भी कर सकता है। इसी तरह, यह अब बड़े कोडिंग डेटा को प्रोसेस कर सकता है और तुरंत उसका विश्लेषण कर सकता है और उसे सुधारने के लिए सुझाव साझा कर सकता है। अंत में, उपयोगकर्ता अब कैमरा खोल सकते हैं और अपने चेहरे को दिखाते हुए बोल सकते हैं, और AI उनकी भावनाओं का पता लगा सकता है।
अंत में, एक अन्य लाइव डेमो ने इस बात पर प्रकाश डाला कि नवीनतम AI मॉडल द्वारा संचालित ChatGPT, लाइव वॉयस ट्रांसलेशन भी कर सकता है और त्वरित उत्तराधिकार में कई भाषाओं में बोल सकता है। जबकि OpenAI ने GPT-4o मॉडल तक पहुँच के लिए सदस्यता मूल्य का उल्लेख नहीं किया, इसने इस बात पर प्रकाश डाला कि इसे आने वाले हफ्तों में रोल आउट किया जाएगा और यह API के रूप में उपलब्ध होगा।
GPT-4 अब निःशुल्क उपलब्ध है
सभी नए लॉन्च के अलावा, OpenAI ने GPT-4 AI मॉडल को भी मुफ्त में उपलब्ध कराया है, जिसमें इसकी विशेषताएं भी शामिल हैं। प्लेटफ़ॉर्म के मुफ़्त टियर का उपयोग करने वाले लोग GPT (विशिष्ट उपयोग के मामलों के लिए डिज़ाइन किए गए मिनी चैटबॉट), GPT स्टोर, मेमोरी फ़ीचर जैसी सुविधाओं तक पहुँच पाएंगे, जिसके माध्यम से AI भविष्य की बातचीत के लिए उपयोगकर्ता और उनसे संबंधित विशिष्ट जानकारी को याद रख सकता है, और इसके उन्नत डेटा एनालिटिक्स बिना कुछ भुगतान किए।