Openai API में नए ऑडियो मॉडल का परिचय देता है, एजेंटिक वर्कफ़्लोज़ के लिए उपयोग किया जा सकता है

Openai ने गुरुवार को, एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (API) में नए ऑडियो मॉडल पेश किए, जो सटीकता और विश्वसनीयता में बेहतर प्रदर्शन प्रदान करते हैं। सैन फ्रांसिस्को स्थित एआई फर्म ने स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन और टेक्स्ट-टू-स्पीच (टीटीएस) दोनों कार्यों के लिए तीन नए आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किए। कंपनी ने दावा किया कि ये मॉडल डेवलपर्स को एजेंटिक वर्कफ़्लोज़ के साथ एप्लिकेशन बनाने में सक्षम करेंगे। यह भी कहा गया है कि एपीआई व्यवसायों को ग्राहक सहायता जैसे संचालन को स्वचालित करने में सक्षम कर सकता है। विशेष रूप से, नए मॉडल कंपनी के GPT-4O और GPT-4O मिनी AI मॉडल पर आधारित हैं।

Openai API में नए ऑडियो मॉडल लाता है

में एक ब्लॉग भेजाएआई फर्म ने नए एपीआई-विशिष्ट एआई मॉडल को विस्तृत किया। कंपनी ने इस बात पर प्रकाश डाला कि पिछले कुछ वर्षों में इसने कई एआई एजेंटों जैसे कि ऑपरेटर, डीप रिसर्च, कंप्यूटर-यूजिंग एजेंटों और अंतर्निहित उपकरणों के साथ एपीआई को जारी किया है। हालांकि, यह कहा गया है कि एजेंटों की वास्तविक क्षमता को केवल तब अनलॉक किया जा सकता है जब वे सहज रूप से प्रदर्शन कर सकते हैं और पाठ से परे माध्यमों में बातचीत कर सकते हैं।

तीन नए ऑडियो मॉडल हैं। GPT-4O-Transcribe और GPT-4O-Mini-Transcribe स्पीच-टू-टेक्स्ट मॉडल हैं और GPT-4O-Mini-TTS है, जैसा कि नाम से पता चलता है, एक TTS मॉडल। Openai का दावा है कि ये मॉडल अपने मौजूदा कानाफूसी मॉडल से बेहतर प्रदर्शन करते हैं जो 2022 में जारी किए गए थे। हालांकि, पुराने मॉडलों के विपरीत, नए खुले-स्रोत नहीं हैं।

GPT-4O-Transcribe में आकर, AI फर्म ने कहा कि यह “वर्ड एरर रेट” (WER) प्रदर्शन में सुधार करता है, जो कि भाषण (Fleurs) बेंचमार्क के सार्वभौमिक अभ्यावेदन के कुछ-शॉट सीखने के मूल्यांकन पर प्रदर्शन करता है जो 100 भाषाओं में बहुभाषी भाषण पर AI मॉडल का परीक्षण करता है। Openai ने कहा कि सुधार लक्षित प्रशिक्षण तकनीकों जैसे कि सुदृढीकरण सीखने (RL) और उच्च गुणवत्ता वाले ऑडियो डेटासेट के साथ व्यापक मिडट्रेनिंग का परिणाम था।

ये स्पीच-टू-टेक्स्ट मॉडल ऑडियो को चुनौतीपूर्ण परिदृश्यों जैसे कि भारी लहजे, शोर वातावरण और अलग-अलग भाषण गति जैसे चुनौतीपूर्ण परिदृश्यों में कैप्चर कर सकते हैं।

GPT-4O-MINI-TTS मॉडल भी महत्वपूर्ण सुधारों के साथ आता है। एआई फर्म का दावा है कि मॉडल अनुकूलन योग्य विभक्तियों, अंतरंगता और भावनात्मक अभिव्यक्ति के साथ बात कर सकते हैं। यह डेवलपर्स को उन अनुप्रयोगों का निर्माण करने में सक्षम करेगा जिनका उपयोग ग्राहक सेवा और रचनात्मक कहानी सहित कई प्रकार के कार्यों के लिए किया जा सकता है। विशेष रूप से, मॉडल केवल कृत्रिम और पूर्व निर्धारित आवाज़ प्रदान करता है।

Openai का API मूल्य निर्धारण पेज इस बात पर प्रकाश डाला गया कि GPT-4O- आधारित ऑडियो मॉडल में $ 40 (लगभग 3,440 रुपये) प्रति मिलियन इनपुट टोकन और $ 80 (लगभग 6,880 रुपये) प्रति मिलियन आउटपुट टोकन खर्च होंगे। दूसरी ओर, GPT-4O मिनी-आधारित ऑडियो मॉडल $ 10 (लगभग 860 रुपये) प्रति मिलियन इनपुट टोकन और $ 20 (लगभग 1,720 रुपये) प्रति मिलियन आउटपुट टोकन की दर से शुल्क लिया जाएगा।

सभी ऑडियो मॉडल अब एपीआई के माध्यम से डेवलपर्स के लिए उपलब्ध हैं। Openai उपयोगकर्ताओं को वॉयस एजेंट बनाने में मदद करने के लिए अपने एजेंट्स सॉफ्टवेयर डेवलपमेंट किट (SDK) के साथ एक एकीकरण जारी कर रहा है।

Source link

Related Posts

हबल टेलीस्कोप ने एनजीसी 4536 को कैप्चर किया, एक स्टारबर्स्ट आकाशगंगा के साथ गहन स्टार फॉर्मेशन

स्टारबर्स्ट गैलेक्सी एनजीसी 4536 की एक हड़ताली छवि नासा द्वारा जारी की गई है, जो इसके ज्वलंत ब्लू स्टार क्लस्टर और चमकते गुलाबी हाइड्रोजन गैस को दिखाती है। कन्या नक्षत्र में पृथ्वी से लगभग 50 मिलियन प्रकाश-वर्ष स्थित, यह मध्यवर्ती सर्पिल आकाशगंगा एक गतिशील वातावरण प्रदर्शित करता है जहां नए सितारे एक त्वरित दर पर बन रहे हैं। हबल स्पेस टेलीस्कोप द्वारा ली गई छवि, एक उज्ज्वल मध्य क्षेत्र को उजागर करती है, जो तारकीय नर्सरी के साथ सर्पिल हथियारों को बढ़ाकर घेरती है। एनजीसी 4536 में सितारों के तेजी से गठन ने इसे स्टारबर्स्ट आकाशगंगाओं की श्रेणी में रखा है, जो औसत आकाशगंगा की तुलना में काफी अधिक स्टार गठन दरों को प्रदर्शित करता है। गांगेय बातचीत के कारण तीव्र स्टार गठन अनुसार नासा के लिए, एक कॉम्पैक्ट क्षेत्र में गुरुत्वाकर्षण बातचीत या केंद्रित गैस संचय अक्सर स्टारबर्स्ट गतिविधि को ट्रिगर करते हैं। एनजीसी 4536 के मामले में, इसकी बार जैसी संरचना को कोर की ओर चैनल गैस के रूप में माना जाता है, प्रक्रिया को तेज करता है। गैलेक्सी कन्या क्लस्टर के भीतर M61 समूह का एक हिस्सा है, जहां पास की आकाशगंगाओं का गुरुत्वाकर्षण प्रभाव इंटरस्टेलर गैस को संपीड़ित करने में योगदान देता है, जो तारकीय जन्म के लिए अनुकूल स्थिति प्रदान करता है। आकाशगंगा पर तारकीय विस्फोटों का प्रभाव इस आकाशगंगा में बड़े पैमाने पर, गर्म नीले सितारों का तेजी से उत्पादन किया जा रहा है, लेकिन उनके छोटे जीवनकाल में तीव्र पराबैंगनी विकिरण उत्सर्जन होता है। ये तारे जल्दी से बाहर जलते हैं, सुपरनोवा में अपने चक्रों को समाप्त करते हैं जो आसपास के क्षेत्रों में ऊर्जा को दूर करते हैं। यह पराबैंगनी विकिरण हाइड्रोजन गैस को आयनित करता है, जिससे HII ज़ोन के रूप में जाना जाता है चमकदार गुलाबी क्षेत्रों का निर्माण होता है। हबल छवि में दिखाई देने वाले इन क्षेत्रों की उपस्थिति, उन क्षेत्रों को इंगित करती है जहां नए सितारे उभर रहे हैं। एक व्यापक खगोलीय अध्ययन का हिस्सा इस…

Read more

एनोरा अब Jiohotstar पर स्ट्रीमिंग: सब कुछ आपको जानना आवश्यक है

समीक्षकों द्वारा प्रशंसित फिल्म एनोरा ने स्ट्रीमिंग के लिए अपना रास्ता बना लिया है और अब मोर हब पर उपलब्ध है, विशेष रूप से जियोहोटस्टार पर। सीन बेकर द्वारा निर्देशित, इस कॉमेडी-ड्रामा ने अपनी मनोरंजक कथा और सम्मोहक प्रदर्शनों के लिए व्यापक मान्यता प्राप्त की है। प्रमुख अंतरराष्ट्रीय फिल्म समारोहों और कई प्रशंसाओं में अपनी मजबूत उपस्थिति के साथ, एनोरा 2024 की सबसे अधिक चर्चा की जाने वाली फिल्मों में से एक बन गई है। कब और कहाँ देखने के लिए Anora एनोरा ने 21 मई, 2024 को 77 वें कान्स फिल्म फेस्टिवल में प्रीमियर किया और प्रतिष्ठित पाल्मे डी’ओर प्राप्त किया। अक्टूबर 2024 में अपनी नाटकीय रिलीज के बाद, फिल्म अब डिजिटल प्लेटफार्मों पर आ गई है। ऑडियंस इसे मोर हब पर स्ट्रीम कर सकते हैं, जो विशेष रूप से Jiohotstar पर, अंग्रेजी और हिंदी दोनों में उपलब्ध हैं। आधिकारिक ट्रेलर और एनोरा का कथानक यह फिल्म एनी के इर्द -गिर्द घूमती है, जो मिकी मैडिसन द्वारा निभाई गई थी, जो ब्रुकलिन में एक स्ट्रिप क्लब में काम करती है। वह इवान “वान्या” ज़खारोव के साथ पथ पार करती है, जो एक रूसी कुलीन वर्ग के अमीर अभी तक लापरवाह बेटा है। एक लेन -देन के संबंध के रूप में जो शुरू होता है, वह जल्द ही लास वेगास में एक सहज विवाह की ओर जाता है। हालांकि, उनका संघ वान्या के शक्तिशाली परिवार से तीव्र बैकलैश को ट्रिगर करता है, जिससे संघर्ष, जबरदस्ती और जीवन-परिवर्तनकारी निर्णय होते हैं। कॉमेडी और ड्रामा का मिश्रण, फिल्म पावर डायनेमिक्स, इमोशनल स्ट्रॉग्स और इम्पल्सिव विकल्पों के परिणामों की पड़ताल करती है। अनोरा को अपने तेज लेखन, मनोरंजक प्रदर्शन और बेकर के हस्ताक्षर यथार्थवादी कहानी कहने के लिए प्रशंसा की गई है। कास्ट एंड क्रू ऑफ अनोरा फिल्म में मिकी मैडिसन को एनोरा के रूप में देखा गया है, जिसमें मार्क आईडेलशेयिन ने वान्या ज़खारोव को चित्रित किया है। युरा बोरिसोव, कर्रन करागुलियन, वेचे टावमासियन, दरिया एकामासोवा, और अलेक्सी सेरेब्रीकोव ने निर्णायक सहायक…

Read more

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

‘हजारों इच्छाएँ आप भाग्य’

‘हजारों इच्छाएँ आप भाग्य’

‘अमेरिकी पायलटों के लिए सिग्नल चैट लीक परिणाम भयावह हो सकते थे’: अटलांटिक

‘अमेरिकी पायलटों के लिए सिग्नल चैट लीक परिणाम भयावह हो सकते थे’: अटलांटिक

‘चिंता की इकाई’: सरकार USCIRF में बाहर आ गई | भारत समाचार

‘चिंता की इकाई’: सरकार USCIRF में बाहर आ गई | भारत समाचार

बांग्लादेश की योजना को ‘मुख्तिजोदधा’ को फिर से परिभाषित करने की योजना फिर से पश्चिम बंगाल में एक बहस को भड़काता है भारत समाचार

बांग्लादेश की योजना को ‘मुख्तिजोदधा’ को फिर से परिभाषित करने की योजना फिर से पश्चिम बंगाल में एक बहस को भड़काता है भारत समाचार