
कैलिफोर्निया स्थित आर्टिफिशियल इंटेलिजेंस (एआई) प्लेटफॉर्म के चरित्र एआई ने सोमवार को अपने पहले वीडियो जनरेशन मॉडल का अनावरण किया। डब किया गया अवतार, यह एक इमेज-टू-वीडियो मॉडल है जो 2 डी और 3 डी एनिमेटेड वर्ण उत्पन्न कर सकता है। एआई फर्म का दावा है कि उत्पन्न वीडियो चेहरे, हाथ और शरीर के आंदोलन के साथ अस्थायी स्थिरता रखेंगे। इसके अतिरिक्त, वीडियो में भाषण होगा, जो कंपनी के मूल पाठ-से-भाषण (टीटीएस) मॉडल द्वारा संचालित है। चरित्र AI ने कहा कि Avatarfx को आने वाले महीनों में जारी किया जाएगा, और भुगतान किए गए ग्राहकों को पहले इसका उपयोग मिलेगा।
चरित्र एआई के अवतारफैक्स यथार्थवादी मानवीय चरित्र उत्पन्न नहीं करेंगे
में एक ब्लॉग भेजाकंपनी ने नए वीडियो जनरेशन मॉडल को विस्तृत किया। अब तक, चरित्र एआई ने पाठ और छवि-आधारित मॉडल पर ध्यान केंद्रित किया है। Avatarfx के साथ, AI फर्म AI- जनित वीडियो पर एक स्टैब ले रही है। अब तक, कंपनी ने कहा है कि चरित्र AI+ ग्राहकों को मॉडल तक पहुंच मिलेगी, हालांकि, यह ज्ञात नहीं है कि क्या बाद में इसे मुक्त टियर तक विस्तारित किया जाएगा।
Avatarfx 2D एनिमेटेड वर्ण, 3 डी कार्टून वर्ण और गैर-मानव चेहरों के वीडियो उत्पन्न कर सकता है। कंपनी का दावा है कि मॉडल के प्रमुख मुख्य आकर्षण में से एक चेहरे, हाथ और शरीर के आंदोलनों के साथ अस्थायी स्थिरता है। इसका मतलब यह है कि विषय फ्रेम के बीच सुसंगत रहेगा, जबकि अतिरिक्त हथियार और दृढ़ चेहरे की अभिव्यक्तियों की तरह ग्लिच कम लगातार होंगे। यह याद रखना महत्वपूर्ण है कि ये दावे हैं, और उपकरण की क्षमताओं को जारी होने तक सत्यापित नहीं किया जा सकता है।
अधिकांश वीडियो जनरेशन मॉडल के विपरीत, Avatarfx वीडियो जनरेशन के लिए टेक्स्ट इनपुट का समर्थन नहीं करता है। इसके बजाय, मॉडल केवल इनपुट के रूप में छवियों को स्वीकार करता है। चरित्र एआई का दावा है कि यह उपयोगकर्ताओं को उत्पन्न आउटपुट पर बेहतर नियंत्रण प्राप्त करने की अनुमति देता है। वीडियो में भाषण भी शामिल होगा, जो देशी टीटीएस मॉडल का उपयोग करके उत्पन्न किया जाएगा।
आर्किटेक्चर में आकर, एआई फर्म ने कहा कि अवतारफैक्स को प्रवाह-आधारित प्रसार मॉडल पर बनाया गया है। बेस मॉडल को डॉक्यूमेंट इमेज ट्रांसफार्मर (DIT) आर्किटेक्चर का उपयोग करके जमीन से बनाया गया था, जो एक ट्रांसफॉर्मर एनकोडर मॉडल है। चरित्र एआई का दावा है कि इसने एक नई निष्कर्ष रणनीति का भी उपयोग किया, जो दृश्य गुणवत्ता, गति स्थिरता और अभिव्यंजक विविधता को लंबे समय तक वीडियो में भी संरक्षित करता है।
एआई-संचालित वीडियो जनरेशन मॉडल हमेशा डीपफेक और संभावित हानिकारक सामग्री के बारे में चिंताएं बढ़ाते हैं। चरित्र एआई ने कहा कि इस तरह के जोखिमों को कम करने के लिए कई उपाय किए हैं। Avatarfx में इन-बिल्ट सेफ्टी फ़िल्टर हैं जो वीडियो के लिए लिखने वाले संवाद उपयोगकर्ताओं की जांच करते हैं।
एआई मॉडल भी नाबालिगों, हाई-प्रोफाइल राजनेताओं और उल्लेखनीय आंकड़ों की छवियों का उपयोग करके वीडियो पीढ़ी को मंजूरी नहीं देता है। अन्य मानव तस्वीरों को पीढ़ी की प्रक्रिया में पहचानने योग्य बनाया जाता है, इसलिए व्यक्ति को वीडियो से पहचाना नहीं जा सकता है, कंपनी ने दावा किया। इसके अतिरिक्त, प्रत्येक वीडियो को दर्शकों को यह बताने के लिए वॉटरमार्क किया जाता है कि यह एआई-जनित है। हालांकि, कंपनी ने यह निर्दिष्ट नहीं किया कि क्या वॉटरमार्क केवल वीडियो के सामने-अंत में या उसके मेटाडेटा में जोड़ा गया है या नहीं।
चरित्र एआई ने कहा कि इसने सुविधा के लिए नए शब्दों का एक सेट भी जोड़ा है, जो कि बिना अनुमति के प्रतिरूपण, बदमाशी, डीपफेक और संरक्षित आईपी के उपयोग के लिए अवतारफैक्स के उपयोग को प्रतिबंधित करता है। उल्लंघन के परिणामस्वरूप एक “सख्त” एक-स्ट्राइक प्रतिबंध होगा।