विशेषज्ञों के मिश्रण वाले आर्किटेक्चर के साथ डीपसीक-वी3 ओपन-सोर्स एआई मॉडल जारी किया गया

चीनी कृत्रिम बुद्धिमत्ता (एआई) फर्म डीपसीक ने गुरुवार को डीपसीक-वी3 एआई मॉडल जारी किया। नए ओपन-सोर्स लार्ज लैंग्वेज मॉडल (एलएलएम) में बड़े पैमाने पर 671 बिलियन पैरामीटर हैं, जो मेटा लामा 3.1 मॉडल को पीछे छोड़ देता है जिसमें 405 बिलियन पैरामीटर हैं। इसके आकार के बावजूद, शोधकर्ताओं ने दावा किया कि एलएलएम अपने मिश्रण-विशेषज्ञ (एमओई) वास्तुकला के साथ दक्षता की ओर केंद्रित है। इसके कारण, एआई मॉडल केवल प्रदान किए गए कार्य से संबंधित विशिष्ट मापदंडों को सक्रिय कर सकता है और दक्षता और सटीकता सुनिश्चित कर सकता है। विशेष रूप से, यह एक टेक्स्ट-आधारित मॉडल है और इसमें मल्टीमॉडल क्षमताएं नहीं हैं। डीपसीक-वी3 एआई मॉडल जारी वर्तमान में ओपन-सोर्स डीपसीक-वी3 एआई मॉडल चल रहा है की मेजबानी गले मिलते चेहरे पर. लिस्टिंग के अनुसार, एलएलएम कुशल अनुमान और लागत प्रभावी प्रशिक्षण के लिए तैयार है। इसके लिए शोधकर्ताओं ने मल्टी-हेड लेटेंट अटेंशन (एमएलए) और डीपसीकएमओई आर्किटेक्चर को अपनाया। अनिवार्य रूप से, एआई मॉडल केवल उन मापदंडों को सक्रिय करता है जो प्रॉम्प्ट के विषय के लिए प्रासंगिक हैं, इस आकार के विशिष्ट मॉडल की तुलना में तेज़ प्रसंस्करण और उच्च सटीकता सुनिश्चित करते हैं। 14.8 ट्रिलियन टोकन पर पूर्व-प्रशिक्षित, डीपसीक-वी3 उच्च-गुणवत्ता वाली प्रतिक्रियाएं उत्पन्न करने के लिए पर्यवेक्षित फाइन-ट्यूनिंग और सुदृढीकरण सीखने जैसी तकनीकों का उपयोग करता है। चीनी फर्म ने दावा किया कि इसके आकार के बावजूद, AI मॉडल को Nvidia H800 GPU के साथ 2.788 मिलियन घंटों में पूरी तरह से प्रशिक्षित किया गया था। डीपसीक-वी3 के आर्किटेक्चर में प्रदर्शन में गिरावट को कम करने के लिए लोड-बैलेंसिंग तकनीक भी शामिल है। इस तकनीक का प्रयोग सबसे पहले इसके पूर्ववर्ती पर किया गया था। प्रदर्शन की बात करें तो, शोधकर्ताओं ने मॉडल के आंतरिक परीक्षण से प्राप्त आंकड़ों को साझा किया और दावा किया कि यह बिग-बेंच हाई-परफॉर्मेंस (बीबीएच), मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (एमएमएलयू), ह्यूमनएवल, एमएटीएच पर मेटा लामा 3.1 और क्वेन 2.5 मॉडल से बेहतर प्रदर्शन करता है। और कई अन्य बेंचमार्क। हालाँकि, ये वर्तमान…

Read more

You Missed

सोनिया गांधी को ‘सुपर पीएम’ बनाकर कांग्रेस ने मनमोहन सिंह को अपमानित किया: बीजेपी | भारत समाचार
एलोन मस्क विवेक रामास्वामी: ‘एच-1बी वीजा साइओप का लक्ष्य एलोन, विवेक के DOGE को नष्ट करना है’: एमएजीए विभाजन के बीच वायरल दावा
मनमोहन सिंह की अंतिम यात्रा पर भावभीनी श्रद्धांजलि | भारत समाचार
चीफ्स की जीत के बाद स्टीलर्स के प्रशंसक द्वारा पहनी गई “टेलर स्विफ्ट सक्स” शर्ट के कारण हंगामा हुआ और उसे बार से बाहर निकाल दिया गया | एनएफएल न्यूज़
ईडी ने रूसी को 800 करोड़ रुपये के ऑक्टाएफएक्स घोटाले का मास्टरमाइंड बताया
खोया हुआ शहर | गोवा समाचार