
ग्रोक के पीछे एलोन मस्क के नेतृत्व वाली आर्टिफिशियल इंटेलिजेंस (एआई) फर्म एक्सई ने बुधवार को एक नया एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) जारी किया। नया एपीआई अद्वितीय है क्योंकि यह पहला डेवलपर टूल है जो छवि पीढ़ी का समर्थन करता है। कंपनी ने हाल ही में डेवलपर्स पर ध्यान केंद्रित किया है और नवंबर 2024 में आने वाले पहले एक के बाद से पांच एपीआई के रूप में जारी किए हैं। मूल्य निर्धारण को स्टेटर के अंत में थोड़ा कहा जाता है, और कंपनी वर्तमान में उपयोगकर्ताओं को आउटपुट को अनुकूलित नहीं करने दे रही है।
XAI छवि पीढ़ी क्षमता के साथ नए एपीआई का परिचय देता है
नवीनतम जोड़ से पहले, XAI ने एपीआई के रूप में चार अनुकूलित एआई मॉडल की पेशकश की। दो ग्रोक लार्ज लैंग्वेज मॉडल (एलएलएम) के पहले पुनरावृत्ति पर आधारित थे और दो ग्रोक 2 पर आधारित थे। जबकि कंपनी ने इमेज अंडरस्टैंडिंग फीचर की पेशकश की थी, एपीआई का उपयोग करके छवियों को उत्पन्न करने का कोई तरीका नहीं था।
यह संभावना थी क्योंकि XAI अपने चैट प्लेटफ़ॉर्म के माध्यम से उपलब्ध छवि उत्पादन क्षमता को आउटसोर्स कर रहा था। पिछले साल तक, ग्रोक पर छवि पीढ़ी को एआई स्टार्टअप ब्लैक फॉरेस्ट लैब्स द्वारा संभाला गया था। हालांकि, दिसंबर में, एआई फर्म ने ऑरोरा की रिहाई की घोषणा की, जो विशेषज्ञों (एमओई) नेटवर्क के मिश्रण पर निर्मित एक छवि पीढ़ी मॉडल है। ऐसा प्रतीत होता है कि कंपनी अब डेवलपर्स के लिए मॉडल का विस्तार कर रही है।
इसके प्रलेखन में पेजXAI अब एक नए एपीआई मॉडल को सूचीबद्ध करता है जिसे ‘ग्रोक -2-इमेज -1212’ डब किया गया है जो छवि पीढ़ी क्षमता के साथ आता है। कार्यक्षमता सीधी है। एक बार एक पाठ प्रॉम्प्ट भेजने के बाद, एक चैट मॉडल निर्देश लेता है और बेहतर स्पष्टता के लिए संकेत को संशोधित करता है। संशोधित प्रॉम्प्ट को इमेज जेनरेशन मॉडल के साथ साझा किया जाता है और आउटपुट उत्पन्न होता है।
वर्तमान में, डेवलपर्स पैरामीटर को समायोजित करके एकल अनुरोध के साथ 10 छवियों को उत्पन्न कर सकते हैं। प्रति सेकंड पांच अनुरोधों की एक सीमा है, क्रॉसिंग जो एक त्रुटि संदेश वापस कर देगा। छवियों को JPEG प्रारूप में साझा किया गया है। एक TechCrunch प्रतिवेदन दावा किया कि XAI प्रति छवि $ 0.07 (लगभग 6 रुपये) शुल्क लेगा।
मूल्य निर्धारण सेवा को उच्च अंत पर रखता है, यह देखते हुए कि ब्लैक फॉरेस्ट लैब्स के फ्लक्स एपीआई की लागत $ 0.05 (लगभग लगभग 4 रुपये) प्रति छवि है और Google की इमेजेन 3 की लागत $ 0.03 (लगभग लगभग 2.5 रुपये) प्रति छवि है। हालांकि, IDEOMM अभी भी प्रति छवि $ 0.08 (लगभग लगभग 7 रुपये) पर अधिक महंगा है।
इसके अतिरिक्त, XAI ने इस बात पर प्रकाश डाला कि API वर्तमान में आउटपुट अनुकूलन का समर्थन नहीं करता है जैसे कि छवियों की गुणवत्ता, आकार या शैली को बदलना। विशेष रूप से, API का समापन बिंदु OpenAI SDK के साथ संगत है और उपयोगकर्ता एक ही Base_url का उपयोग कर सकते हैं। हालांकि, यह एन्थ्रोपिक एसडीके के साथ संगत नहीं है।