भारत में अब OpenAI और Google जैसी बड़ी टेक कंपनियों से मुकाबला करने के लिए अपने खुद के AI मॉडल बनाने की ज़रूरत बढ़ रही है. अब, एक कंपनी का दावा है कि उसने न सिर्फ़ यह हासिल किया है, बल्कि दुनिया की सबसे बड़ी कंपनियों को भी पीछे छोड़ दिया है. कम से कम कंपनी के CEO, प्रत्युष कुमार के अनुसार, इस कामयाबी का क्रेडिट Sarvam AI को जाता है, जिन्होंने अपने दावे को साबित करने के लिए एक टेस्ट चार्ट शेयर किया.


उनकी पोस्ट में कहा गया है कि कंपनी का AI चैटबॉट Sarvam Vision, जो ChatGPT और Gemini से मुकाबला करता है, ने कुछ मामलों में बेहतर परफॉर्म करके बड़ी AI कंपनियों के मॉडल को पीछे छोड़ दिया है. पोस्ट के अनुसार, स्थानीय रूप से विकसित AI मॉडल ने OmniDocBench v1.5 बेंचमार्क टेस्ट में 93% से ज़्यादा स्कोर किया.
इस बेंचमार्क टेस्ट का इस्तेमाल AI चैटबॉट की क्षमताओं को जांचने के लिए किया जाता है. यह मुश्किल फ़ॉन्ट, हाथ से लिखे टेक्स्ट और अलग-अलग तरह के लिखे हुए डेटा को पहचानने की उनकी क्षमता का आकलन करता है. सर्वम AI ने इस टेस्ट में 93.28 परसेंट स्कोर किया, जो ChatGPT और Gemini के स्कोर से काफी ज़्यादा है.
यह निश्चित रूप से एक बड़ी कामयाबी मानी जाती है, क्योंकि सर्वम AI को OpenAI और Google जैसे रिसोर्स से नहीं बनाया गया था, फिर भी यह मार्केट के सबसे बड़े और सबसे तेज मॉडल से भी कुछ मुश्किल कामों को बेहतर तरीके से संभाल सकता है. तो, सर्वम विजन की असलियत क्या है, और यह बड़ी कंपनियों से कैसे बेहतर परफॉर्म कर रहा है? लेकिन असली सवाल यह है: सर्वम विजन की असलियत क्या है, और यह बड़ी कंपनियों से कैसे बेहतर परफॉर्म कर रहा है? इन टेस्ट के पीछे के कॉन्टेक्स्ट को समझना बहुत जरूरी है.
ऐसा लगता है कि इस “मेड इन इंडिया” AI मॉडल को भारतीय भाषाओं और लिपियों पर ट्रेन किया गया है, जो इसके बेहतर परफॉर्मेंस और रिस्पॉन्स में योगदान देता है. Google और OpenAI अच्छे हैं, लेकिन उनका स्कोप बहुत बड़ा है. 3 ट्रिलियन से ज़्यादा पैरामीटर के साथ, ये AI मॉडल कई तरह के कामों को संभालने में सक्षम हैं. 3 बिलियन पैरामीटर पर आधारित सर्वम AI को भारतीय भाषाओं पर खास फोकस के साथ विज़ुअल लैंग्वेज मॉडल को संभालने के लिए डिजाइन किया गया है. यह इमेज को समझ सकता है और जो देखता है उसे बता सकता है.
|