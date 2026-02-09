Show Quick Read Key points generated by AI, verified by newsroom

Sarvam AI: अब तक आर्टिफिशियल इंटेलिजेंस की दुनिया में अमेरिका और चीन का ही दबदबा माना जाता था. भारत को अक्सर सिर्फ टैलेंट का बाजार समझा गया न कि कोर AI डेवलपमेंट का केंद्र. लेकिन बेंगलुरु की स्टार्टअप Sarvam AI इस सोच को तेजी से बदल रही है. कंपनी भारत में ही शुरू से तैयार किए गए अपने सॉवरेन AI मॉडल के दम पर अब ग्लोबल टेक दिग्गजों को सीधी चुनौती दे रही है.

Sarvam Vision ने बड़े AI मॉडल्स को छोड़ा पीछे

Sarvam AI के दो टूल इन दिनों खास चर्चा में हैं Sarvam Vision और Bulbul. Sarvam Vision एक OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) आधारित AI मॉडल है जिसने कुछ चुनिंदा बेंचमार्क्स पर ChatGPT, Google Gemini और Anthropic Claude जैसे बड़े नामों को पीछे छोड़ दिया है. इसकी सटीकता इतनी बेहतर बताई जा रही है कि यूजर्स और AI एक्सपर्ट्स खुलकर इसकी तारीफ कर रहे हैं.

बेंचमार्क स्कोर ने बढ़ाई दुनिया की दिलचस्पी

Sarvam AI के को-फाउंडर प्रत्युष कुमार ने X पर पोस्ट्स के जरिए इन उपलब्धियों की जानकारी दी. कंपनी के मुताबिक Sarvam Vision ने olmOCR-Bench पर 84.3 प्रतिशत की एक्यूरेसी हासिल की है जो Gemini 3 Pro और DeepSeek OCR v2 जैसे मॉडलों से ज्यादा है. वहीं ChatGPT का स्कोर इससे काफी नीचे रहा.

इतना ही नहीं, OmniDocBench v1.5 पर भी Sarvam Vision ने 93.28 प्रतिशत का शानदार स्कोर किया. खास बात यह रही कि जटिल लेआउट, टेक्निकल टेबल्स और गणितीय फॉर्मूले जैसे मुश्किल हिस्सों में भी इसका प्रदर्शन बेहद मजबूत रहा जहां पारंपरिक OCR सिस्टम अक्सर फेल हो जाते हैं.

आलोचना से तारीफ तक का सफर

Sarvam AI को पहले सिर्फ इंडिक लैंग्वेज मॉडल्स पर फोकस करने को लेकर संदेह की नजर से देखा गया था. लेकिन अब वही शक सराहना में बदल रहा है. टेक कमेंटेटर Deedy Das ने भी माना कि उन्होंने Sarvam को कम आंका था. उनके मुताबिक Sarvam के OCR और स्पीच मॉडल भारतीय भाषाओं के लिए बेहद मजबूत हैं और उस खाली जगह को भरते हैं, जिसे बड़े ग्लोबल AI लैब्स ने नजरअंदाज कर दिया था. यूजर्स की प्रतिक्रियाएं भी कुछ ऐसी ही हैं. कई लोगों ने Sarvam के टूल्स को इस्तेमाल करने के बाद हैरानी और उत्साह दोनों जताया है.

Bulbul V3

OCR के साथ-साथ Sarvam AI ने अपना नया टेक्स्ट-टू-स्पीच मॉडल Bulbul V3 भी लॉन्च किया है. यह AI वॉयस टूल भारतीय भाषाओं में नेचुरल और एक्सप्रेसिव आवाजें तैयार करने पर फोकस करता है. इसका कॉन्सेप्ट ElevenLabs जैसे इंटरनेशनल AI वॉयस प्लेटफॉर्म से मिलता-जुलता है लेकिन भारत-केंद्रित जरूरतों के हिसाब से इसे खास तौर पर डिजाइन किया गया है. फिलहाल Bulbul V3 में 11 भारतीय भाषाओं में 35 से ज्यादा आवाजें उपलब्ध हैं और कंपनी जल्द ही इसे 22 भाषाओं तक विस्तार देने की योजना में है.

