Gemini Omni:Google I/O 2026 में कंपनी ने अपने यूनिफाईड मल्टीमॉडल एआई वीडियो मॉडल Gemini Omni का ऐलान कर दिया है. कंपनी ने बताया कि यह मॉडल जेमिनी की रियल वर्ल्ड नॉलेज और रीजनिंग को यूज करते हुए किसी भी इनपुट से कुछ भी जनरेट कर सकता है. इसके फर्स्ट जनरेशन मॉडल Omni Flash को रोलआउट कर दिया गया है और इसे आज से ही जेमिनी ऐप, फ्लो बाई गूगल और यूट्यूब शॉर्ट्स आदि में एक्सेस किया जा सकता है. इसके लिए API को अगले कुछ दिनों में लॉन्च कर दिया जाएगा. आइए जानते हैं कि यह मॉडल क्या-क्या कर सकता है.

Continues below advertisement

नया मॉडल क्या-क्या कर सकता है?

गूगल का यह मॉडल सिंक्रोनाइज्ड वीडियो, वॉइस नैरेशन, ऑन-स्क्रीन टेक्स्ट और बैकग्राउंड म्यूजिक जनरेट कर सकता है. इसके लिए यूजर को सिर्फ एक प्रॉम्प्ट देना है. एक रिटन प्रॉम्प्ट के बेस पर यह मॉडल सब कुछ क्रिएट कर सकता है और इसकी यही बात बाकी मॉडल्स से अलग बनाती है. अगर गूगल की बात करें तो कंपनी अभी तक वीडियो के लिए वीयो और इमेज के लिए नैनो बनाना जैसे अलग-अलग मॉडल को यूज करती आई है. नए मॉडल ने उन सारी कैपेबिलिटी को एक जगह इकट्ठा कर दिया है. अगर दूसरी कंपनियों की बात करें तो अब यूजर्स को वॉइस ओवर के लिए इलेवन लैब्स और म्यूजिक के लिए सुनो आदि की जरूरत नहीं पड़ेगी. उन्हें Gemini Omni में एक ही जगह सारे फीचर्स मिल जाएंगे. 

Continues below advertisement

Gemini Omni की क्या खासियत है?

एआई जनरेटेड वीडियो में फिजिक्स को सही तरीके से पेश करना मुश्किल काम रहा है. यानी मॉडल कई चीजों को नहीं समझ पाते हैं, जिससे जनरेटेड वीडियो नकली लगता है, लेकिन डेमो आउटपुट से लग रहा है कि Gemini Omni इस मामले में अलग होगा. इसके अलावा एक बार कैरेक्टर डिफाइन करने के बाद हर लोकेशन, लाइटिंग कंडीशन और एक्शन में यह कंसिस्टेंट रहेगा. इसी तरह यूजर स्टाइल और मोशन को नैरेट कर भी अपनी पसंद का वीडियो जनरेट कर पाएंगे.

Gemini Spark का भी हुआ ऐलान

Gemini Omni के साथ-साथ गूगल ने Gemini Spark का भी ऐलान कर दिया है. कंपनी ने इसे 'आपका पर्सनल एआई एजेंट' करार दिया है. यह क्लाउड बेस्ड एआई है, जो बिना रुके काम करेगा. गूगल ने दावा किया है कि यह आपके इनबॉक्स और टू-डू-लिस्ट के सारे काम कर सकता है. इसे गूगल प्रोडक्ट्स के अलावा 30 थर्ड-पार्टी टूल्स में भी इंटीग्रेट किया जा सकता है.

Gemini 3.5 Flash

Google I/O 2026 में Gemini 3.5 Flash का भी ऐलान किया गया है. इसके साथ गूगल ने नई 3.5 मॉडल फैमिली की शुरुआत की है. यह अब तक का सबसे स्ट्रॉन्ग एजेंटिक मॉडल माना जा रहा है. कंपनी का कहना है कि यह ज्यादा फास्ट और कॉस्ट एफिशिएंट है और कोडिंग और एजेंटिक बेंचमार्क के मामले में इसने फरवरी में ही लॉन्च हुए गूगल के Gemini 3.1 Pro मॉडल को पीछे छोड़ दिया है. अब यह गूगल की कई सर्विसेस में डिफॉल्ट मॉडल की तरह काम करेगा.

ये भी पढ़ें-

Apple ने आखिर क्यों बंद किए iPhone Box में आने वाले Free Stickers? सामने आई असली वजह