Gemini Omni:Google I/O 2026 में कंपनी ने अपने यूनिफाईड मल्टीमॉडल एआई वीडियो मॉडल Gemini Omni का ऐलान कर दिया है. कंपनी ने बताया कि यह मॉडल जेमिनी की रियल वर्ल्ड नॉलेज और रीजनिंग को यूज करते हुए किसी भी इनपुट से कुछ भी जनरेट कर सकता है. इसके फर्स्ट जनरेशन मॉडल Omni Flash को रोलआउट कर दिया गया है और इसे आज से ही जेमिनी ऐप, फ्लो बाई गूगल और यूट्यूब शॉर्ट्स आदि में एक्सेस किया जा सकता है. इसके लिए API को अगले कुछ दिनों में लॉन्च कर दिया जाएगा. आइए जानते हैं कि यह मॉडल क्या-क्या कर सकता है.
नया मॉडल क्या-क्या कर सकता है?
गूगल का यह मॉडल सिंक्रोनाइज्ड वीडियो, वॉइस नैरेशन, ऑन-स्क्रीन टेक्स्ट और बैकग्राउंड म्यूजिक जनरेट कर सकता है. इसके लिए यूजर को सिर्फ एक प्रॉम्प्ट देना है. एक रिटन प्रॉम्प्ट के बेस पर यह मॉडल सब कुछ क्रिएट कर सकता है और इसकी यही बात बाकी मॉडल्स से अलग बनाती है. अगर गूगल की बात करें तो कंपनी अभी तक वीडियो के लिए वीयो और इमेज के लिए नैनो बनाना जैसे अलग-अलग मॉडल को यूज करती आई है. नए मॉडल ने उन सारी कैपेबिलिटी को एक जगह इकट्ठा कर दिया है. अगर दूसरी कंपनियों की बात करें तो अब यूजर्स को वॉइस ओवर के लिए इलेवन लैब्स और म्यूजिक के लिए सुनो आदि की जरूरत नहीं पड़ेगी. उन्हें Gemini Omni में एक ही जगह सारे फीचर्स मिल जाएंगे.
Gemini Omni की क्या खासियत है?
एआई जनरेटेड वीडियो में फिजिक्स को सही तरीके से पेश करना मुश्किल काम रहा है. यानी मॉडल कई चीजों को नहीं समझ पाते हैं, जिससे जनरेटेड वीडियो नकली लगता है, लेकिन डेमो आउटपुट से लग रहा है कि Gemini Omni इस मामले में अलग होगा. इसके अलावा एक बार कैरेक्टर डिफाइन करने के बाद हर लोकेशन, लाइटिंग कंडीशन और एक्शन में यह कंसिस्टेंट रहेगा. इसी तरह यूजर स्टाइल और मोशन को नैरेट कर भी अपनी पसंद का वीडियो जनरेट कर पाएंगे.
Gemini Spark का भी हुआ ऐलान
Gemini Omni के साथ-साथ गूगल ने Gemini Spark का भी ऐलान कर दिया है. कंपनी ने इसे 'आपका पर्सनल एआई एजेंट' करार दिया है. यह क्लाउड बेस्ड एआई है, जो बिना रुके काम करेगा. गूगल ने दावा किया है कि यह आपके इनबॉक्स और टू-डू-लिस्ट के सारे काम कर सकता है. इसे गूगल प्रोडक्ट्स के अलावा 30 थर्ड-पार्टी टूल्स में भी इंटीग्रेट किया जा सकता है.
Gemini 3.5 Flash
Google I/O 2026 में Gemini 3.5 Flash का भी ऐलान किया गया है. इसके साथ गूगल ने नई 3.5 मॉडल फैमिली की शुरुआत की है. यह अब तक का सबसे स्ट्रॉन्ग एजेंटिक मॉडल माना जा रहा है. कंपनी का कहना है कि यह ज्यादा फास्ट और कॉस्ट एफिशिएंट है और कोडिंग और एजेंटिक बेंचमार्क के मामले में इसने फरवरी में ही लॉन्च हुए गूगल के Gemini 3.1 Pro मॉडल को पीछे छोड़ दिया है. अब यह गूगल की कई सर्विसेस में डिफॉल्ट मॉडल की तरह काम करेगा.
ये भी पढ़ें-
Apple ने आखिर क्यों बंद किए iPhone Box में आने वाले Free Stickers? सामने आई असली वजह
