Open AI के Sora को मात देने के प्रयास में, Google की डीपमाइंड रिसर्च लैब ने इस महीने Veo 2 की घोषणा की।
यह एक वीडियो-जनरेशन AI मॉडल है, जो कंपनी के अनुसार, 4k (4096 x 2160 Pixel) तक के रिज़ॉल्यूशन में दो मिनट से ज़्यादा की क्लिप बना सकता है, जो कथित तौर पर Sora के रिज़ॉल्यूशन से चार गुना ज़्यादा और अवधि से छह गुना ज़्यादा है।
VideoFX, जहाँ Veo 2 अभी exclusive तौर पर उपलब्ध है, प्रतीक्षा सूची में पीछे है। हालाँकि, Google अपने Vertex AI डेवलपर प्लेटफ़ॉर्म के ज़रिए Veo 2 को उपलब्ध कराएगा, क्योंकि मॉडल बड़े पैमाने पर इस्तेमाल के लिए तैयार हो जाएगा।
Veo की तरह, Veo 2 एक टेक्स्ट प्रॉम्प्ट या एक संदर्भ छवि दिए जाने पर वीडियो बना सकता है।
DeepMind ने कहा कि Veo 2 मानवीय भावों, द्रव गतिकी (जैसे कि मग में कॉफ़ी डालना) और प्रकाश के गुणों (जैसे कि छाया और प्रतिबिंब) के साथ ज़्यादा यथार्थवादी और सिनेमैटोग्राफ़िक मॉडल बना सकता है।
Veo realistic motion उच्च गुणवत्ता वाले आउटपुट के साथ 4K तक के वीडियो बनाता है। विभिन्न शैलियों का अन्वेषण करें और व्यापक कैमरा नियंत्रणों के साथ अपनी खुद की शैली खोजें।
Redefining quality and control
Veo 2 सरल और जटिल निर्देशों का निष्ठापूर्वक पालन करने में सक्षम है, तथा वास्तविक दुनिया के भौतिकी के साथ-साथ दृश्य शैलियों की एक विस्तृत श्रृंखला का अनुकरण भी करता है।
Enhanced realism and fidelity
विस्तार, यथार्थवाद और आर्टिफैक्ट रिडक्शन के संदर्भ में अन्य AI वीडियो मॉडलों की तुलना में यह उल्लेखनीय रूप से बेहतर है।
Advanced motion capabilities
भौतिकी की अपनी समझ और विस्तृत निर्देशों का पालन करने की क्षमता के कारण, Veo गति को उच्च स्तर की सटीकता से प्रस्तुत करता है।
Greater camera control options
Interprets instructions precisely to create a wide range of shot styles, angles, movements – and combinations of all of these.
Example:
Prompt: ऊदाहरण के तौर पर यह एक prompt लिख रहे है।
(An extreme close-up shot focuses on the face of a female DJ, her beautiful, voluminous black curly hair framing her features as she becomes completely absorbed in the music. Her eyes are closed, lost in the rhythm, and a slight smile plays on her lips. The camera captures the subtle movements of her head as she nods and sways to the beat, her body instinctively responding to the music pulsating through her headphones and out into the crowd. The shallow depth of field blurs the background. She’s surrounded by vibrant neon colors. The close-up emphasizes her captivating presence and the power of music to transport and transcend.)
ऊपर दिए गए प्रॉम्प्ट को आप इन्सर्ट करके चेक कर सकते है की Veo कितना पावरफुल है।
अपने प्रदर्शन के मानवीय मूल्यांकन के आधार पर, Veo 2 अन्य अग्रणी वीडियो उत्पादन मॉडलों से बेहतर प्रदर्शन करता है।
Benchmarks
सभी तुलनाएँ 720p रिज़ॉल्यूशन पर की गई थीं। Veo सैंपल अवधि 8s है, VideoGen की सैंपल अवधि 10s है, और अन्य मॉडलों की अवधि 5s है। हम रेटिंग देने वालों को पूरा वीडियो अवधि दिखाते हैं।
Limitations
हालांकि Veo 2 ने अविश्वसनीय प्रगति दिखाई है, लेकिन Realistic , डाइनैमिक या जटिल वीडियो बनाना और जटिल दृश्यों या जटिल गति वाले दृश्यों में पूर्ण स्थिरता बनाए रखना एक चुनौती बनी हुई है। VEo ने कहा है की वे इन क्षेत्रों में प्रदर्शन को विकसित और परिष्कृत करना जारी रखेंगे।
भारतीय होने के नाते और सभी bloggers & Vloggers को इस टूल के भारत म access दिए जाने का बेसब्री से इंतज़ार रहेगा। गूगल ने घोंसणा की है की ये टूल को जल्द ही बहोत सारे एशियन देशों मे access दिया जाएगा।
कृपया वाचक गण अपनी राय दे की यह tool हमे किस level का helpful हो सकता है social media के लिए।