Google Announced Gen AI Experimental Video Tool Veo 2

Open AI के Sora  को मात देने के प्रयास में, Google की डीपमाइंड रिसर्च लैब ने इस महीने Veo 2 की घोषणा की।

यह एक वीडियो-जनरेशन AI मॉडल है, जो कंपनी के अनुसार, 4k (4096 x 2160 Pixel) तक के रिज़ॉल्यूशन में दो मिनट से ज़्यादा की क्लिप बना सकता है, जो कथित तौर पर Sora के रिज़ॉल्यूशन से चार गुना ज़्यादा और अवधि से छह गुना ज़्यादा है।

VideoFX, जहाँ Veo 2 अभी exclusive  तौर पर उपलब्ध है, प्रतीक्षा सूची में पीछे है। हालाँकि, Google अपने Vertex AI डेवलपर प्लेटफ़ॉर्म के ज़रिए Veo 2 को उपलब्ध कराएगा, क्योंकि मॉडल बड़े पैमाने पर इस्तेमाल के लिए तैयार हो जाएगा।

Veo की तरह, Veo 2 एक टेक्स्ट प्रॉम्प्ट या एक संदर्भ छवि दिए जाने पर वीडियो बना सकता है।

DeepMind ने कहा कि Veo 2 मानवीय भावों, द्रव गतिकी (जैसे कि मग में कॉफ़ी डालना) और प्रकाश के गुणों (जैसे कि छाया और प्रतिबिंब) के साथ ज़्यादा यथार्थवादी और सिनेमैटोग्राफ़िक मॉडल बना सकता है।

Veo realistic motion  उच्च गुणवत्ता वाले आउटपुट के साथ 4K तक के वीडियो बनाता है। विभिन्न शैलियों का अन्वेषण करें और व्यापक कैमरा नियंत्रणों के साथ अपनी खुद की शैली खोजें।

Redefining quality and control

Veo 2 सरल और जटिल निर्देशों का निष्ठापूर्वक पालन करने में सक्षम है, तथा वास्तविक दुनिया के भौतिकी के साथ-साथ दृश्य शैलियों की एक विस्तृत श्रृंखला का अनुकरण भी करता है।

Enhanced realism and fidelity

विस्तार, यथार्थवाद और आर्टिफैक्ट रिडक्शन के संदर्भ में अन्य AI वीडियो मॉडलों की तुलना में यह उल्लेखनीय रूप से बेहतर है।

Advanced motion capabilities

भौतिकी की अपनी समझ और विस्तृत निर्देशों का पालन करने की क्षमता के कारण, Veo गति को उच्च स्तर की सटीकता से प्रस्तुत करता है।

Greater camera control options

Interprets instructions precisely to create a wide range of shot styles, angles, movements – and combinations of all of these.

Example:

Prompt:  ऊदाहरण के तौर पर यह एक prompt लिख रहे है।

(An extreme close-up shot focuses on the face of a female DJ, her beautiful, voluminous black curly hair framing her features as she becomes completely absorbed in the music. Her eyes are closed, lost in the rhythm, and a slight smile plays on her lips. The camera captures the subtle movements of her head as she nods and sways to the beat, her body instinctively responding to the music pulsating through her headphones and out into the crowd. The shallow depth of field blurs the background. She’s surrounded by vibrant neon colors. The close-up emphasizes her captivating presence and the power of music to transport and transcend.)

ऊपर दिए गए प्रॉम्प्ट को आप इन्सर्ट करके चेक कर सकते है की Veo कितना पावरफुल है।

अपने प्रदर्शन के मानवीय मूल्यांकन के आधार पर, Veo 2 अन्य अग्रणी वीडियो उत्पादन मॉडलों से बेहतर प्रदर्शन करता है।

Benchmarks

Veo ने शीर्ष वीडियो जनरेशन मॉडल पर मानव रेटर द्वारा आउटपुट की आमने-सामने तुलना में अत्याधुनिक परिणाम प्राप्त किए हैं। Participants ने मूवी GenBench पर 1003 प्रॉम्प्ट और संबंधित वीडियो देखे, जो मेटा द्वारा जारी एक बेंचमार्क डेटासेट है।  Veo 2 performs best on overall preference, and for its capability to follow prompts accurately.

 

सभी तुलनाएँ 720p रिज़ॉल्यूशन पर की गई थीं। Veo सैंपल अवधि 8s है, VideoGen की सैंपल अवधि 10s है, और अन्य मॉडलों की अवधि 5s है। हम रेटिंग देने वालों को पूरा वीडियो अवधि दिखाते हैं।

Limitations

हालांकि Veo 2 ने अविश्वसनीय प्रगति दिखाई है, लेकिन Realistic , डाइनैमिक या जटिल वीडियो बनाना और जटिल दृश्यों या जटिल गति वाले दृश्यों में पूर्ण स्थिरता बनाए रखना एक चुनौती बनी हुई है। VEo ने कहा है की वे  इन क्षेत्रों में प्रदर्शन को विकसित और परिष्कृत करना जारी रखेंगे।

 

 

भारतीय होने के नाते और सभी bloggers & Vloggers को इस टूल के भारत म access दिए जाने का बेसब्री से इंतज़ार रहेगा। गूगल ने घोंसणा की है की ये टूल को  जल्द ही बहोत सारे एशियन देशों मे access दिया जाएगा।

कृपया वाचक गण अपनी राय दे की यह tool हमे किस level का helpful हो सकता है social media के लिए।

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top