गूगल ने अपना लेटेस्ट AI मल्टीमॉडल ल्यूमियर लॉन्च किया है। अब आप आर्टिफिशियल इंटेलिजेंस(AI) की मदद से टेक्स्ट लिखकर सीधे वीडियो बना सकेंगे। गूगल का नया मॉडल एक टेक्सट टू वीडियो और इमेज टू वीडियो मॉडल है। यह रियलिस्टिक और कई तरह के मोशन क्रिएटर कर वीडियो बना सकता है। इससे आप इमेज से मोशन वीडियो भी क्रिएट कर सकते हैं।
इमेज को एनिमेट भी कर सकते हैं
ल्यूमियर में आपको सिर्फ टेक्स्ट या फोटो का इनपुट डालना है और AI आपको वीडियो क्रिएट करके दे देगा। यह टूल इमेज को एनिमेट करने और इनपुट इमेज या पेंटिंग के फॉर्मेट में वीडियो बनाने की भी सुविधा देता है।
इस तरह काम करता है ल्यूमियर AI
गूगल का नया ल्यूमियर ट्रेडिशनल वीडियो मॉडल से अलग एक स्पेस टाइम यू नेट आर्किटेक्चर को अपनाता है जो एक ही फ्रेम के हिसाब से पूरी वीडियो प्रोड्यूस करता है। मौजूदा AI वीडियो मॉडल एक समय में दूर के मुख्य फ्रेमों को जोड़ते है। इनोवेशन की ये टेक्नीक अस्थायी सुपर-रिजॉल्यूशन के बाद दूर के की फ्रेम को सिंथेसाइज्ड करने की जरुरत को खत्म कर देती है। इससे वीडियो में स्टेब्लिटी आसानी से मिल जाती है।
गूगल के रिसर्चर्स के अनुसार, टेक्स्ट-टू-वीडियो जनरेशन फ्रेमवर्क को प्री-ट्रेंड टेक्स्ट-टू-इमेज डिफ्यूजन का इस्तेमाल करके पेश किया गया है। टीम ने स्पेस-टाइम यू-नेट आर्किटेक्चर को डिप्लॉय कर के फुल फ्रेम वीडियो क्लिप जनरेट की है। इसमें स्पाटिअल और टेंपोरल मॉड्यूल को शामिल किया गया है। इससे इमेज टू वीडियो, वीडियो इनपेंटिंग और स्टाइलिश्ड जनरेशन में बढ़िया रिजल्ट मिल पाया है।