Gemini AI здатен перетворювати фотографії на відео

Google запустила нову функцію штучного інтелекту Gemini, яка дозволяє перетворювати фотографії на відеокліпи. Ця нова можливість, яка підтримується відеомоделлю Veo 3, здатна трансформувати зображення на восьмисекундні відеоролики, які супроводжуються звуками, створеними штучним інтелектом, включаючи фонові шуми, звуки середовища та мовлення.

Оновлення Gemini для відео наразі доступне підписникам Google AI Ultra та Pro у “обраних регіонах”. Нова функція починає впроваджуватися на веб-платформі вже сьогодні, а протягом тижня стане доступною і на мобільних пристроях.

Користувачі Gemini можуть отримати доступ до цієї функції, натиснувши опцію “інструменти” у панелі з підказками, вибравши “відео” та завантаживши своє фото разом із текстовим описом, який визначає, як вони хочуть, щоб воно рухалося. Додатково можна включити аудіоописи для діалогів, звукових ефектів та навколишніх шумів, які, за словами Google, будуть “ідеально синхронізовані з візуальним рядом”. Готові відео надаються у форматі MP4 з роздільною здатністю 720p у ландшафтному форматі 16:9.

“Ви можете реалізувати свої творчі ідеї, анімаційно зображаючи повсякденні об’єкти, надаючи життя своїм малюнкам і живопису або додаючи рух до природних сцен,” — зазначив Google. “Всі сгенеровані відео містять помітний водяний знак для вказівки на те, що вони були створені штучним інтелектом, а також невидимий цифровий водяний знак SynthID.”

Схожою можливістю користуються вже в Flow — інструменті створення фільмів на основі генеративного ШІ, запущеному Google у березні, але тепер користувачі Gemini можуть анімувати свої фотографії, не відкриваючи додаткові додатки. Google також повідомила, що Flow розширюється на “додаткові 75 країн” сьогодні, разом із впровадженням нової відеофункції Gemini.