Google Veo 3: новий AI відеогенератор з можливістю додавання звуку

Google представив новий відеогенератор Veo 3, що використовує штучний інтелект і має можливість інтеграції звуку. Цей інструмент конкурує з відеогенератором Sora від OpenAI, але відрізняється своєю здатністю додавати звуки, включаючи діалоги персонажів і звуки тварин.

Елі Коллінз, віце-президент продукту Google DeepMind, зазначив у блозі, що Veo 3 демонструє відмінні результати у створенні відео з текстових і зображень, а також у фізиці реального світу та точному синхронізації губ.

Новий інструмент став доступним для підписників нового плану Ultra від Google, що коштує 249,99 доларів на місяць, та для користувачів платформи Vertex AI. Veo 3 також отримав оновлення Veo 2, що дозволяє користувачам додавати або видаляти об’єкти з відео за допомогою текстових запитів.

Крім того, Google анонсував Imagen 4, свій останній інструмент генерації зображень, який, за словами компанії, створює якісніші зображення на основі запитів користувачів. Також представлено Flow, новий інструмент для кінематографії, що дозволяє користувачам створювати кінематографічні відео, описуючи локації, кадри та стилістичні переваги.

Ці нововведення відбуваються на фоні зростаючої популярності генеративних AI-програм для створення зображень і відео. Відзначимо, що у березні генеральний директор OpenAI Сем Альтман заявив, що генератор зображень ChatGPT 4o був настільки популярним, що призвів до перегріву комп’ютерних чіпів компанії.

Google, проте, має змішану репутацію в галузі генерації зображень. Рік тому компанія була змушена перезапустити свій інструмент Imagen 3 через історично неточні результати, що викликало критику.