На конференции разработчиков Google I/O 2025 компания представила новую модель искусственного интеллекта для генерации видео — Veo 3. Это первая модель Google, способная не только создавать визуальный контент, но и синтезировать звуковые эффекты и диалоги, обеспечивая более реалистичное и комплексное видео.
Основные возможности Veo 3
- Синтез звуковых эффектов: Veo 3 может автоматически добавлять звуки окружающей среды, такие как пение птиц или шум городского движения, соответствующие визуальному контенту.
- Генерация диалогов: Модель способна создавать синхронизированные диалоги для персонажей, улучшая реализм и взаимодействие в видео.
- Улучшенная физическая симуляция и синхронизация губ: Veo 3 обеспечивает более точную физическую симуляцию объектов и синхронизацию движений губ с озвучкой, повышая качество анимации.
На данный момент доступ к Veo 3 ограничен пользователями Gemini Ultra в США и корпоративными клиентами Vertex AI. Модель также интегрирована в инструмент для создания видео Flow, предоставляя расширенные возможности для кинематографического производства.
Инструмент Flow и возможности управления видео
Пользователи могут использовать Flow для более точного контроля над создаваемыми видео:
- Управление камерой: Возможность вращения, масштабирования и изменения ориентации кадра (например, с вертикального на горизонтальный).
- Редактирование элементов сцены: Добавление или удаление объектов из видео, а также настройка стиля и атмосферы сцены.
Кроме того, пользователи могут предоставлять модели изображения персонажей, стиля, сцен или объектов в качестве референсов для генерации контента.
SynthID Detector — инструмент для выявления AI-контента
С ростом сложности различения AI-сгенерированного контента Google представила SynthID Detector — инструмент, позволяющий пользователям загружать медиафайлы и проверять наличие водяных знаков SynthID. Эти метки помогают идентифицировать контент, созданный с помощью искусственного интеллекта. Однако стоит отметить, что не все модели генерации изображений поддерживают внедрение таких водяных знаков.
Заключение
Google продолжает активно развивать технологии генерации контента с использованием искусственного интеллекта, предоставляя пользователям инструменты для создания более реалистичного и качественного видео. С запуском Veo 3 и интеграцией в платформу Flow компания делает значительный шаг вперёд в области AI-видеопроизводства.