Популярные криптовалюты

BTC $106,476.09 -0.57%
ETH $3,931.01 -3.89%
XRP $2.6044 +5.26%
SOL $227.61 +2.75%
VANA $18.762 -37.25%
DOGE $0.39826 -3.39%
TRX $0.2849 -4.07%

Google DeepMind представил новые ИИ-генераторы видео и изображений

DeepMind — ориентированное на ИИ подразделение Google — анонсировало новую модель для генерации видео Veo 2. 

DeepMind — ориентированное на ИИ подразделение Google — анонсировало новую модель для генерации видео Veo 2. 

Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. We’re also releasing an improved version of our text-to-image model, Imagen 3 — available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4

— Google DeepMind (@GoogleDeepMind) December 16, 2024

Нейросеть способна:

  • создавать видео с разрешением до 4K;
  • понимать требования к управлению камерой в промптах;
  • хорошо воссоздавать правила физического мира и реалистичное выражение лиц человека.

«При прямых сравнениях результатов, проведенных экспертами, Veo 2 отдали предпочтение по сравнению с другими передовыми моделями генерации видео», — отметили DeepMind.

В экспериментальном инструменте Google VideoFX для создания видео на данный момент доступны ролики с разрешением до 720p и продолжительностью до восьми секунд. Полный функционал Veo 2 предоставлен лишь ограниченному числу пользователей, а расширенный запуск планируется на следующий год.

Сотрудники Google также улучшили возможности генератора изображений Imagen 3. Нейросеть получила способность применять различные стили искусства вроде реализма, фэнтези и других. 

We’ve also enhanced Imagen 3’s ability to: Produce diverse art styles: realism, fantasy, portraiture and more More faithfully turn prompts into accurate images Generate brighter, more compositionally balanced visuals https://t.co/MmdiHyrugR pic.twitter.com/L1l2Qzs5up

— Google DeepMind (@GoogleDeepMind) December 16, 2024

Также она точнее создает картинку по промпту и генерирует более яркие и сбалансированные визуальные эффекты. 

Напомним, в декабре Google выпустила новую модель Gemini 2.0, инструмент Deep Research для рассуждений и ИИ-агента Project Mariner — он способен выполнять действия на компьютере вместо пользователя. 

RSS 17.12.2024 1 75
Источник: https://forklog.com/news/ai/google-deepmind-predstavil-novye-ii-generatory-video-i-izobrazhenij