Популярные криптовалюты

BTC $106,618.15 +0.62%
ETH $2,478.98 -0.22%
SOL $167.1 +0.44%
PEPE $0.0000130 +0.77%
DOGE $0.22582 +1.88%
XRP $2.3512 +0.45%
TRUMP $14.13 +6.48%

Google I/O 2025: $249,99 за ИИ-агента; видеогенераторы и ряд других инноваций

На конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet. 

20 мая на конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet и другие. 

$249,99 за Google AI Ultra 

Google запустила новый тарифный план AI Ultra за $249,99 в месяц. Он обеспечивает «высочайший уровень доступа» к ИИ-приложениям и сервисам корпорации. В подписке доступен новый видеогенератор Google Veo 3, приложение для создания фильмов Flow и мощная модель Gemini 2.5 Pro Deep Think (она пока не запущена). 

Другие опции Google AI Ultra:

  • увеличенные лимиты на платформе NotebookLM и Whisk;
  • доступ к чат-боту Gemini в Chrome;
  • агентские инструменты на базе технологии Project Mariner;
  • YouTube Premium;
  • 30 ТБ для хранения данных на Google Drive, Google Photos и Gmail.

Один из агентских инструментов — режим Agent Mode. Он может просматривать веб-страницы, проводить исследования и интегрироваться с приложениями Google для выполнения определенных задач. Его запуск ожидается «в ближайшее время».

«Ultra — это программа для тех, кто хочет быть на передовой искусственного интеллекта от Google», — заявил вице-президент Google Labs и Gemini Джош Вудворд.

Подписка AI Ultra доступна пока только в США. 

Google присоединилась к растущему списку компаний, запустивших дорогой план. В декабре 2024 года OpenAI выпустила ChatGPT Pro за $200 в месяц. В апреле аналогичный ценник на Max установил ИИ-стартап Anthropic.

Veo 3 — видео со звуком

Veo 3 — новая ИИ-модель для генерации видео и звукового сопровождения вроде эффектов, шума и диалогов. Корпорация подчеркнула превосходство продукта над предыдущей версией Veo 2 по качеству создаваемых работ. 

«Впервые мы выходим из эпохи молчания в создании видео. [Вы можете дать Veo 3] промпт для характеристик персонажей и окружения и предложить диалог с описанием того, как он должен звучать», — заявил CEO Google DeepMind Демис Хассабис. 

cooking up something tasty for tomorrow… pic.twitter.com/wyIRMsXkFG

— Demis Hassabis (@demishassabis) May 19, 2025

Нейросеть доступна в приложении Gemini для подписчиков тарифного плана Google AI Ultra. 

Вероятно, появление Veo 3 стало возможно благодаря работе DeepMind в соответствующей области. В июне прошлого года ИИ-подразделение Google начало разработку технологии на базе искусственного интеллекта для генерации саундтреков к видео.

Для Veo 2 также представлены улучшения — ей теперь можно предоставлять изображения персонажей, сцен, объектов и стилей для улучшения согласованности. Она умеет понимать движения камеры, способна добавлять или удалять объекты из ролика и расширять кадры клипов — например, превращать вертикальное видео в горизонтальное.

Новые функции Veo 2 станут доступны на платформе Vertex AI.

Imagen 4 — генератор картинок

Google вывела на рынок новую ИИ-модель для создания изображений — Imagen 4. Она способна визуализировать мелкие детали, такие как ткани, капли воды и мех животных, и работать с фотореалистичными и абстрактными стилями. 

Imagen 4 delivers visuals that pop with richer details, more nuanced color, and better text outputs.Everyone can make images for free in the Gemini App today: https://t.co/awhPeHZIqm#GoogleIO pic.twitter.com/nnI8ZGIELv

— Google Gemini App (@GeminiApp) May 20, 2025

Нейросеть обеспечивает более высокое качество результатов по сравнению с Imagen 3 и создает иллюстрации с разным соотношением сторон и разрешением до 2K.

«Мы также уделили много внимания улучшению генерации текста и типографии, так что модель отлично подходит для создания слайдов, приглашений или любых других материалов, где нужно сочетать изображения и текст», — подчеркнул Вудворд.

Инструмент доступен в приложении Gemini, на платформах Google Whisk и Vertex AI, а также в Google Slides, Vids, Docs и других продуктах Google Workspace.

Flow — генератор фильмов

На конференции Google I/O 2025 компания анонсировала Flow — новую ИИ-модель для создания фильмов. В нее интегрированы три инструмента: 

  • Veo для создания видео; 
  • Imagen для генерации изображений;
  • Gemini для работы с текстом и промптами.

Introducing Flow: a new type of AI filmmaking tool that combines the best of Veo, Imagen and Gemini — built with and for creatives.Flow helps you maintain character and visual consistency from one clip to the next.See how emerging filmmakers are using it pic.twitter.com/H0cBv6IGs1

— Google (@Google) May 20, 2025

Flow позволяет импортировать персонажей или сцены или создавать эти элементы прямо внутри инструмента. Она предлагает функции управления камерой для смены угла обзора или ракурса, конструктор сцен и способы управления ассетами. 

Помимо этого корпорация запускает «Flow TV» — ленту видеоклипов и контента с указанием точных промптов, использовавшихся для их создания. Сервис позволит понять творческий процесс авторов. 

Смарт-очки

Google включается в гонку смарт-очков, объявив о партнерстве с Gentle Monster и Warby Parker для создания гаджета на базе Android XR.

Android XR — запущенная совместно с Qualcomm и Samsung в прошлом году платформа для работы устройств с расширенной реальностью (XR). 

Компания сообщила об углублении партнерства с Samsung для развития XR-очков. Обе компании разрабатывают программную и аппаратную платформу.

На конференции Google показала концепт очков на базе Android XR с искусственным интеллектом Gemini. Они оснащены камерой, микрофоном, динамиками и дисплеем для просмотра уведомления. 

Google Android XR Glasses Live Demo#GoogleIO pic.twitter.com/qoGK4rs2z4

— Ben Geskin (@BenGeskin) May 20, 2025

Google планирует выделить до $150 млн на совместную с Warby Parker разработку ИИ-очков. $75 млн уже отправлены. 

Интеграция Gemini в Chrome

Корпорация объявила о запуске интеграции Gemini в Chrome. Пользователи получат доступ к ИИ-помощнику для работы в браузере. Он сможет понимать контекст страницы и выполнять разные задачи. 

Gemini в Chrome доступен через ввод текста и с помощью голосовой команды. Начать общение с ИИ-помощником можно, нажав на значок Gemini в правом верхнем углу окна Chrome.

Пример работы: пользователь может открыть страницу с рецептом бананового хлеба и попросить Gemini сделать его безглютеновым. Или использовать цифрового помощника для подбора растения в спальню в зависимости от условий освещения. 

В будущем Gemini сможет работать сразу с несколькими вкладками, что позволит в том числе сравнивать два похожих товара с разных страниц или интернет-магазинов. 

Переводчик в Google Meet

В Google Meet добавили перевод речи в реальном времени. Компания использует большую языковую аудиомодель от DeepMind для обеспечения естественного разговора с собеседником на другом языке. 

В ходе перевода сохраняются голос, интонация и выражение лица. Новая функция имеет множество вариантов применения. Например, англоговорящие внуки смогут общаться с испаноговорящими бабушками и дедушками, как и сотрудники крупной компании из разных регионов. 

Корпорация утверждает, что задержка в ходе перевода очень мала, позволяя разговаривать сразу с несколькими людьми. 

Данные: Google.

В ходе разговора сохраняется передача оригинальной речи собеседника. Перевод накладывается поверх. 

Улучшение чат-бота Gemini

Google сообщила о нескольких обновлениях чат-бота Gemini. Среди них:

  • более широкая доступность мультимодальных возможностей;
  • обновленные ИИ-модели;
  • передача видео с камеры или экрана смартфона и параллельное ведение устных бесед;
  • прокладывание маршрута через Google Maps, создание событий в Google Calendar и списка дел в Google Tasks.

На конференции Google объявила, что у Gemini теперь 400 миллионов активных пользователей в месяц.

Корпорация также обновила Deep Research — инструмент для генерации подробных исследовательских отчетов. Пользователи могут загружать PDF-файлы и изображения, а сервис сопоставит их с общедоступной информацией для предоставления более персонализированной информации. 

В будущем можно будет интегрировать Drive и Gmail в Deep Research. 

Project Mariner — ИИ-агент для просмотра веб-страниц

Google открыла экспериментального ИИ-агента Project Mariner для американских пользователей с подпиской Google AI Ultra. Также обновлен принцип его работы — теперь помощник способен выполнять до 10 задач одновременно. 

Среди примеров возможностей Project Marine: ассистент способен купить билеты на бейсбольный матч или продукты онлайн. Пользователи общаются с агентом, а он сам посещает сайты и выполняет нужные действия. Они могут заниматься своими делами, пока помощник выполнит задачи в фоновом режиме.

Другие решения

Помимо вышеописанных продуктов Google также представила множество других. Среди них:

  • Gemma 3n — ИИ-модель для «плавной» работы на телефонах, ноутбуках и планшетах, способную взаимодействовать с аудио, текстом, изображениями и видео;
  • Stitch — инструмент для помощи в разработке фронтенда веб- и мобильных приложений, он способен создавать необходимые элементы интерфейса и код;
  • добавление функции видеообзоров в NotebookLM — пользователи смогут превращать мультимедийные материалы в удобные для восприятия визуальные презентации;
  • новые функции в ИИ-режиме Google Search для онлайн-покупателей, в том числе визуальную панель, персонализированные уведомления о ценах и виртуальные примерки;
  • SynthID Detector — способен определить, было ли изображение, видео, аудио или фрагмент текста созданы с помощью ИИ-моделей компании;
  • улучшенный режим рассуждений Deep Think для флагманской модели Gemini 2.5 Pro;
  • новые ИИ-функции в Gmail, Google Docs и Google Vids для очистки сообщений, составления персонализированных писем или создания и редактирования контента.

Напомним, в апреле стало известно о желании OpenAI приобрести браузер Chrome.

RSS 21.05.2025 1 191
Источник: https://forklog.com/news/ai/google-i-o-2025-249-99-za-ii-agenta-videogeneratory-i-ryad-drugih-innovatsij