На конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet.
20 мая на конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet и другие.
Google запустила новый тарифный план AI Ultra за $249,99 в месяц. Он обеспечивает «высочайший уровень доступа» к ИИ-приложениям и сервисам корпорации. В подписке доступен новый видеогенератор Google Veo 3, приложение для создания фильмов Flow и мощная модель Gemini 2.5 Pro Deep Think (она пока не запущена).
Другие опции Google AI Ultra:
Один из агентских инструментов — режим Agent Mode. Он может просматривать веб-страницы, проводить исследования и интегрироваться с приложениями Google для выполнения определенных задач. Его запуск ожидается «в ближайшее время».
«Ultra — это программа для тех, кто хочет быть на передовой искусственного интеллекта от Google», — заявил вице-президент Google Labs и Gemini Джош Вудворд.
Подписка AI Ultra доступна пока только в США.
Google присоединилась к растущему списку компаний, запустивших дорогой план. В декабре 2024 года OpenAI выпустила ChatGPT Pro за $200 в месяц. В апреле аналогичный ценник на Max установил ИИ-стартап Anthropic.
Veo 3 — новая ИИ-модель для генерации видео и звукового сопровождения вроде эффектов, шума и диалогов. Корпорация подчеркнула превосходство продукта над предыдущей версией Veo 2 по качеству создаваемых работ.
«Впервые мы выходим из эпохи молчания в создании видео. [Вы можете дать Veo 3] промпт для характеристик персонажей и окружения и предложить диалог с описанием того, как он должен звучать», — заявил CEO Google DeepMind Демис Хассабис.
cooking up something tasty for tomorrow… pic.twitter.com/wyIRMsXkFG
— Demis Hassabis (@demishassabis) May 19, 2025Нейросеть доступна в приложении Gemini для подписчиков тарифного плана Google AI Ultra.
Вероятно, появление Veo 3 стало возможно благодаря работе DeepMind в соответствующей области. В июне прошлого года ИИ-подразделение Google начало разработку технологии на базе искусственного интеллекта для генерации саундтреков к видео.
Для Veo 2 также представлены улучшения — ей теперь можно предоставлять изображения персонажей, сцен, объектов и стилей для улучшения согласованности. Она умеет понимать движения камеры, способна добавлять или удалять объекты из ролика и расширять кадры клипов — например, превращать вертикальное видео в горизонтальное.
Новые функции Veo 2 станут доступны на платформе Vertex AI.
Google вывела на рынок новую ИИ-модель для создания изображений — Imagen 4. Она способна визуализировать мелкие детали, такие как ткани, капли воды и мех животных, и работать с фотореалистичными и абстрактными стилями.
Imagen 4 delivers visuals that pop with richer details, more nuanced color, and better text outputs.Everyone can make images for free in the Gemini App today: https://t.co/awhPeHZIqm#GoogleIO pic.twitter.com/nnI8ZGIELv
— Google Gemini App (@GeminiApp) May 20, 2025Нейросеть обеспечивает более высокое качество результатов по сравнению с Imagen 3 и создает иллюстрации с разным соотношением сторон и разрешением до 2K.
«Мы также уделили много внимания улучшению генерации текста и типографии, так что модель отлично подходит для создания слайдов, приглашений или любых других материалов, где нужно сочетать изображения и текст», — подчеркнул Вудворд.
Инструмент доступен в приложении Gemini, на платформах Google Whisk и Vertex AI, а также в Google Slides, Vids, Docs и других продуктах Google Workspace.
На конференции Google I/O 2025 компания анонсировала Flow — новую ИИ-модель для создания фильмов. В нее интегрированы три инструмента:
Introducing Flow: a new type of AI filmmaking tool that combines the best of Veo, Imagen and Gemini — built with and for creatives.Flow helps you maintain character and visual consistency from one clip to the next.See how emerging filmmakers are using it pic.twitter.com/H0cBv6IGs1
— Google (@Google) May 20, 2025Flow позволяет импортировать персонажей или сцены или создавать эти элементы прямо внутри инструмента. Она предлагает функции управления камерой для смены угла обзора или ракурса, конструктор сцен и способы управления ассетами.
Помимо этого корпорация запускает «Flow TV» — ленту видеоклипов и контента с указанием точных промптов, использовавшихся для их создания. Сервис позволит понять творческий процесс авторов.
Google включается в гонку смарт-очков, объявив о партнерстве с Gentle Monster и Warby Parker для создания гаджета на базе Android XR.
Android XR — запущенная совместно с Qualcomm и Samsung в прошлом году платформа для работы устройств с расширенной реальностью (XR).
Компания сообщила об углублении партнерства с Samsung для развития XR-очков. Обе компании разрабатывают программную и аппаратную платформу.
На конференции Google показала концепт очков на базе Android XR с искусственным интеллектом Gemini. Они оснащены камерой, микрофоном, динамиками и дисплеем для просмотра уведомления.
Google Android XR Glasses Live Demo#GoogleIO pic.twitter.com/qoGK4rs2z4
— Ben Geskin (@BenGeskin) May 20, 2025Google планирует выделить до $150 млн на совместную с Warby Parker разработку ИИ-очков. $75 млн уже отправлены.
Корпорация объявила о запуске интеграции Gemini в Chrome. Пользователи получат доступ к ИИ-помощнику для работы в браузере. Он сможет понимать контекст страницы и выполнять разные задачи.
Gemini в Chrome доступен через ввод текста и с помощью голосовой команды. Начать общение с ИИ-помощником можно, нажав на значок Gemini в правом верхнем углу окна Chrome.
Пример работы: пользователь может открыть страницу с рецептом бананового хлеба и попросить Gemini сделать его безглютеновым. Или использовать цифрового помощника для подбора растения в спальню в зависимости от условий освещения.
В будущем Gemini сможет работать сразу с несколькими вкладками, что позволит в том числе сравнивать два похожих товара с разных страниц или интернет-магазинов.
В Google Meet добавили перевод речи в реальном времени. Компания использует большую языковую аудиомодель от DeepMind для обеспечения естественного разговора с собеседником на другом языке.
В ходе перевода сохраняются голос, интонация и выражение лица. Новая функция имеет множество вариантов применения. Например, англоговорящие внуки смогут общаться с испаноговорящими бабушками и дедушками, как и сотрудники крупной компании из разных регионов.
Корпорация утверждает, что задержка в ходе перевода очень мала, позволяя разговаривать сразу с несколькими людьми.
В ходе разговора сохраняется передача оригинальной речи собеседника. Перевод накладывается поверх.
Google сообщила о нескольких обновлениях чат-бота Gemini. Среди них:
На конференции Google объявила, что у Gemini теперь 400 миллионов активных пользователей в месяц.
Корпорация также обновила Deep Research — инструмент для генерации подробных исследовательских отчетов. Пользователи могут загружать PDF-файлы и изображения, а сервис сопоставит их с общедоступной информацией для предоставления более персонализированной информации.
В будущем можно будет интегрировать Drive и Gmail в Deep Research.
Google открыла экспериментального ИИ-агента Project Mariner для американских пользователей с подпиской Google AI Ultra. Также обновлен принцип его работы — теперь помощник способен выполнять до 10 задач одновременно.
Среди примеров возможностей Project Marine: ассистент способен купить билеты на бейсбольный матч или продукты онлайн. Пользователи общаются с агентом, а он сам посещает сайты и выполняет нужные действия. Они могут заниматься своими делами, пока помощник выполнит задачи в фоновом режиме.
Помимо вышеописанных продуктов Google также представила множество других. Среди них:
Напомним, в апреле стало известно о желании OpenAI приобрести браузер Chrome.