Google DeepMind разрабатывает курсор компьютерной мыши с искусственным интеллектом на базе Gemini.
Google DeepMind разрабатывает курсор компьютерной мыши с искусственным интеллектом на базе Gemini — компания намерена переосмыслить технологию, которая не менялась более полувека.
«Мы исследуем новые возможности на базе ИИ, которые помогут курсору не только понимать, на что он указывает, но и почему это важно для пользователя», — говорится в блоге компании.
Проект решает распространенную проблему: стандартный ИИ-инструмент работает в отдельном окне, и пользователю приходится перетаскивать туда свой контент.
«Мы стремимся к обратному: интуитивному искусственному интеллекту, который взаимодействует с пользователями во всех используемых ими инструментах, не прерывая рабочий процесс», — заявили в компании.
В Google DeepMind разработали четыре принципа, которые перекладывают передачу контекста и намерений с пользователя на компьютер и заменяют текстовые промпты более интуитивными способами взаимодействия.
ИИ-функции должны работать во всех приложениях, поэтому прототип курсора от Google DeepMind доступен везде, где осуществляет операции пользователь. Например, можно навести мышь на PDF-файл и запросить краткое саммари в виде списка, чтобы вставить его в письмо.
Другой пример — навести курсор на таблицу со статистическими данными и попросить построить круговую диаграмму.
Современные нейросети требуют точных инструкций, и для получения качественного ответа пользователю нужно составлять подробный промпт. ИИ-курсор упрощает этот процесс: он фиксирует визуальный и семантический контекст, позволяя модели «увидеть» и понять, что именно важно.
В экспериментальной системе Google DeepMind достаточно указать на абзац, фрагмент изображения или блок кода и LLM поймет, с чем нужна помощь.
В повседневном общении люди редко прибегают к длинным и подробным фразам. Они говорят: «Почини это», «Перенеси это сюда» или «Что это значит», параллельно полагаясь на жесты и общий контекст.
«ИИ-система, способная понимать это сочетание контекста, жестов и речи, позволит юзерам формулировать сложные запросы естественным и лаконичным образом без применения сложных промптов», — говорится в блоге Google DeepMind.
На протяжении десятилетий компьютеры отслеживали лишь направление взгляда. Искусственный интеллект способен понять, на что именно указывает пользователь, и преобразовать пиксели в структурные объекты для мгновенного взаимодействия.
«Фотография с набросками превращается в интерактивный список дел, стоп-кадр из видео о путешествии — в ссылку для бронирования столика в том симпатичном ресторане», — отметили в Google DeepMind.
Google DeepMind внедряет эти принципы в Chrome и новом интерфейсе для ноутбуков Googlebook.
«С сегодняшнего дня вместо ввода сложных запросов вы можете использовать курсор, чтобы спросить Gemini в Chrome о той части веб-страницы, которая вас интересует», — говорится в блоге.
Например, можно выбрать несколько товаров на странице и попросить сравнить их или указать место, где нужно визуализировать новый диван в гостинной.
В ближайшее время компания запустит Magic Pointer в Googlebook. Функция позволит применять Gemini одним движением пальца.
Google представила «новую категорию ноутбуков» на базе возможностей Gemini, объединяющую Android и ChromeOS.
«Более 15 лет назад мы представили Chromebook — ноутбук, созданный для мира, в котором приоритет отдается облачным технологиям. Сегодня во время перехода от ОС к интеллектуальной системе мы видим возможность вновь переосмыслить концепцию ноутбуков», — говорится в анонсе.
Googlebook разработаны для Gemini Intelligence и нового ИИ-курсора. Устройства получили функцию «Создать виджет» с поддержкой голосовых команд.
Gemini может искать информацию в интернете или подключаться к приложениям Google вроде Gmail и «Календарь» для создания единой персонализированной панели управления.
Инструмент построен на технологическом стеке Android, что обеспечивает бесшовную работу с нескольких устройств: функция «Быстрый доступ» позволяет просматривать, искать и вставлять файлы с телефона на ноутбук без ручного переноса.
Первые Googlebook создаются совместно с Acer, ASUS, Dell, HP и Lenovo.
Gemini Intelligence — набор ИИ-функций для Android-устройств. Летом 2026 года они появятся сначала на Samsung Galaxy и Google Pixel, затем на других гаджетах.
«Эта система объединяет первоклассное аппаратное обеспечение и инновационное ПО, чтобы помочь вам всегда быть на шаг впереди, проактивно решая задачи в течение дня. Параллельно обеспечивается конфиденциальность данных и полный контроль над ними», — говорится в анонсе.
Некоторые агентные возможности Gemini уже показали в начале 2026 года на смартфонах Samsung — например, заказ еды или такси. Вскоре помощник сможет выполнять более сложные задачи: достаточно сфотографировать брошюру тура, и бот найдет похожие варианты на Expedia.
В Chrome ИИ-ассистент поможет находить, обобщать и сравнивать контент на разных страницах. Функция Rambler на клавиатуре Gboard позволит надиктовать текст, затем выделит важные фрагменты и собрать их в связное сообщение без слов-паразитов и повторов.
Напомним, в апреле Google представила Gemma 4 — новое семейство открытых ИИ-моделей для продвинутых рассуждений и агентных рабочих процессов.