ИИ-подразделение Google — DeepMind — представило новые модели для управления роботами на базе Gemini 2.0.
ИИ-подразделение Google — DeepMind — представило новые модели для управления роботами на базе Gemini 2.0.
Они позволяют машинам взаимодействовать с объектами в реальном мире, ориентироваться в окружающей среде и выполнять другие действия.
Gemini Robotics — продвинутая нейросеть, в которую добавили физические действия в качестве вывода информации для управления роботами. Gemini Robotics-ER — модель с расширенным пониманием пространства.
Обе системы позволяют ботам выполнять широкий спектр реальных задач. Команда опубликовала серию демонстрационных видеороликов, на которых они складывают бумагу, убирают очки в футляр и выполняют другие задачи в ответ на голосовые команды.
В DeepMind отметили, что в ходе тестов роботы работали в условиях, не включенных в обучающие данные. Разработчики выпустили уменьшенную версию Gemini Robotics-ER, которую другие исследователи могут применять для обучения собственных моделей управления ботами.
Напомним, в марте компания Agibot запустила ИИ Genie Operator-1 (GO-1) для гуманоидных роботов. Она позволяет быстро понимать и выполнять задачи.
Ранее Figure представила искусственный интеллект собственной разработки Helix для интеграции с механическими устройствами. По словам создателей, модель способна «рассуждать как человек».