Популярные криптовалюты

BTC $62,773.99 +1.04%
ETH $2,444.65 +1.42%
PEPE $0.0000102 +8.37%
SOL $145.99 +2.38%
SUI $1.7642 +3.59%
WIF $2.42 +6.19%
OG $4.447 +53.56%

OpenAI выпустила альфа-версию продвинутого голосового помощника

OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для небольшой группы пользователей ChatGPT Plus. Для всех владельцев подписки она станет доступна осенью. 

OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для небольшой группы пользователей ChatGPT Plus. Для всех владельцев подписки он станет доступен осенью. 

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

— OpenAI (@OpenAI) July 30, 2024

Участники альфа-группы получат оповещение в приложении и электронное письмо с инструкцией по использованию нового режима. Пользователи могут общаться с ChatGPT голосом и получать ответы в реальном времени без задержек, а также перебивать искусственный интеллект во время его речи. 

В мае OpenAI представила последнюю модель чат-бота GPT-4o и анонсировала добавление специального режима Voice Mode для общения голосом. Запуск альфа-версии планировался к концу июня, но его перенесли на месяц. 

Некоторые продемонстрированные в мае возможности ИИ не вошли в запущенную альфа-версию, включая совместное использование экрана и поддержку видео. Они будут представлены позже. 

Расширенный голосовой режим

Стандартный голосовой режим ChatGPT использует три отдельные модели:

  • одну для преобразования голоса в текст;
  • другую для обработки запроса;
  • третью для конвертации текста в голос.

Новое решение мультимодального GPT-4o отличается, поскольку не использует вспомогательные модели. Благодаря этому разговор ведется с меньшей задержкой. По словам OpenAI, чат-бот может улавливать эмоциональные интонации в голосе вроде грусти или волнения. 

ChatGPT может общаться на четырех голосах, записанных в сотрудничестве с актерами озвучивания. Он не будет имитировать речь других людей. Дополнительно добавлены фильтры для отклонения некоторых запросов на создание музыки или других форм защищенного авторским правом контента. 

Напомним, в июле OpenAI сообщила о тестировании новых функций поиска на базе ИИ — SearchGPT. 

В том же месяце СМИ узнали о работе компании Сэма Альтмана над новой технологией Strawberry, которая «значительно улучшит процесс рассуждения ИИ-моделей и даст им возможность планировать действия наперед». 

RSS 31.07.2024 1 59
Источник: https://forklog.com/news/ai/openai-vypustila-alfa-versiyu-prodvinutogo-golosovogo-pomoshhnika