OpenAI представляет естественные голосовые разговоры для ChatGPT

Режим Голоса ChatGPT предлагает естественные диалоги, распознавание эмоций и 5 новых голосов для платных пользователей с быстрыми ответами и персонализацией.

Сентябрь 25, 2024 - 16:11

OpenAI представляет естественные голосовые разговоры для ChatGPT

OpenAI заявила, что AVM прошла тестирование безопасности внешними экспертами с момента ее выпуска в июле.

OpenAI расширила доступ к своему расширенному голосовому режиму (AVM) для ChatGPT, что позволяет большему количеству платных подписчиков использовать эту функцию для более естественного взаимодействия с ИИ. В настоящее время подписчики планов Plus и Team могут воспользоваться преимуществами AVM, а пользователи Enterprise и образовательных учреждений получат доступ со следующей недели. После того, как обновление станет доступно, пользователи получат всплывающее уведомление в приложении ChatGPT, информирующее их об обновлении. Однако фиксированных сроков полного развертывания во всех регионах нет. Важно отметить, что AVM пока недоступен в некоторых регионах, включая ЕС, Великобританию, Исландию, Швейцарию, Лихтенштейн и Норвегию. Кроме того, OpenAI не планирует в настоящее время предоставлять AVM пользователям бесплатного уровня, оставляя эту функцию эксклюзивной для платных клиентов на данный момент.

Расширенный голосовой режим (AVM) ChatGPT представляет ряд функций, предназначенных для создания более естественных и интерактивных бесед с ИИ. Одной из его выдающихся особенностей является возможность пользователей прерывать ChatGPT во время ответа, что делает беседы более плавными. Кроме того, AVM может распознавать эмоции по тону голоса и корректировать свои ответы, чтобы лучше соответствовать настроению или контексту. Этот режим также обеспечивает более быстрое время отклика и предлагает персонализированные голосовые параметры, а также улучшенное произношение неанглийских слов.

В рамках обновления AVM теперь включает пять новых голосов — Arbor, Sol, Maple, Vale и Spruce, — доводя общее количество голосовых параметров до девяти. Они дополняют ранее доступные голоса Juniper, Breeze, Ember и Cove. OpenAI дала этим голосам названия, связанные с природой, чтобы подчеркнуть цель функции — сделать взаимодействие с ИИ более органичным. Одним из заметных исключений в этой линейке является голос Sky, который был представлен в более раннем обновлении. С тех пор OpenAI приостановила Sky после того, как актриса Скарлетт Йоханссон выразила обеспокоенность по поводу его сходства с ее голосом и даже подала в суд. OpenAI пояснила, что Sky озвучивает другая актриса.

Возможности AVM впервые были продемонстрированы в мае во время презентации GPT-4o, хотя официальный релиз состоялся позже, в июле, для ограниченной группы пользователей, получивших приглашение. В рамках более широкого развертывания AVM претерпел обновление дизайна, заменив черные точки, показанные в более ранних демонстрациях, на гладкую синюю анимированную сферу. Это обновление направлено на создание более визуально привлекательного и современного опыта для пользователей.

OpenAI заявила, что AVM прошла тестирование безопасности внешними экспертами с момента ее выпуска в июле. Однако, поскольку AVM остается моделью с закрытым исходным кодом, она представляет трудности для независимых исследователей, которые могут захотеть изучить ее безопасность и предвзятость.

Главным конкурентом AVM является Gemini Live от Google, запущенный в середине августа для продвинутых подписчиков на Android, с планами по расширению на iOS и дополнительные языки в ближайшее время. Gemini Live предлагает 10 голосовых опций, интегрируется с приложениями Google для бесшовного управления задачами и поддерживает разговоры без помощи рук, что еще больше усиливает конкуренцию в области голосовых технологий ИИ.