Этот голосовой помощник с искусственным интеллектом опередил OpenAI в реализации одной из долгожданных функций ChatGPT

Узнайте, как новый голосовой помощник с искусственным интеллектом превзошел OpenAI, предоставив одну из самых ожидаемых функций ChatGPT.

июль 25, 2024 - 12:24
Этот голосовой помощник с искусственным интеллектом опередил OpenAI в реализации одной из долгожданных функций ChatGPT
Кютай объявил, что Moshi будет проектом с открытым исходным кодом, который будет делиться своими модельными кодами и структурами для содействия инновациям.

Отсрочка OpenAI ожидаемого голосового режима ChatGPT разочаровала многих его поклонников, но теперь, возможно, их превзошли. Kyutai, французский разработчик искусственного интеллекта, представил Moshi, голосового помощника с искусственным интеллектом, работающего в режиме реального времени. Разработанный для естественного общения, как Alexa или Google Assistant, Moshi использует передовые языковые модели, такие как модель Helium 7B. По словам Кютая, Моши может говорить с разными акцентами и владеет 70 различными эмоциональными и разговорными стилями. Он может даже управлять двумя аудиопотоками одновременно, позволяя одновременно слушать и говорить. Кютай усовершенствовал Moshi, настроив более 100 000 синтетических диалогов, созданных с помощью технологии преобразования текста в речь (TTS), с целью наполнить его тонкостями и нюансами человеческого общения. Бренд также сотрудничал с профессиональным художником по озвучиванию, чтобы улучшить качество голоса Моши.

Этот ИИ-помощник сочетает в себе текстовое и аудиообучение, оптимизированный для работы на различных серверных устройствах, включая такие устройства, как ноутбуки, без использования облачного взаимодействия. Компания продвигает этот подход как средство обеспечения конфиденциальности и безопасности, избегая передачи конфиденциальных данных через Интернет.

Открытый разговор: Моши Кютая обещает инновации с открытым исходным кодом

Кютай объявил, что Moshi будет проектом с открытым исходным кодом, который будет делиться своими модельными кодами и структурами для содействия инновациям. Этот подход направлен на устранение опасений по поводу безопасности и этики, связанных с закрытыми моделями ИИ крупных компаний. При поддержке таких спонсоров, как французский миллиардер Ксавье Ниль, Кютай также разрабатывает системы аудиоидентификации с использованием искусственного интеллекта, водяных знаков и отслеживания подписей для Moshi. Эти функции призваны повысить подотчетность и отслеживаемость контента, создаваемого ИИ. Поскольку Moshi продолжает развиваться, ее впечатляющие голосовые возможности могут побудить конкурентов ускорить создание собственных голосовых версий ИИ-помощников, таких как ChatGPT, или интегрировать большие языковые модели в существующие платформы, такие как Alexa.