Этот голосовой помощник с искусственным интеллектом опередил OpenAI в реализации одной из долгожданных функций ChatGPT
Узнайте, как новый голосовой помощник с искусственным интеллектом превзошел OpenAI, предоставив одну из самых ожидаемых функций ChatGPT.
Отсрочка OpenAI ожидаемого голосового режима ChatGPT разочаровала многих его поклонников, но теперь, возможно, их превзошли. Kyutai, французский разработчик искусственного интеллекта, представил Moshi, голосового помощника с искусственным интеллектом, работающего в режиме реального времени. Разработанный для естественного общения, как Alexa или Google Assistant, Moshi использует передовые языковые модели, такие как модель Helium 7B. По словам Кютая, Моши может говорить с разными акцентами и владеет 70 различными эмоциональными и разговорными стилями. Он может даже управлять двумя аудиопотоками одновременно, позволяя одновременно слушать и говорить. Кютай усовершенствовал Moshi, настроив более 100 000 синтетических диалогов, созданных с помощью технологии преобразования текста в речь (TTS), с целью наполнить его тонкостями и нюансами человеческого общения. Бренд также сотрудничал с профессиональным художником по озвучиванию, чтобы улучшить качество голоса Моши.
Этот ИИ-помощник сочетает в себе текстовое и аудиообучение, оптимизированный для работы на различных серверных устройствах, включая такие устройства, как ноутбуки, без использования облачного взаимодействия. Компания продвигает этот подход как средство обеспечения конфиденциальности и безопасности, избегая передачи конфиденциальных данных через Интернет.
Открытый разговор: Моши Кютая обещает инновации с открытым исходным кодом
Кютай объявил, что Moshi будет проектом с открытым исходным кодом, который будет делиться своими модельными кодами и структурами для содействия инновациям. Этот подход направлен на устранение опасений по поводу безопасности и этики, связанных с закрытыми моделями ИИ крупных компаний. При поддержке таких спонсоров, как французский миллиардер Ксавье Ниль, Кютай также разрабатывает системы аудиоидентификации с использованием искусственного интеллекта, водяных знаков и отслеживания подписей для Moshi. Эти функции призваны повысить подотчетность и отслеживаемость контента, создаваемого ИИ. Поскольку Moshi продолжает развиваться, ее впечатляющие голосовые возможности могут побудить конкурентов ускорить создание собственных голосовых версий ИИ-помощников, таких как ChatGPT, или интегрировать большие языковые модели в существующие платформы, такие как Alexa.