Mistral's Large 2: Ответ на мета и новейшие модели OpenAI

Mistral выпустил модель Large 2, конкурентную Meta и OpenAI. Она превосходит Llama 3.1 по генерации кода и математике, предлагая улучшенную точность.

август 2, 2024 - 11:59
август 2, 2024 - 11:59
Mistral's Large 2: Ответ на мета и новейшие модели OpenAI
Large 2 имеет окно на 128 000 токенов, что позволяет ему обрабатывать большие объемы данных в одном запросе — эквивалентном примерно 300 страницам.

Когда идет дождь, он льется в область передовых моделей ИИ. В среду Mistral представила свою новую флагманскую модель Large 2, позиционируя ее как прямого конкурента новейшим высокопроизводительным моделям OpenAI и Meta. Mistral утверждает, что Large 2 преуспевает в генерации кода, математике и рассуждениях, соответствуя возможностям своих ведущих аналогов.

Этот релиз вышел всего через день после того, как Meta представила свою последнюю модель с открытым исходным кодом Llama 3.1 405B. Mistral утверждает, что Large 2 устанавливает новый стандарт производительности и экономической эффективности в открытых моделях, демонстрируя впечатляющие контрольные показатели в поддержку этого заявления. Примечательно, что Large 2 достигает превосходной генерации кода и математической производительности по сравнению с Llama 3.1 405B, несмотря на то, что имеет всего 123 миллиарда параметров, что составляет менее трети размера ее конкурента.

Значительным улучшением Large 2 является ее сниженная тенденция к генерации неверной или сфабрикованной информации, распространенная проблема с моделями ИИ. Mistral сосредоточился на обучении модели быть более точной и прозрачной, распознавая, когда у нее недостаточно информации, вместо того, чтобы фабриковать правдоподобно звучащие ответы.

Mistral, парижский стартап в области искусственного интеллекта, недавно получил 640 миллионов долларов в раунде финансирования серии B под руководством General Catalyst, достигнув оценки в 6 миллиардов долларов. Несмотря на то, что Mistral является новым игроком в области искусственного интеллекта, он быстро добивается успехов с передовыми моделями. Однако стоит отметить, что модели Mistral, как и многие другие, не являются полностью открытыми — для коммерческого использования требуется платная лицензия. Реализация таких больших моделей также требует значительных знаний и инфраструктуры, что ограничивает доступность.

В отличие от некоторых своих конкурентов, Mistral Large 2 и Llama 3.1 от Meta не обладают мультимодальными возможностями. OpenAI лидирует в этой области, предлагая модели, которые могут одновременно обрабатывать как текст, так и изображения, — функцию, которую некоторые стартапы стремятся внедрить.

Large 2 имеет окно на 128 000 токенов, что позволяет ему обрабатывать большие объемы данных в одном запросе — эквивалентном примерно 300 страницам. Модель также предлагает расширенную многоязычную поддержку, понимая широкий спектр языков, включая английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский, а также 80 языков кодирования. В частности, Large 2 разработан для получения более кратких ответов по сравнению со многими ведущими моделями ИИ, которые часто генерируют чрезмерно многословные выходные данные.

Вы можете получить доступ к Mistral Large 2 через Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM watsonx.ai. Он также доступен на La Plateforme Mistral под названием «mistral-large-2407» и может быть бесплатно протестирован на конкуренте стартапа ChatGPT, Le Chat.