Логотип

Mistral AI запускает новое семейство мультимодальных моделей с открытым исходным кодом: Mistral 3

Mistral AI запускает новое семейство мультимодальных моделей с открытым исходным кодом: Mistral 3

Французский стартап в области искусственного интеллекта Mistral AI объявил о запуске Mistral 3, семейства из 10 мультимодальных моделей открытым исходным кодом, больших и малых, предназначенных для работы на всех типах устройств и устройств назначения в зависимости от их масштаба и назначения: от смартфона или автономного беспилотника до крупномасштабных корпоративных облачных систем.

Семейство Mistral 3 включает новую крупную модель Mistral Large 3 и набор из нескольких небольших моделей Ministral 3, оптимизированных для приложений на периферии. Все модели были выпущены под лицензией Apache 2.0, что позволяет использовать их в бизнесе без ограничений, в отличие от моделей других компаний, занимающихся искусственным интеллектом, таких как OpenAI или Google.

Кроме того, на этом этапе Mistral делает ставку на будущее, в котором разработка и развитие ИИ не будут исключительной прерогативой компаний, ведущих к созданию проприетарных и закрытых систем, а, скорее, будут предлагать компаниям как можно большую гибкость в настройке и развертывании ИИ, адаптированного к потребностям клиентов. ваши конкретные потребности. Во многих случаях это подразумевает использование моделей меньшего размера, которые могут работать и функционировать без необходимости подключения к внешним сетям.

Mistral Large 3, самая известная модель в этом семействе, имеет собственную архитектуру и 41 миллиард активных параметров, полученных из пула с 675 миллиардами параметров. Он способен обрабатывать как текст, так и изображения, управлять окнами содержимого с использованием до 256 000 токенов и прошел обучение с особым упором на использование с языками, отличными от английского, что также отличает его от других пограничных систем искусственного интеллекта.

Что касается моделей линейки Ministral 3, подготовленных для работы с текстами и изображениями, то их девять, они компактны и подразделяются на три размера с, соответственно, 14000, 8000 и 3000 миллионами параметров. У каждого размера есть три варианта, адаптированных для различных вариантов использования и целей.

Читать  Microsoft теряет двух старших менеджеров по инфраструктуре искусственного интеллекта

Из них базовые модели используются для настройки на высоком уровне, а модели, настроенные для предоставления инструкций для общего чата и выполнения задач. Что касается моделей, оптимизированных для рассуждений, то они используются для сложных логических задач, требующих пошаговых инструкций для получения результатов.

Кроме того, меньшие модели Ministral 3 могут работать на устройствах всего с 4 ГБ видеопамяти, что позволяет использовать функции пограничного ИИ в обычных ноутбуках и даже смартфонах. и другие системы, без необходимости доступа к облачной инфраструктуре для этого. Они работают даже без подключения к Интернету.

Семейство Mistral 3 уже доступно через Mistral AI Studio, Amazon Bedrock, Azure Froundry, Hugging Face (модели Large 3 и Ministral), Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI и Together AI. Скоро они появятся через NVIDIA NIM и AWS SageMaker.

Редактор: AndreyEx

Рейтинг: 5 (1 голос)
Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

3 + пять =

Это может быть вам интересно


Загрузка...

Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала