Логотип

Ответ OpenAI на Gemini 3: GPT-5.2

Ответ OpenAI на Gemini 3: GPT-5.2

В последнее время гонка между крупными моделями искусственного интеллекта перестала быть чисто техническим вопросом и превратилась в вопрос выживания бизнеса. Google заслуженно набирает обороты благодаря достижениям в Gemini 3, панели тестов меняются почти ежедневно, а в OpenAI начали звучать внутренние сигналы тревоги, вплоть до того, что Сэм Альтман зашел так далеко, что подписал меморандум с “красным кодом”, в котором призывал пресекать отвлекающие факторы. — например, вход в систему. реклама в ChatGPT— чтобы переориентироваться на восприятие продукта. Именно в этой атмосфере конкурентного давления мы должны найти выход GPT-5.2, новой ставки компании на попытку вернуть себе инициативу.

GPT-5.2 представлен как новая frontier model от OpenAI и ориентирован как на профессиональных пользователей, так и на разработчиков, которые в больших масштабах работают с его API. Компания будет распространять его в трех четко дифференцированных вариантахInstant, предназначенный для рутинных запросов, в которых приоритет отдается скорости — поиск информации, написание, перевод; Thinking, специализирующийся на сложных структурированных задачах, таких как программирование, анализ больших документов, продвинутая математика или планирование; и Pro, модель высокого класса, ориентирован на обеспечение максимальной точности и надежности при решении особенно сложных задач. Идея состоит не только в том, чтобы выпустить “более мощную модель”, но и в том, чтобы адаптировать каталог к различным уровням требований и стоимости.

По словам Фиджи Симо, директора по продуктам OpenAI, GPT-5.2 стремится “открыть еще большую экономическую ценность” для своих пользователей. Новая версия улучшает создание электронных таблиц, создание презентаций, написание кода, интерпретацию изображений, понимание длинных контекстов и использование связанных инструментов в многоступенчатых проектах. На техническом уровне компания заявляет, что модель достигает новых максимумов в тестах кода, математике, естествознании, видении, контекстно-зависимом мышлении и использовании инструментов, что теоретически должно привести к созданию более надежных рабочих процессов агентов, кода “производственного” качества. и системы, способные работать на основе кода. большие реальные объемы данных.

Читать  Цукерберг заплатил 10 миллионов, чтобы подписать контракт со своим новым руководителем отдела искусственного интеллекта. Всего за полгода отношения между ними уже стали напряженными

 

Релиз состоится именно тогда, когда Gemini 3 доминирует в рейтинге LMArena в большинстве тестов, за заметным исключением кода, где Anthropic сохраняет лидерство с Claude Opus 4.5. Google также усилил интеграцию своей модели во всю экосистему своих продуктов и в свое облако, с мультимодальными и агентскими потоками и с управляемыми серверами MCP, которые упрощают подключение Gemini к таким сервисам, как Maps или BigQuery. Столкнувшись с этим развертыванием, OpenAI гарантирует, что GPT-5.2 Thinking превосходит Gemini 3 и Claude Opus 4.5 практически во всех тестах рассуждений, которые он показывает на своих собственных графиках, от разработки программного обеспечения в реальных средах (SWE-Bench Pro) и науки на докторском уровне (GPQA Diamond).) к задачам логического анализа. абстрактное мышление и обнаружение закономерностей (ARC-AGI).

Акцент на умственных способностях не случаен. Эйдан Кларк, руководитель отдела исследований, подчеркивает, что высокие баллы по математике означают не только решение уравнений: они функционируют как показатель того, способна ли модель следовать логическим цепочкам из нескольких этапов, поддерживать согласованность чисел с течением времени и избегать незначительных ошибок, которые усугубляются длительными процессами. Эти свойства, отмечает он, оказываются критически важными в таких областях, как финансовое моделирование, прогнозирование, анализ данных или любая задача, где слегка ошибочный ответ может привести к неправильным решениям. OpenAI также гарантирует, что ответы GPT-5.2 Thinking содержат на 38% меньше ошибок, чем ответы его предшественника, что укрепляет его позиционирование как повседневного рабочего инструмента для принятия решений, исследований и написания статей.

Однако за яркостью показателей скрывается значительное структурное давление. OpenAI выделила до 1,4 триллиона долларов инвестиций в инфраструктуру искусственного интеллекта на ближайшие несколько лет — план, разработанный в то время, когда она еще имела явное преимущество перед конкурентами. Поскольку Google ускоряется и набирает обороты благодаря интеграции Gemini в свои сервисы, эти инвестиционные усилия стали дополнительным фактором риска. Модели, ориентированные на глубокое мышление, такие как режимы Thinking и Deep Research, намного дороже в исполнении, чем обычные чат—боты, поскольку они потребляют гораздо больше вычислительных ресурсов. Следование этой линии означает вступление в сложную динамику: тратить больше средств на вычисления, чтобы возглавить рейтинг, и в то же время нести расходы на поддержание этих систем в полномасштабном производстве.

Читать  Новый генеральный директор Mozilla делает ставку на Firefox с искусственным интеллектом

 

Дополнительная информация

Редактор: AndreyEx

Рейтинг: 5 (1 голос)
Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

4 × 4 =

Это может быть вам интересно


Загрузка...

Спасибо!

Теперь редакторы в курсе.

Прокрутить страницу до начала