Ответ OpenAI на Gemini 3: GPT-5.2

В последнее время гонка между крупными моделями искусственного интеллекта перестала быть чисто техническим вопросом и превратилась в вопрос выживания бизнеса. Google заслуженно набирает обороты благодаря достижениям в Gemini 3, панели тестов меняются почти ежедневно, а в OpenAI начали звучать внутренние сигналы тревоги, вплоть до того, что Сэм Альтман зашел так далеко, что подписал меморандум с “красным кодом”, в котором призывал пресекать отвлекающие факторы. — например, вход в систему. реклама в ChatGPT— чтобы переориентироваться на восприятие продукта. Именно в этой атмосфере конкурентного давления мы должны найти выход GPT-5.2, новой ставки компании на попытку вернуть себе инициативу.
GPT-5.2 представлен как новая frontier model от OpenAI и ориентирован как на профессиональных пользователей, так и на разработчиков, которые в больших масштабах работают с его API. Компания будет распространять его в трех четко дифференцированных вариантах: Instant, предназначенный для рутинных запросов, в которых приоритет отдается скорости — поиск информации, написание, перевод; Thinking, специализирующийся на сложных структурированных задачах, таких как программирование, анализ больших документов, продвинутая математика или планирование; и Pro, модель высокого класса, ориентирован на обеспечение максимальной точности и надежности при решении особенно сложных задач. Идея состоит не только в том, чтобы выпустить “более мощную модель”, но и в том, чтобы адаптировать каталог к различным уровням требований и стоимости.
По словам Фиджи Симо, директора по продуктам OpenAI, GPT-5.2 стремится “открыть еще большую экономическую ценность” для своих пользователей. Новая версия улучшает создание электронных таблиц, создание презентаций, написание кода, интерпретацию изображений, понимание длинных контекстов и использование связанных инструментов в многоступенчатых проектах. На техническом уровне компания заявляет, что модель достигает новых максимумов в тестах кода, математике, естествознании, видении, контекстно-зависимом мышлении и использовании инструментов, что теоретически должно привести к созданию более надежных рабочих процессов агентов, кода “производственного” качества. и системы, способные работать на основе кода. большие реальные объемы данных.

Релиз состоится именно тогда, когда Gemini 3 доминирует в рейтинге LMArena в большинстве тестов, за заметным исключением кода, где Anthropic сохраняет лидерство с Claude Opus 4.5. Google также усилил интеграцию своей модели во всю экосистему своих продуктов и в свое облако, с мультимодальными и агентскими потоками и с управляемыми серверами MCP, которые упрощают подключение Gemini к таким сервисам, как Maps или BigQuery. Столкнувшись с этим развертыванием, OpenAI гарантирует, что GPT-5.2 Thinking превосходит Gemini 3 и Claude Opus 4.5 практически во всех тестах рассуждений, которые он показывает на своих собственных графиках, от разработки программного обеспечения в реальных средах (SWE-Bench Pro) и науки на докторском уровне (GPQA Diamond).) к задачам логического анализа. абстрактное мышление и обнаружение закономерностей (ARC-AGI).
Акцент на умственных способностях не случаен. Эйдан Кларк, руководитель отдела исследований, подчеркивает, что высокие баллы по математике означают не только решение уравнений: они функционируют как показатель того, способна ли модель следовать логическим цепочкам из нескольких этапов, поддерживать согласованность чисел с течением времени и избегать незначительных ошибок, которые усугубляются длительными процессами. Эти свойства, отмечает он, оказываются критически важными в таких областях, как финансовое моделирование, прогнозирование, анализ данных или любая задача, где слегка ошибочный ответ может привести к неправильным решениям. OpenAI также гарантирует, что ответы GPT-5.2 Thinking содержат на 38% меньше ошибок, чем ответы его предшественника, что укрепляет его позиционирование как повседневного рабочего инструмента для принятия решений, исследований и написания статей.
Однако за яркостью показателей скрывается значительное структурное давление. OpenAI выделила до 1,4 триллиона долларов инвестиций в инфраструктуру искусственного интеллекта на ближайшие несколько лет — план, разработанный в то время, когда она еще имела явное преимущество перед конкурентами. Поскольку Google ускоряется и набирает обороты благодаря интеграции Gemini в свои сервисы, эти инвестиционные усилия стали дополнительным фактором риска. Модели, ориентированные на глубокое мышление, такие как режимы Thinking и Deep Research, намного дороже в исполнении, чем обычные чат—боты, поскольку они потребляют гораздо больше вычислительных ресурсов. Следование этой линии означает вступление в сложную динамику: тратить больше средств на вычисления, чтобы возглавить рейтинг, и в то же время нести расходы на поддержание этих систем в полномасштабном производстве.
Редактор: AndreyEx