ТщательноAnthropic запускает проект Glasswing для управления мощностью своего собственного ИИ в кибератаках

У проекта Glasswing есть любопытные мотивы. Anthropic уверяет, что их самая мощная кибер-модель ИИ слишком опасна для публикации, и поэтому сместила акцент на амбициозный проект на уровне сообщества, цель которого — контролировать его масштабы. Эта инициатива вновь выдвигает на передний план современности одну из серьезных проблем современной технологической отрасли, искусственный интеллект и кибербезопасность, а также роль ИИ в кибератаках, позволяя проводить все более сложные, дешевые и доступные вредоносные кампании.
В число партнеров по запуску проекта входят такие крупные организации, как Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Anthropic заявляет, что она также расширила доступ к более чем 40 дополнительным организациям, разрабатывающим или поддерживающим критически важное программное обеспечение, и обязуется выделить до 100 миллионов долларов в виде кредитов на использование Claude Mythos Preview в рамках всей инициативы, а также 4 миллиона долларов в виде прямых пожертвований организациям, занимающимся безопасностью с открытым исходным кодом.
Объявление было сделано в момент большого импульса — и пристального внимания — к калифорнийскому стартапу в области искусственного интеллекта. В минувшие выходные компания объявила, что ее годовой доход превысил 30 миллиардов долларов (по сравнению с 9 миллиардами долларов на конец 2025 года) и что число корпоративных клиентов, тратящих более миллиона долларов в год, уже превышает 1000, увеличившись менее чем вдвое. два месяца. Одновременно компания объявила о заключении соглашения о многогигаваттных вычислениях с Google и Broadcom. Агентство Bloomberg сообщило, что Anthropic наняла топ-менеджера Microsoft Эрика Бойда для руководства расширением своей инфраструктуры.
Проект Glasswing
Эта инициатива категорически отличается от ориентира дохода или соглашения о вычислительной технике. Это самая амбициозная попытка Anthropic превратить передовые возможности ИИ — возможности, которые, как мы уже говорили, сама компания называет опасными, — в защитное преимущество, прежде чем эти же возможности будут распространены на враждебных субъектов.
В основе проекта лежит Claude Mythos Preview, модель сканирования общего назначения, которая, по словам Anthropic, уже выявила тысячи серьезных уязвимостей нулевого дня — сбоев, ранее неизвестных разработчикам программного обеспечения — во всех основных операционных системах. и веб-браузеры, а также множество других уязвимостей. еще одно важное программное обеспечение.
По этой причине стартап не будет делать модель доступной для широкой публики. «Мы не планируем, что предварительная версия Claude Mythos будет доступна широкой публике из-за ее возможностей в области кибербезопасности», — заявил Ньютон Ченг, руководитель отдела кибербезопасности Frontier Red Team в Anthropic, в интервью VentureBeat. «Однако, учитывая темпы развития ИИ, пройдет совсем немного времени, прежде чем такие возможности будут расширены, возможно, за пределы субъектов, приверженных их безопасному внедрению. Последствия для экономики, общественной безопасности и национальной безопасности могут быть серьезными«.
Это заявление поразительно, исходящее от компании, создавшей модель, и вызывает критику некоторых аналитиков за отсутствие контроля над крупными моделями искусственного интеллекта. По сути, Anthropic утверждает, что созданный им инструмент достаточно мощен, чтобы изменить ландшафт кибербезопасности, и что единственная ответственность заключается в том, чтобы сдерживать его, давая системам защиты хотя бы начальное преимущество.
Технические результаты подтверждают это утверждение. Согласно пресс-релизу, Mythos Preview удалось найти тысячи уязвимостей и разработать множество связанных эксплойтов полностью автономно и без вмешательства человека. Anthropic представила некоторые из них в операционной системе OpenBSD, в библиотеке для видео FFmpeg и даже в ядре Linux. О трех уязвимостях было сообщено соответствующим ответственным лицам, и они уже исправлены, но осталось еще очень и очень много.
Как управлять 0-днями
Одновременное обнаружение тысяч уязвимостей нулевого дня звучит впечатляюще. Однако ответственное управление ими — это логистический кошмар, и это одна из самых серьезных критических замечаний, которые исследователи безопасности когда-либо высказывали по поводу обнаружения уязвимостей с помощью ИИ. Наводнение ответственных за обслуживание программного обеспечения с открытым исходным кодом, многие из которых являются неоплачиваемыми волонтерами, потоком сообщений о критических ошибках может быть скорее вредным, чем полезным.
Компания Anthropic создала специальную рейтинговую систему для решения этой проблемы. Сначала они будут классифицированы, а затем отправлены наиболее серьезным специалистам по оценке, нанятым профессиональными специалистами по оценке, которые помогут в процессе раскрытия информации, вручную проверяя каждый отчет об ошибке перед отправкой. Эта система разработана таким образом, чтобы избежать именно того сценария, которого больше всего опасаются специалисты по техническому обслуживанию: автоматического потока непроверенных отчетов.
Когда Anthropic получит доступ к исходному коду, компания намеревается включать в каждый отчет патч-кандидата с соответствующей маркировкой (это означает, что специалист по техническому обслуживанию знает, что патч был написан или отредактирован моделью), и предлагает сотрудничать в разработке качественного решения для производства, поскольку патч-кандидат должен быть исправлен. модель проекта Glasswing также может писать исправления, которые будут подвергаться такой же проверке.
Что касается сроков раскрытия информации, Anthropic заявляет, что придерживается согласованных с партнерами рамок раскрытия уязвимостей. После выпуска патча компания обычно ждет 45 дней, прежде чем публиковать все технические подробности, что дает поставщикам время для развертывания решения до того, как информация об эксплойте станет общедоступной.
Как повысить доверие к ИИ… и компаниям, которые им управляют
Ирония того, что компания утверждает, что создала самую мощную кибер-модель из когда-либо созданных, одновременно страдая от ряда досадных сбоев в системе безопасности, не осталась незамеченной наблюдателями. В конце марта черновик записи в блоге о Mythos был оставлен в общедоступном хранилище незащищенных данных — ошибочная конфигурация CMS, которая обнажила около 3000 внутренних ресурсов, включая то, что казалось стратегическими планами по запуску модели.
Несколько дней спустя, 31 марта, любой, кто запускал npm install на Claude Code, загрузил полный исходный код Anthropic (512 000 строк) в течение примерно трех часов из-за ошибки упаковки, инцидента, который привлек много внимания сообщества разработчиков.
Когда его руководителей спросили, почему партнеры и правительства должны доверять Anthropic в качестве хранителя модели, которая, по заявлению компании, обладает беспрецедентными кибернетическими возможностями, Ченг ответил прямо: «Безопасность имеет решающее значение в нашем способе разработки и распространения. и отмеченные сбои были человеческими ошибками в наших решениях». инструменты публикации, а не сбои в нашей архитектуре безопасности». Стартап заявляет, что внес изменения, чтобы предотвратить повторение таких случаев.
Партнеры проекта Glasswing
Широта коалиции примечательна. В него входят прямые конкуренты, а также ведущие компании в области кибербезопасности, финансовые учреждения и компания Linux Foundation, отвечающая за крупнейшую в мире экосистему с открытым исходным кодом. Кроме того, несколько партнеров уже несколько недель тестируют модель Mythos Preview на своей собственной инфраструктуре.
Необходимость достигает единства. Технический директор CrowdStrike Элиа Зайцев охарактеризовал эту инициативу с точки зрения сокращения сроков: «Время между обнаружением уязвимости и ее использованием злоумышленником резко сократилось; то, что раньше занимало месяцы, теперь благодаря ИИ происходит за считанные минуты».
Вице-президент AWS и ИТ-директор Эми Херцог заявила, что ее команды уже тестируют Mythos Preview на критически важных кодовых базах, где модель «уже помогает нам укрепить наш код». Со своей стороны, глобальный ИТ-директор Microsoft Игорь Цыганский отметил, что при тестировании с CTI-REALM, эталоном безопасности Microsoft с открытым исходным кодом, «Claude Mythos Preview продемонстрировал существенные улучшения по сравнению с предыдущими моделями».
Возможно, наиболее показательный комментарий был получен от Джима Землина, исполнительного директора Linux Foundation, который указал на фундаментальную асимметрию, которая десятилетиями влияла на безопасность программного обеспечения с открытым исходным кодом: «В прошлом опыт в области безопасности был роскошью для организаций с большими группами безопасности. Лица, ответственные за обслуживание программного обеспечения с открытым исходным кодом, программное обеспечение которого лежит в основе большей части критической инфраструктуры мира, исторически были вынуждены решать проблемы безопасности самостоятельно». Проект Glasswing, по его словам, «предлагает жизнеспособный способ изменить эту ситуацию».
Защита перед атакой
Самый важный вопрос, который поднимает проект Glasswing, заключается не в том, реальны ли возможности Mythos Preview — поддержка партнеров и исправленные уязвимости предполагают, что это так, — а в том, сколько времени на самом деле есть у защитников, прежде чем аналогичные возможности станут доступны противникам.
Руководитель отдела кибербезопасности Anthropic был откровенен: «Вполне вероятно, что в ближайшие месяцы передовые возможности ИИ значительно расширятся. Учитывая темпы развития ИИ, пройдет совсем немного времени, прежде чем такие возможности будут расширены, возможно, за пределы субъектов, приверженных их безопасному внедрению».
Тем не менее, проект Glasswing выглядит важным шагом в предоставлении сторонникам устойчивого развития преимуществ в наступающую эпоху кибербезопасности, основанной на искусственном интеллекте. Как отмечают в стартапе, эта инициатива — только отправная точка. Ни одна организация не может решить эти проблемы кибербезопасности в одиночку. В среднесрочной перспективе компания предложила, чтобы внешний независимый орган мог стать идеальной средой для продолжения работы над крупномасштабными проектами в области кибербезопасности.
Великие модели ИИ, такие как сам Клод Мифос, уже продемонстрировали свою способность автономно взламывать системы, которые до сих пор считались самыми безопасными на планете. И, обратите внимание, День подарков — время, когда квантовый компьютер сможет взломать криптографию, защищающую всю корпоративную цифровую инфраструктуру, — запланирован на 2029 год. Координация и объединение будут обязательными.
Редактор: AndreyEx