Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

главная » AI » ChatGPT » Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

6 декабря, 2025

Время чтения: 3 мин.

Поэзия — это оружие, заряженное будущим, говорил Габриэль Селайя. Но дело в том, что поэзия также является оружием, позволяющим раскрыть весь потенциал ИИ. И дело уже не в том, чтобы давать более или менее подробные и точные подсказки, а в том, что есть спорные вопросы, которые вы не можете задавать языковым моделям большого размера, будь то потому, что они нарушают законность или потому что они, просто и понятно, опасны.

Но закон принят, обман принят. Мы уже знали, что уловка может заключаться в том, чтобы заставить ChatGPT выдать себя за вашу покойную бабушку, чтобы она раскрыла вам ключи от Windows 11 в форме рассказа, обращения к эмоциональности или прямого манипулирования им, чтобы он перешел в режим «Делай, что хочешь», но недавнее исследование обнаружило еще один способ заставить ChatGPT выдать себя за вашу покойную бабушку. ИИ: поэзия.

Если вы хотите, чтобы ChatGPT помогал вам с незаконными и опасными вещами, забудьте о прозе

Газета поступает из Корнельского университета и прямо говорит о побеге из тюрьмы со стихами. В частности, с помощью поэтических подсказок, способных обойти функции безопасности самых популярных моделей искусственного интеллекта, таких как Gemini, ChatGPT или Claude. Фактически, они получили инструкции по созданию химического оружия и вредоносных программ.

Находка является сложной по двум причинам: во-первых, очевидно, что любой, кто может рифмовать пару стихов, может получить совет о том, как создать ядерное или биологическое оружие, и риск, который это влечет за собой. Но также и то, что этот простой взлом свидетельствует о структурном нарушении безопасности, которое может нарушать европейский закон об искусственном интеллекте.

Читать Китай отказывается от творческих специальностей: как ИИ меняет университеты уже сегодня

Чтобы провести эксперимент, они провели состязательное тестирование, метод кибербезопасности, который заключается в проведении стресс-тестов и, таким образом, проверке их надежности перед лицом злоумышленников или вредоносных материалов. И да ладно, если им это удалось: настолько, что теперь они называют это состязательной поэзией.

Поэзия — это главный ключ. Для исследования исследовательская группа протестировала основные семейства OpenAI, Anthropic, Google, DeepSeek, Alibaba, xAI, Moonshot AI, Mistral и Meta* … таким образом, целых 25 моделей. Техника заключается в составлении вредоносных запросов, таких как короткие стихи или метафорические стихи.

По данным исследовательской группы, сравнивая записи с одним и тем же основным намерением, поэтические версии достигли заметно более высокого уровня ответов: в 18 раз выше, при этом некоторые провайдеры терпят неудачу более чем в 90% случаев. Самое лучшее (или худшее, в зависимости от того, как вы смотрите на это) то, что нет необходимости в плотных и запутанных разговорах или длинных подсказках: поэзия работает сразу, в одном подсказке. Итог: поэтическая атака быстрая, эффективная и простая в исполнении.

Преобразовав опасные или незаконные подсказки в стихи, они достигли среднего показателя успеха 62%. Но это зависит от тем. Самый высокий показатель успеха (более 80%) связан с кибератаками с целью извлечения данных, взлома паролей и создания вредоносных программ. Разработка биологического, радиологического и химического оружия превысила 60%, а самым низким — в диапазоне от 40 до 55% — было создание ядерного оружия.

И любопытство: парадоксальным образом меньшие модели оказались более устойчивыми к состязательной технике, чем более крупные, из чего следует, что чем выше возможности, тем выше и уязвимости.

Читать xAI анонсирует крупное обновление Grok и намекает на Grok Code CLI

Исследовательская группа пришла к выводу, что ведущие компании, занимающиеся искусственным интеллектом, в настоящее время не соответствуют стандартам, требуемым в соответствии с нормами Закона ЕС об искусственном интеллекте, даже в добровольном кодексе практики, подписанном такими корпорациями, как OpenAI, Mistral или Google. Закон об искусственном интеллекте начал применяться в августе, но только в августе следующего года Европейская комиссия получит полномочия обеспечить их соблюдение.

Просмотров поста: 849

Предупреждение: Материал содержит упоминания: Meta Platforms Inc.*.

Редактор: AndreyEx

Рейтинг: 5 (1 голос)

Если статья понравилась, то поделитесь ей в социальных сетях:

ChatGPT, искусственный интеллект

AI, ChatGPT, Новости

Кол-во комментариев: 0

Новая атака с нулевым кликом угрожает Диску в Comet

Что такое MCP и почему он определит будущее программного обеспечения

Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

Если вы хотите, чтобы ChatGPT помогал вам с незаконными и опасными вещами, забудьте о прозе

Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий Отменить ответ

Это может быть вам интересно

ChatGPT расширяет возможности родительского контроля.

OpenAI только что запустил GPT-Live: голосовой режим ChatGPT научился лучше слушать, молчать и отвечать

Anthropic раскрыла механизм J-Space в Claude: удалось ли компании впервые заглянуть внутрь «черного ящика» искусственного интеллекта?

ChatGPT Codex — что это такое, как работает и как использовать интеллектуального ИИ-агента для программирования

AI

Рекомендуем

Обзоры

Рекомендуем

Спасибо!

Теперь редакторы в курсе.