Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

главная » AI » ChatGPT » Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

6 декабря, 2025

Время чтения: 3 мин.

Поэзия — это оружие, заряженное будущим, говорил Габриэль Селайя. Но дело в том, что поэзия также является оружием, позволяющим раскрыть весь потенциал ИИ. И дело уже не в том, чтобы давать более или менее подробные и точные подсказки, а в том, что есть спорные вопросы, которые вы не можете задавать языковым моделям большого размера, будь то потому, что они нарушают законность или потому что они, просто и понятно, опасны.

Но закон принят, обман принят. Мы уже знали, что уловка может заключаться в том, чтобы заставить ChatGPT выдать себя за вашу покойную бабушку, чтобы она раскрыла вам ключи от Windows 11 в форме рассказа, обращения к эмоциональности или прямого манипулирования им, чтобы он перешел в режим «Делай, что хочешь», но недавнее исследование обнаружило еще один способ заставить ChatGPT выдать себя за вашу покойную бабушку. ИИ: поэзия.

Если вы хотите, чтобы ChatGPT помогал вам с незаконными и опасными вещами, забудьте о прозе

Газета поступает из Корнельского университета и прямо говорит о побеге из тюрьмы со стихами. В частности, с помощью поэтических подсказок, способных обойти функции безопасности самых популярных моделей искусственного интеллекта, таких как Gemini, ChatGPT или Claude. Фактически, они получили инструкции по созданию химического оружия и вредоносных программ.

Находка является сложной по двум причинам: во-первых, очевидно, что любой, кто может рифмовать пару стихов, может получить совет о том, как создать ядерное или биологическое оружие, и риск, который это влечет за собой. Но также и то, что этот простой взлом свидетельствует о структурном нарушении безопасности, которое может нарушать европейский закон об искусственном интеллекте.

Чтобы провести эксперимент, они провели состязательное тестирование, метод кибербезопасности, который заключается в проведении стресс-тестов и, таким образом, проверке их надежности перед лицом злоумышленников или вредоносных материалов. И да ладно, если им это удалось: настолько, что теперь они называют это состязательной поэзией.

Читать У Китая есть план по предотвращению манипулирования эмоциями чат-ботами с искусственным интеллектом. Они даже предлагают перевести разговор на людей

Поэзия — это главный ключ. Для исследования исследовательская группа протестировала основные семейства OpenAI, Anthropic, Google, DeepSeek, Alibaba, xAI, Moonshot AI, Mistral и Meta … таким образом, целых 25 моделей. Техника заключается в составлении вредоносных запросов, таких как короткие стихи или метафорические стихи.

По данным исследовательской группы, сравнивая записи с одним и тем же основным намерением, поэтические версии достигли заметно более высокого уровня ответов: в 18 раз выше, при этом некоторые провайдеры терпят неудачу более чем в 90% случаев. Самое лучшее (или худшее, в зависимости от того, как вы смотрите на это) то, что нет необходимости в плотных и запутанных разговорах или длинных подсказках: поэзия работает сразу, в одном подсказке. Итог: поэтическая атака быстрая, эффективная и простая в исполнении.

Преобразовав опасные или незаконные подсказки в стихи, они достигли среднего показателя успеха 62%. Но это зависит от тем. Самый высокий показатель успеха (более 80%) связан с кибератаками с целью извлечения данных, взлома паролей и создания вредоносных программ. Разработка биологического, радиологического и химического оружия превысила 60%, а самым низким — в диапазоне от 40 до 55% — было создание ядерного оружия.

И любопытство: парадоксальным образом меньшие модели оказались более устойчивыми к состязательной технике, чем более крупные, из чего следует, что чем выше возможности, тем выше и уязвимости.

Исследовательская группа пришла к выводу, что ведущие компании, занимающиеся искусственным интеллектом, в настоящее время не соответствуют стандартам, требуемым в соответствии с нормами Закона ЕС об искусственном интеллекте, даже в добровольном кодексе практики, подписанном такими корпорациями, как OpenAI, Mistral или Google. Закон об искусственном интеллекте начал применяться в августе, но только в августе следующего года Европейская комиссия получит полномочия обеспечить их соблюдение.

Просмотров поста: 204

Редактор: AndreyEx

Рейтинг: 5 (1 голос)

Если статья понравилась, то поделитесь ей в социальных сетях:

ChatGPT, искусственный интеллект

AI, ChatGPT, Новости

Кол-во комментариев: 0

Новая атака с нулевым кликом угрожает Диску в Comet

Что такое MCP и почему он определит будущее программного обеспечения

Согласно исследованию, цензура ChatGPT и Gemini прекращается, когда вступает в игру рифма

Если вы хотите, чтобы ChatGPT помогал вам с незаконными и опасными вещами, забудьте о прозе

Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий Отменить ответ

Это может быть вам интересно

ИИ не уничтожает рабочие места? Новое исследование показывает неожиданное влияние искусственного интеллекта на безработицу

Люди прячутся за анонимными аккаунтами, думая, что их невозможно раскрыть. Но у ИИ для них плохие новости

Фейковые инструкции установки Claude Code распространяют инфостилеры через атаки InstallFix

Искусственный интеллект научился находить уязвимости в коде: Claude обнаружил ошибки в Firefox

Спасибо!

Теперь редакторы в курсе.