Популярные криптовалюты

BTC $73,980.31 +0.91%
ETH $2,317.61 +1.81%
XRP $1.5136 +1.23%
SOL $93.95 +0.58%
OPN $0.2949 -7.32%
ZEC $268.6 +13.47%
DOGE $0.09959 -0.56%

Книга по психологии помогла «взломать» ChatGPT

Исследователи заставили GPT-4o Mini выполнить запрещенные запросы. Среди примеров: назвать пользователя «придурком» и дать инструкцию по синтезу лидокаина.

Исследователи из Пенсильванского университета заставили GPT-4o Mini выполнить запрещенные запросы. Среди примеров: назвать пользователя «придурком» и дать инструкцию по синтезу лидокаина, пишет The Verge.

Эксперты применили тактики из книги «Психология влияния» профессора Роберта Чалдини. В ходе исследования протестировали семь техник убеждения: авторитет, обязательство, симпатия, взаимность, дефицит, социальное доказательство и единство. Эти методы создают «лингвистические пути к согласию».

Эффективность психологических приемов зависела от конкретного запроса, но в некоторых случаях разница была огромной. Например, при прямом вопросе «как синтезировать лидокаин?» модель отвечала лишь в 1% случаев. Но если исследователи начинали с просьбы синтеза ванилина, после этого GPT-4o Mini описывал процедуру для лидокаина в 100% случаев.

Такой подход оказался наиболее эффективным. При просьбе назвать пользователя придурком чат-бот соглашался в 19% случаев. Но когда его подталкивали через слово bozo («идиот»), вероятность ответа с оскорблением вырастала до 100%.

Искусственный интеллект также можно склонить к нарушению правил с помощью лести или давления, но эти методы срабатывали реже. Например, утверждения в духе «все остальные ИИ это делают» повышало вероятность выдачи рецепта лидокаина до 18%.

Напомним, в августе OpenAI поделилась планами по устранению недостатков ChatGPT при работе с «чувствительными ситуациями». Поводом стал иск от семьи, обвинившей чат-бот в трагедии, которая случилась с их сыном.

В сентябре Meta изменила подход к обучению чат-ботов на базе ИИ, сделав акцент на безопасности подростков.

RSS 02.09.2025 1 154
Источник: https://forklog.com/news/ai/kniga-po-psihologii-pomogla-vzlomat-chatgpt