Дослідження: більшість чат-ботів з ШІ легко зламуються і дають небезпечні відповіді

Дослідження: більшість чат-ботів з ШІ легко зламуються і дають небезпечні відповіді

Зламані чат-боти на основі штучного інтелекту загрожують зробити небезпечні знання легкодоступними, видаючи незаконну інформацію, яку програми засвоюють під час навчання, кажуть дослідники, повідомляє The Guardian. У звіті про цю загрозу дослідники роблять висновок, що більшість чат-ботів, керованих штучним інтелектом, легко обманом змусити генерувати шкідливу та незаконну інформацію, що свідчить про серйозні ризики. Те, що колись було доступно лише потужним державним суб’єктам або організованим злочинним угрупованням, незабаром може опинитися в руках зловмисника з ноутбуком або навіть мобільним телефоном, вважають автори звіту.

Дослідження, проведене в університеті Бен-Гуріона в Негеві в Ізраїлі, виявило зростаючу загрозу з боку “темних LLM” − моделей ШІ, які або навмисно розроблені без засобів контролю безпеки, або модифіковані за допомогою джейлбрейків. Деякі з них відкрито рекламуються в інтернеті як такі, що не мають “жодних етичних обмежень” і готові допомагати в незаконній діяльності, такій як кіберзлочинність і шахрайство. Щоб продемонструвати проблему, дослідники розробили універсальний джейлбрейк, який скомпрометував кілька провідних чат-ботів, дозволивши їм відповідати на запитання, від яких зазвичай слід було б відмовитися. Після зламу LLM постійно генерували відповіді майже на будь-який запит, йдеться у звіті.

Система знань складалася з шокуючих відкриттів. Серед прикладів – запити про те, як зламати комп’ютерні мережі або виготовити наркотики, а також покрокові інструкції для інших видів злочинної діяльності. Дослідники зв’язалися з провідними провайдерами LLM, щоб попередити їх про універсальний джейлбрейк, але, за їхніми словами, реакція була «невтішною». Кілька компаній не відповіли, а інші заявили, що атаки на джейлбрейк виходять за рамки програм винагороди, які винагороджують етичних хакерів за виявлення вразливостей у програмному забезпеченні.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *