Дослідження: більшість чат-ботів з ШІ легко зламуються і дають небезпечні відповіді

Зламані чат-боти на основі штучного інтелекту загрожують зробити небезпечні знання легкодоступними, видаючи незаконну інформацію, яку програми засвоюють під час навчання, кажуть дослідники, повідомляє The Guardian. У звіті про цю загрозу дослідники роблять висновок, що більшість чат-ботів, керованих штучним інтелектом, легко обманом змусити генерувати шкідливу та незаконну інформацію, що свідчить про серйозні ризики. Те, що колись було доступно лише потужним державним суб’єктам або організованим злочинним угрупованням, незабаром може опинитися в руках зловмисника з ноутбуком або навіть мобільним телефоном, вважають автори звіту.

Дослідження, проведене в університеті Бен-Гуріона в Негеві в Ізраїлі, виявило зростаючу загрозу з боку “темних LLM” − моделей ШІ, які або навмисно розроблені без засобів контролю безпеки, або модифіковані за допомогою джейлбрейків. Деякі з них відкрито рекламуються в інтернеті як такі, що не мають “жодних етичних обмежень” і готові допомагати в незаконній діяльності, такій як кіберзлочинність і шахрайство. Щоб продемонструвати проблему, дослідники розробили універсальний джейлбрейк, який скомпрометував кілька провідних чат-ботів, дозволивши їм відповідати на запитання, від яких зазвичай слід було б відмовитися. Після зламу LLM постійно генерували відповіді майже на будь-який запит, йдеться у звіті.

Система знань складалася з шокуючих відкриттів. Серед прикладів – запити про те, як зламати комп’ютерні мережі або виготовити наркотики, а також покрокові інструкції для інших видів злочинної діяльності. Дослідники зв’язалися з провідними провайдерами LLM, щоб попередити їх про універсальний джейлбрейк, але, за їхніми словами, реакція була «невтішною». Кілька компаній не відповіли, а інші заявили, що атаки на джейлбрейк виходять за рамки програм винагороди, які винагороджують етичних хакерів за виявлення вразливостей у програмному забезпеченні.

AI чатбот ШІ

Дослідження: більшість чат-ботів з ШІ легко зламуються і дають небезпечні відповіді

Також цікаво:

Світовий ринок смартфонів у II кварталі 2026 року: падіння продажів та тріумф лідерів

IBM представила новий сервер Power S1112 для малого бізнесу та периферійного ШІ

Lenovo отримує 90% електроенергії для своєї операційної діяльності з відновлюваних джерел

Завдяки ШІ компанія Microsoft змогла випустити патчі для рекордної кількості вразливостей

Залишити відповідь Скасувати коментар

Війна між Україною та РФ зробила F-35 літаком учорашнього дня

Не звикайте до безкоштовного ШІ – це скоро закінчиться

Єгор Аушев, керуючий партнер KICRF: «Ми одна з найбільш атакованих країн у світі»

Категорії

Архіви

Дослідження: більшість чат-ботів з ШІ легко зламуються і дають небезпечні відповіді

Поділитися

Також цікаво:

Світовий ринок смартфонів у II кварталі 2026 року: падіння продажів та тріумф лідерів

IBM представила новий сервер Power S1112 для малого бізнесу та периферійного ШІ

Lenovo отримує 90% електроенергії для своєї операційної діяльності з відновлюваних джерел

Завдяки ШІ компанія Microsoft змогла випустити патчі для рекордної кількості вразливостей

Залишити відповідь Скасувати коментар

Категорії