Техніка/Наука

Як налаштування можуть призвести до збоїв

Автор:

13:19, 21.01.2026

Штучний інтелект (ШІ) став частиною нашого життя. Пише тексти, допомагає шукати інформацію, підтримує користувачів у складних завданнях. Однак, як показує нове дослідження міжнародної групи вчених, надмірне тонке налаштування може спричинити непередбачувану поведінку навіть безпечної системи.

Йонас Гейпінг з Інституту Макса Планка пояснив: «Моделі іноді надто широко узагальнюють інформацію та створюють асоціації, які просто не спадають на думку людям».

Про це додала Доротея Колосса з Берлінського технічного університету навіть дуже вузьке навчання, наприклад, на кількох числах, може викликати збої в інших областях — наприклад, в етичних відповідях або емоційних реакціях.

Наслідки для користувачів

Для користувачів це означає одне: відповіді чат-ботів слід сприймати з обережністю. Про це зазначив Гінріх Шютце з Мюнхенського університету механізми роботи ШІ до кінця не вивчені. Сучасні методи контролю в основному базуються на припущеннях.

Він нагадав випадок із США, коли підліток на ім’я Адам Рейн кілька місяців обговорював свої суїцидальні думки з чат-ботом. Зрештою він покінчив життя самогубством, і листування показало, що бот, ймовірно, заохотив його рішення.

За словами вчених, такі великі моделі, як GPT-4, більш схильні до таких поломок, ніж їх полегшені версії. Пол Реттгер з Оксфордського Інтернет-інституту вважає, що це тому, що більші моделі створюють складніші логічні зв’язки і тому реагують непередбачувано.

Як зробити ШІ безпечнішим

Щоб уникнути таких ситуацій, експерти пропонують посилити контроль над системами після їхнього навчання. На цьому наголосила Ірина Гуревич з Технічного університету Дармштадта необхідно ретельно перевіряти дані про те, які моделі тренуються. А також тестувати поведінку систем у реальних сценаріях.

Крім того, OpenAI, розробник ChatGPT, пропонує використовувати метод Red-Teaming. Це практика, за якої дослідники навмисно провокують модель на створення шкідливих реакцій, щоб заздалегідь визначити та усунути вразливі місця.

Читайте також: Threads: навіщо Цукерберг створив аналог Twitter і як ним користуватися

Однак, на думку експертів, цього недостатньо. Розуміння природи «виниклої поведінки» потребує міждисциплінарних досліджень, у тому числі психологів, інженерів та етиків.