Исследователи научили разблокировать AI чат-ботов
Команда ученых из технологического университета в Сингапуре разработала процесс, который позволяет обходить ограничения AI чат-ботов, научив их отвечать на запрещенные темы. Это достигается путем 'обучения через взаимодействие' с другими большими языковыми моделями. Открытие называют 'джейлбрейком' — термином, взятым из мира мобильных устройств, где он обозначает обход ограничений программного обеспечения.
Применяя метод, именуемый 'Мастер-ключ', исследователи обучили два чат-бота общаться друг с другом, тем самым давая им возможность обучаться и преодолевать запреты друг друга на определенные темы. Такие AI чат-боты как ChatGPT, Google Bard и Microsoft Bing Chat оказались подвержены этой технике. Процесс 'Мастер-ключ' оказался в три раза эффективнее обычных способов обхода ограничений.
исследование, AI, безопасность