BEAST AI: Быстрая атака на языковую модель всего за минуту GPU
Группа ученых из Университета Мэриленда создала технологию BEAST, которая способна за одну минуту времени работы GPU вызвать опасные ответы от крупных языковых моделей (LLM). Используя всего лишь видеокарту Nvidia RTX A6000 с 48 ГБ памяти и предстоящий к выпуску открытый исходный код, BEAST существенно обогнал по скорости существующие методы атак. Основное преимущество BEAST - скорость, позволяющая получить в 65 раз более быстрые результаты по сравнению с градиентными атаками. Исследователи акцентируют внимание на возможности использования этого метода для атаки на общедоступные коммерческие модели, такие как GPT-4 от OpenAI, при условии доступности вероятности токенов модели.
Эта методика является значительным шагом в понимании уязвимостей LLM и подчеркивает важность безопасной подготовки и использования искусственного интеллекта.
атака, скорость, безопасность