Искусственный интеллект и новые вызовы
Два ведущих игрока в области искусственного интеллекта в Сан-Франциско предложили общественности создать вопросы, которые смогли бы протестировать возможности крупных языковых моделей (LLM), таких как Google Gemini и OpenAI’s o1. Scale AI, специализирующаяся на подготовке больших объемов данных для обучения LLM, совместно с Центром безопасности ИИ (CAIS) запустили инициативу под названием «Последний экзамен человечества».
Инициатива предлагает призы в размере 5000 долларов США ($) для тех, кто предложит 50 лучших вопросов для теста. Цель проекта — определить, насколько близки мы к созданию «экспертных систем ИИ». Хотя современные LLM успешно проходят многие стандартные тесты в математике и праве, существует вопрос, насколько эти результаты действительно значимы. Например, возможно, что модели уже заранее знакомы с ответами благодаря огромным объемам данных, на которых они обучаются, включая многие материалы из интернета.
ИИ, новости, технология