Краткий обзор 100-дневного спринта Google в области ИИ: Как Gemini стал конкурентом ChatGPT
Mar 22, 2025
Учёные в области ИИ получили Премию Тюринга за метод, позволивший AlphaGo победить в шахматы
Учёные Эндрю Г. Барто и Ричард С. Саттон были удостоены Премии Тюринга от Ассоциации вычислительной техники за их вклад в развитие обучения с подкреплением. Этот метод, предложенный задолго до его широкого применения в ИИ, позволяет компьютерам делать выбор на основе случайных действий, получая вознаграждения или наказания за каждый ход.
Применение в ИИ
Метод обучения с подкреплением стал основой для программ, таких как AlphaZero от Google DeepMind, которая в 2016 году достигла мастерства в шахматах, сёги и го. Он также вдохновил AlphaStar, обеспечивший «гроссмейстерскую» игру в Starcraft II.
Важность исследования
Барто и Саттон создали теоретическую базу и ключевые алгоритмы для этого подхода, который считается одним из самых эффективных для создания интеллектуальных систем.
ИИ, награда, технология