ИИ

Учёные в области ИИ получили Премию Тюринга за метод, позволивший AlphaGo победить в шахматы

Published March 5, 2025

Учёные Эндрю Г. Барто и Ричард С. Саттон были удостоены Премии Тюринга от Ассоциации вычислительной техники за их вклад в развитие обучения с подкреплением. Этот метод, предложенный задолго до его широкого применения в ИИ, позволяет компьютерам делать выбор на основе случайных действий, получая вознаграждения или наказания за каждый ход.

Применение в ИИ

Метод обучения с подкреплением стал основой для программ, таких как AlphaZero от Google DeepMind, которая в 2016 году достигла мастерства в шахматах, сёги и го. Он также вдохновил AlphaStar, обеспечивший «гроссмейстерскую» игру в Starcraft II.

Важность исследования

Барто и Саттон создали теоретическую базу и ключевые алгоритмы для этого подхода, который считается одним из самых эффективных для создания интеллектуальных систем.

ИИ, награда, технология