Искусственный интеллект AlphaGo от DeepMind, принадлежащей Alphabet, без проблем одолел лучших игроков мира в настольную игру го. Теперь же компания представила ещё более продвинутый ИИ под названием MuZero. В отличие от своих предшественников, он способен вырабатывать эффективную стратегию, не зная правил игры, и демонстрировать при этом лучшие результаты за всю историю.
Сообщается, что новый ИИ умеет эффективно выстраивать стратегию поведения в крайне вариативных ситуациях без предварительной подготовки и изучения правил игры. MuZero не только лучше справляется с го и шахматами, но и освоил набор классических игр Atari.
Суть нового алгоритма в адаптивной стратегии, позволяющей найти эффективные решения для победы. По словам исследователей, в чём-то программа похожа на человека: она принимает решения на основе трёх состояний — прошлого опыта, текущей диспозиции и приоритета, который позволит с наибольшей вероятностью выиграть матч.
Чем больше времени MuZero получает на выбор действия, тем лучше результат. Между тем даже после ввода ограничения на количество симуляций в игре Pac-Man ИИ смог добиться хороших показателей. Представители Alphabet заявляют, что возможности MuZero однажды могут помочь в решении сложных проблем в таких областях, как робототехника, где нет простых правил.