Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы
 
 
 
Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы
Global Look Press

Спустя 20 лет после того, как компьютерная программа DeepBlue победила чемпиона мира Гарри Каспарова, в шахматах грянула новая революция.

Алгоритму AlphaZero, разработанному Google и DeepMind, хватило всего четырех часов игры с самим собой, чтобы самостоятельно синтезировать шахматные знания человечества за полтора тысячелетия и достичь уровня, который не только превосходит людей, но и позволяет громить чемпионов среди компьютерных алгоритмов.

Все блестящие хитрости и утонченности, которые программисты использовали для создания шахматных движков, были отправлены на свалку истории, отмечает портал Chess24.com.

Нейросеть победила сильнейшую шахматную компьютерную программу Stockfish 8 в ста партиях, не проиграв ни одной. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Итого в ста играх нейросеть одержала 28 побед, сведя остальные 72 вничью.

Как утверждают разработчики, AlphaZero достигла этого уровня всего через четыре часа после того, как в нее были загружены только базовые правила игры в шахматы, без дополнительных сведений о тактике, алгоритмах и дебютах.

В отличие от традиционных шахматных программ, AlphaZero выбирает ход не за счет перебора возможных вариантов, а применяя собственные алгоритмы, выработанные при самообучении. Для сравнения: AlphaZero рассматривала 80 тысяч позиций за секунду, тогда как Stockfish - до 70 миллионов.

Ранее детище DeepMind потратило два часа на постижение сеги (японские шахматы) и за восемь часов научилась безупречной игре в го.

По мнению компании-разработчика, в будущем подобные нейро-алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов.