Принадлежащая Google компания DeepMind стала широко известна после того, как созданный ею алгоритм AlphaGo без особого труда победил сильнейших в мире игроков в го Ли Седоля и Кэ Цзе, однако основной целью компании являлось и является создание алгоритма, способного самостоятельно обучаться и выполнять широкий спектр задач.
Как пишет The Verge, DeepMind, по всей видимости, приблизилась к достижению этой цели, создав более продвинутого наследника AlphaGo. Новая программа, получившая название AlphaZero, всего за восемь часов освоила го, после чего обыграла AlphaGo. Затем новый алгоритм потратил четыре часа на обучение шахматам и одержал верх над лучшей в мире шахматной программой Stockfish. Наконец, AlphaZero за пару часов научилась играть в сёги (японская настольная игра, напоминающая шахматы), а затем победила программу Elmo, которая считается одной из лучших в этой игре.
Особенность AlphaZero заключается в том, что изначально алгоритм не создавался для настольных игр. Во всех трех случаях в программу загружали только правила игры без дополнительных сведений о стратегиях и тактиках. Затем AlphaZero играла сама с собой, постепенно достигая уровня лучших существующих программ, которые превосходят возможности людей. Как поясняют разработчики, AlphaZero обучалась с подкреплением (этот метод машинного обучения подразумевает, что испытуемая система находится в некоторой среде, о которой у нее нет сведений, но в которой она может совершать определенные действия.
В октябре DeepMind продемонстрировала промежуточную версию своего искусственного интеллекта, которая называлась AlphaGo Zero. Тогда глава компании Демис Хассабис отметил, что в будущем подобные алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов. Впрочем, The Verge отмечает, что до появления столь продвинутых программ потребуется еще немало времени.