Atari 經典遊戲是近年基於深度學習的 AI 常常拿來進行練兵的練習項目,像是當初 AlphaGo 前身還未正式開始挑戰圍棋前,也在 Atari 進行多款遊戲的訓練與挑戰;而微軟今年所收購的 Maluuba 所開發的人工智慧 最近挑戰 Atari 2600 上的小精靈系列遊戲 Ms. Pac-Man ,直接得到破台的 999,990 分,刷新由 Abdner Ashman 在大型電玩版本所創下 933,580 分的驚人得分紀錄。
這套系統使用了稱為 Hybrid Reward Architecture 的架構,以 150 個獨立進行分析的分身運作,一部份的分身負責進行吃遊戲中的家分豆子的決策,另一部分則負責判斷遊戲中鬼魂移動的推測,同時系統中還有一個負責做為決策的最高權限的管理分身,負責從其餘所有分身所提出的決策中決定小精靈的下一部移動方針。這樣的概念是一種專業分工的概念,利用大量的分身提出不同的意見,幾個分身就有機會找出其他分身所未見的盲點,藉此達到更正確的路線。
至於選擇 Atari 2600 平台的 Ms. Pac-Man 作為挑戰目標,是因為此版本相較大型電玩版的 Ms Pac-Man 刻意增加遊戲的不可預測性,所以要找尋規律拿高分就相對更困難,畢竟目前 Atari 2600 版本最高分僅有 266,330 分,遠低於大型電玩版本紀錄,由於更複雜的不可預測性,也有助於作為人工智慧於判斷非預測性內容的研究。