先前許多 AI 與娛樂遊戲的案例,多半為訓練單一 AI 進行遊戲,或是使 AI 與人類玩家對戰、對奕,但不少 AI 研究也在試圖研究讓 AI 進行合作的、甚至與人類玩家一起合作;而 Google 的 DeepMind 最近就公布他們的新進度,讓透過團體訓練的 AI 在雷神之錘 III 競技場的奪旗遊戲( Quake III Arena Capture the Flag )進行高水準的合作,還可與人類玩家一起合作。
這項遊戲是讓兩隊在地圖上進行搶奪與保護旗幟的遊戲,另一方面也可相互廝殺把對方玩家送回重生點,而賽制則選擇 5 分鐘一個回合;當然這類的 AI 培訓為了公平起見,不能讓 AI 直接使用遊戲的原始數據,要讓 AI 像是人類一樣以機器視覺的方式,為了讓 AI 比較容易識別地圖並進行遊戲, DeepMind 在不影響遊戲本直下使用修改過美術風格的場景。較傳統的 AI 培訓模式, DeepMind 的 AI 模型 For the Win 一口氣訓練多個 AI 玩家,並讓這些 AI 作為兩隊伍的成員捉對廝殺,目的就是使這些 AI 之間能夠相互合作,培訓的時間超過 45 萬場次以上。
為了驗證這套 AI 模型, DeepMind 舉辦一場 40 人的比賽,除了讓這些 AI 混入其中並隨機搭配,以純 AI 、純人類、人類玩家與人類的混合團隊進行對戰,而當由純 AI 組成的隊伍甚至有高達 74% 的高勝率,一般人類玩家構成的團隊的平均勝率約 52% ,而較強的人類玩家團隊勝率約 52% ,同時根據一起遊玩的玩家表示,這些 AI 甚至比人類玩家還要懂合作精神,但在混合人類與 AI 的團隊中, AI 越多,勝率反而降低。