Google DeepMind 在雷神之槌 III 展現 AI 的合作能力,甚至比人類玩家更懂合作精神

2018.07.04 07:11PM
Product design, Multimedia, Study skills, Brand, Product, Research, Scientist, United Kingdom, Intelligence, Agent observation raw pixelsBlue 1118Red 1Blue 2Red 2Indoor map overviewo 118o 118, Agent, observation, raw, pixels, Blue, 118, Red, Blue, Red, Indoor, map, overview, 118, 118, product, technology, multimedia, product, angle, media, presentation, brand, Agent observation raw pixelsBlue 1118Red 1Blue 2Red 2Indoor map overviewo 118o 118, Man Group, 產品設計,多媒體,學習技巧,品牌,產品,研究,科學家,英國,情報,代理觀察原始像素藍1118紅寶石2Red 2室內地圖overviewo 118o 118,代理,觀察,原始,像素,藍色,118,紅色,藍色,紅色,室內,地圖,概述,118,118,產品,技術,多媒體,產品,角度,媒體,演示文稿,品牌,代理觀察原始像素藍1118紅色1Blue 2Red 2室內地圖overviewo 118o 118,Man Group

先前許多 AI 與娛樂遊戲的案例,多半為訓練單一 AI 進行遊戲,或是使 AI 與人類玩家對戰、對奕,但不少 AI 研究也在試圖研究讓 AI 進行合作的、甚至與人類玩家一起合作;而 Google 的 DeepMind 最近就公布他們的新進度,讓透過團體訓練的 AI 在雷神之錘 III 競技場的奪旗遊戲( Quake III Arena Capture the Flag )進行高水準的合作,還可與人類玩家一起合作。

這項遊戲是讓兩隊在地圖上進行搶奪與保護旗幟的遊戲,另一方面也可相互廝殺把對方玩家送回重生點,而賽制則選擇 5 分鐘一個回合;當然這類的 AI 培訓為了公平起見,不能讓 AI 直接使用遊戲的原始數據,要讓 AI 像是人類一樣以機器視覺的方式,為了讓 AI 比較容易識別地圖並進行遊戲, DeepMind 在不影響遊戲本直下使用修改過美術風格的場景。較傳統的 AI 培訓模式, DeepMind 的 AI 模型 For the Win 一口氣訓練多個 AI 玩家,並讓這些 AI 作為兩隊伍的成員捉對廝殺,目的就是使這些 AI 之間能夠相互合作,培訓的時間超過 45 萬場次以上。

為了驗證這套 AI 模型, DeepMind 舉辦一場 40 人的比賽,除了讓這些 AI 混入其中並隨機搭配,以純 AI 、純人類、人類玩家與人類的混合團隊進行對戰,而當由純 AI 組成的隊伍甚至有高達 74% 的高勝率,一般人類玩家構成的團隊的平均勝率約 52% ,而較強的人類玩家團隊勝率約 52% ,同時根據一起遊玩的玩家表示,這些 AI 甚至比人類玩家還要懂合作精神,但在混合人類與 AI 的團隊中, AI 越多,勝率反而降低。

新聞與圖片來源: DeepMind , The Verge