星際爭霸2將成人工智能學習研y5遊戲平台究對象

年初,Google的阿爾法狗(AlphaGo)震驚了全世界, 關于人工智能的討論也來到了頂峰,擊敗最優秀的人類棋手,這個充滿了傳奇色彩的事件其實讓很多人高估了人工智能的威力。在那之后,就有很多消息稱,阿爾法狗接下來要挑戰《星際爭霸2》,人工智能戰勝職業選手指日可待。

今年3月,很多中國媒體更是報道,在WCS中國站決賽上,暴雪娛樂制作總監Tim Morten親自確認,AlphaGo確認將挑戰《星際爭霸2》。

這個新聞有兩個疑點第一,幾乎沒有國外媒體以AlphaGo挑戰《星際爭霸2》為標題進行報道;第二,AlphaGo的名字也顯示了,這只是DeepMind為圍棋項目(英文Go)專門訓練的人工智能項目,如果挑戰星際,應該不會是這個名字。更準確的是當時《財富》的報道DeepMind的CEO,Demis Hassabis表示,《星際爭霸》是一個考慮中的有趣的挑戰。

現在,DeepMind和星際的緋聞終于可以落實了。DeepMind的工程師Oriol Vinyals在公司博客宣布,暴雪將和DeepMind展開合作,讓《星際爭霸2》成為人工智能和機器學習的研究環境,并在明年第一季度將這個環境開放給所有的人工智能研究者。也就是說,即使是DeepMindmmorpg 手遊的人工智能,也剛開始學習《星際爭霸2》。

Oriol Vinyals少年時期曾是西班牙的頂級《星際爭霸》玩家,他坦誠,要打敗人類職業選手,我們還有很長的路要走。

和回合制的圍棋不同,《星際爭霸》是即時戰略類游戲,游戲中,玩家需要從三個種族之中選擇一個進行游戲,而每個種族都有不同的優缺點。針對不同的情況快速反應,同時有對戰局的長期規劃,這對人工智能程序來說是個非常艱巨的挑戰。

在和李世石對弈時,AlphaGo借鑒了蒙特卡洛樹搜索算法,評估下一步的可能最優解(可以排除一些對自己不那么有利的可能),以減少搜索深度。即便如此,擁有超強計算能力的Alpha最新線上遊戲G遊戲平台安全性評估o落子前,還是需要很長的思考時間。

另外,和圍棋不同,在《星際爭霸》中,人工智能能獲取的對手的信息是有限的(比如游戲中未探索地區的戰爭迷霧,其中的情況對手是看不到的)2024推薦手遊

你可能想到了《星際爭霸》中自帶的AI,也就是電腦玩家。它的工作機制其實和現在的人工智能完全不同,因為游戲里的AI 是直接從游戲代碼中獲取信息的,而且,它可以同時對所有單位下達指令,即使有些單位不在屏幕中。和人類玩家相比,它其實是在作弊。

DeepMind和暴雪的目標是訓練出遵守規則,同時可以和人類玩家一較高下的AI系統。

所以,DeepMind將和暴雪合作改進游戲環境,新的游戲界面將《遊戲電腦星際爭霸2》的游戲畫面簡化成基本的視覺圖形(如下圖),以供機器學習系統更好地學習,當然,這也就意味著,人工智能系統是以視覺而不是直接讀取游戲數據為基礎進行決策的,這和人類玩家完全一樣。

另外,暴雪還會提供游戲回放,以供人工智能系統學習。

暴雪和DeepMind 都明白,讓人工智能擊敗頂級的職業電競玩家還非常遙遠,不過就像AlphaGo 在很多人都不看好的情況下完勝李世石,這一天很可能會比大家想象中的早來一些。當然,DeepMind的終極目標是解決現實生活中的問題,而相比圍棋,《星際爭霸2》是一個和現實世界更接近的環境。