在世界規(guī)模最大電子競技賽事之一Dota2國際邀請賽上,埃隆·馬斯克的非營利人工智能公司OpenAI機(jī)器人在Dota2一對一比賽中壓倒性擊敗了人類頂級職業(yè)玩家Dendi。
對于這一戰(zhàn)果埃隆·馬斯克也表現(xiàn)得頗為自信,第一時(shí)間在個(gè)人社交平臺上表示,“OpenAI第一次打敗了世界上頂級電競選手,這比圍棋難多了?!钡拇_在兩者的交鋒過程中,OpenAI機(jī)器人只用了不到10分鐘就將人類頂級玩家打敗,拿下第一局,如此強(qiáng)勢的技術(shù)使得Dendi在第二局對戰(zhàn)中退出并拒絕再戰(zhàn)第三局。
一時(shí)間AI攻陷電競言論四起,OpenAI也被神化得不可一世?!斑@是一個(gè)令人印象深刻的成就,但并不是一次AI上的突破?!惫雀璐竽X團(tuán)隊(duì)前成員DennyBritz發(fā)表評論回應(yīng)這一事件,“事實(shí)上,過度炒作人工智能的進(jìn)步才是真正危險(xiǎn)的事情?!?
一方面從比賽形式來看,OpenAI參與的是更加簡單的1V1模式,在這種模式下沒有配合一說,且大部分情況下都是正面對抗了解對手的狀態(tài)。“非完美博弈問題在其中并不嚴(yán)重,1V1的執(zhí)行路徑和狀態(tài)空間也小了很多。九游娛樂-官方網(wǎng)站首頁”第四范式資深機(jī)器學(xué)習(xí)架構(gòu)師涂威威指出。
Facebook人工智能組研究員田淵棟在知乎上也表示,一對一相對容易,線的游戲是一個(gè)更有挑戰(zhàn)性的問題。5V5是一個(gè)多智能體的問題,需要通過智能體之間的配合才能獲取勝利,是一個(gè)非完美信息博弈的問題,由于游戲里面的“戰(zhàn)爭迷霧”,玩家不能知道游戲的全部信息,有非常龐大的狀態(tài)空間,需要非常長的執(zhí)行路徑才能獲得游戲結(jié)果。
事實(shí)上,OpenAI也希望在明年《Dota2》賽期,可以用5V5的方式再次上臺挑戰(zhàn),但5V5狀態(tài)AI戰(zhàn)勝人類的難度遠(yuǎn)遠(yuǎn)大于1V1,也大于圍棋難度。與馬斯克觀點(diǎn)不同,涂威威認(rèn)為,OpenAI擊敗電競和圍棋人機(jī)大戰(zhàn)是不可比的,這是兩種不一樣的任務(wù)。
目前AI技術(shù)很難在兩個(gè)或兩個(gè)以上的任務(wù)上工作得很好,AlphaGo是為19×19的圍棋任務(wù)設(shè)計(jì)的,同樣版本的AlphaGo目前甚至不能同時(shí)在19*19和20*20的棋盤上很好地工作。目前AlphaGo和OpenAI也不能交換彼此的任務(wù),也就是說這些人工智能技術(shù)目前不具備遷移能力。
涂威威認(rèn)為,Dota25V5游戲難度要遠(yuǎn)遠(yuǎn)大于圍棋的難度?!癉ota25V5是多智能體的協(xié)作游戲,而圍棋只是1V1的游戲;前者的狀態(tài)數(shù)遠(yuǎn)遠(yuǎn)大于圍棋的狀態(tài)數(shù),且是非完美信息博弈,而圍棋是完美信息博弈。Dota25V5需要更長期的策略,往往要在成千上萬次操作之后才能獲得成果。在技術(shù)貢獻(xiàn)和社會意義上,目前OpenAI的機(jī)器人還不能和AlphaGo相提并論?!?
同時(shí)在英雄選擇上OpenAI選擇了影魔,該英雄本身沒有控制技能,九游娛樂-官方網(wǎng)站首頁更多需要的是選手對距離細(xì)節(jié)等精準(zhǔn)判斷和細(xì)微操作。涂威威表示:“這恰恰是人類不擅長,機(jī)器擅長的,人類選手solo慣用影魔英雄是因?yàn)槿祟惒簧瞄L這樣的事情,這樣的英雄solo玩好了才能更容易地體現(xiàn)與其他玩家的差距。所以即便OpenAI在1V1上贏得了人類,離解決5V5的問題也很遙遠(yuǎn)?!?
OpenAI的“不成熟”也在隨后被驗(yàn)證,比賽結(jié)束后已經(jīng)有50多名玩家擊敗了這個(gè)被神化的AI,例如一些玩家通過勾引地方小兵背離正常路線,讓對方的AI陷入判斷追殺你還是守塔的猶豫狀態(tài),進(jìn)而贏得比賽。“Dota中的AI缺乏戰(zhàn)略層面的東西,攻擊、偵查、協(xié)助等決策。”竹間智能機(jī)器學(xué)習(xí)科學(xué)家王璈說道。
事實(shí)上對電競感興趣的并非OpenAI一家,在烏鎮(zhèn)圍棋峰會上,DeepMindCEO哈薩比斯就表示,星際爭霸將成為AI進(jìn)步的下一個(gè)大考驗(yàn)。隨后DeepMind與暴雪在《星際爭霸2》上展開研究實(shí)驗(yàn),并于近日開源了該訓(xùn)練平臺,同時(shí)這款游戲也吸引了Facebook和阿里巴巴的人工智能團(tuán)隊(duì)加入。
這款即時(shí)戰(zhàn)略游戲環(huán)境復(fù)雜多變,考驗(yàn)AI對大量環(huán)境信息空間、時(shí)間和數(shù)據(jù)變化的理解能力。同時(shí)又考驗(yàn)協(xié)作性,即混戰(zhàn)下對多個(gè)單位、建筑、編隊(duì)的協(xié)同運(yùn)作能力,需要玩家做出高級戰(zhàn)略決策,這也是這些巨頭將《星際爭霸2》作為訓(xùn)練目標(biāo)的原因。
雖然目前已經(jīng)提取了上千場比賽近百萬的比賽錄像訓(xùn)練AI程序,但暴雪方面表示,該AI尚處于初級階段,一些預(yù)判戰(zhàn)術(shù)和協(xié)作能力只能在小地圖中完成,且花費(fèi)大量的運(yùn)算時(shí)間才能進(jìn)行下一步。
對當(dāng)下的電競產(chǎn)業(yè)而言,AI更為直接且現(xiàn)實(shí)的意義則為“代練”功能。弗若斯特沙利文全球合伙人兼大中華區(qū)總裁王昕認(rèn)為:“一方面AI可以學(xué)習(xí)他人的比賽經(jīng)驗(yàn),培養(yǎng)新手玩家,另一方面電競教學(xué)也需要大量實(shí)戰(zhàn),AI與人類玩家相比,不會受情緒、時(shí)間影響,反應(yīng)速度也更快?!痹诒荣惤Y(jié)束后,Dendi表示在看回放的過程中學(xué)到了一些內(nèi)容。
但巨頭開發(fā)人工智能的意義遠(yuǎn)不是下棋或者打游戲,而是為了更好地將AI應(yīng)用到現(xiàn)實(shí)決策。在不完美且復(fù)雜信息情況下,如何做出預(yù)測和判斷,將決策所帶來的價(jià)值最大化,是AI發(fā)展的關(guān)鍵。
在此前德?lián)淙藱C(jī)大戰(zhàn)中,創(chuàng)新工場創(chuàng)始人李開復(fù)也曾向第一財(cái)經(jīng)闡述“不完整信息”下人工智能的現(xiàn)實(shí)意義,“世界上大部分信息還不是公開的,面臨不完全或者誤導(dǎo)信息時(shí)的推理能力,未來能夠解決在決策、外交、商務(wù)合作、談判方面的不確定性,成為人類的‘參謀’?!?