close

大數據文摘轉載自學術頭條
對棋類遊戲的掌握程度,一直是判斷人工智能(AI)是否真正智能的依據之一,因為這類遊戲可以被用來評估 AI 代理在受控環境下自主開發和執行策略的能力。如今,AI 在此前尚未掌握的經典棋類遊戲 Stratego(西洋陸軍棋)中,表現出了人類專家級一般的水準——以 97%的最低勝率擊敗了其他 AI 機器人;在 Gravon 平台上與人類專業玩家對弈,取得了 84%的總勝率,在年初至今和歷史排行榜上都排在前三名。值得注意的是,這一驚人表現是在沒有部署任何搜索方法的情況下實現的,這是 AI 之前在棋類遊戲中取得多個裡程碑式成就的關鍵。相關研究論文以「Mastering the game of Stratego with model-free multiagent reinforcement learning」為題,已發表在權威科學期刊 Science 上。多年來,Stratego 一直是人工智能行業的下一個前沿領域之一。Stratego 玩家既需要有像玩國際象棋一樣的長期戰略性思考,也需要能夠像打撲克一樣處理不完全的信息。不完全信息,意味着參與人在進行博弈時不清楚博弈中的某些要素。例如,在橋牌遊戲中,玩家並不清楚其他玩家手中的牌,在拍賣會中,競拍人並不清楚其他競拍人對物品的估價。這個名為「DeepNash」的 AI 代理出自 DeepMind,在他們看來,這代表了一個非凡的成果;同樣,Stratego 社區也認為,這用現有技術是不可能實現的。Stratego 誕生於 1947 年,與中國陸軍棋不同,其軍銜、棋子數量較多,棋盤設計較為簡單,沒有鐵路、行營,也沒有裁判,當兩方棋子相遇後,才會揭開來判斷大小。二者的相同之處,都是以奪得對方軍旗或消滅所有可移動的棋子為勝利標誌。在 Stratego 中,雙方各有代表元帥(Marshal)、將軍(General)、上校(Colonel)、中校(Major)、上尉(Captain)、中尉(Lieutenant)、士官(Sergeant)、除雷兵(Miner)、斥侯(Scout)、間諜(Spy)、地雷(Bomb)、軍旗(Flag)的棋子。
具體遊戲規則為:兩方將所有己棋豎立、以正面朝後的方式排布,然後輪流移動一枚己棋;可以將棋子沿縱橫方向移動一格至空格或敵棋處,但需要維持正面朝後;如果一方棋子到達敵棋處,便將兩棋公開,一般勝方這一棋子會被放回原位且正面繼續朝後,輸方這一棋子則被移除遊戲。
全站熱搜