遊戲-中華看點

AI挑戰《寶可夢》:耗時7千小時通關首個道館

2023-10-24 13:47:59

近日,國外一名程序員Peter Whidden進行了一項創新實驗,目標是訓練人工智能(AI)學會如何玩《寶可夢 火紅》這款遊戲。Whidden通過與遊戲模擬器的交互,將AI模型與遊戲連接起來,並設置了每個學習會話為兩小時。為了提升效率,他采用了加速技術,使得AI在短短六分鍾左右就能完成一個會話。此外,他還同時運行了40個會話,以此來加速AI的學習進程。

AI耗時7千小時通關《寶可夢》首個道館

為了引導AI如何進行遊戲,Whidden設定了一係列的獎勵目標,當AI探索到遊戲中的新內容時,就能獲得獎勵分數。這一機製是基於屏幕像素點的變化來觸發的。但這也帶來了一些問題,比如AI會在有動畫效果的水麵前停下來,長時間觀看,因為這會帶來獎勵分數。

AI耗時7千小時通關《寶可夢》首個道館

為了防止AI放棄戰鬥或捕捉寶可夢,Whidden又引入了與寶可夢等級相關的獎勵機製。然而,這個係統也有其不足之處,當AI在寶可夢中心存放或替換寶可夢時,會導致獎勵分數下降。這使得AI在隨後的遊戲中完全避開了寶可夢中心,導致隊伍無法得到恢複,因此Whidden不得不再次調整獎勵係統。

盡管AI在模擬人類行為方麵還有不足,但它也表現出了一些深奧且高效的行動。Whidden發現,AI走的一些具體而奇怪的路徑實際上是為了確保用一個精靈球就能捕捉到野生寶可夢,這並非毫無意義的行動。

AI耗時7千小時通關《寶可夢》首個道館

AI在花費了近7000個小時後成功擊敗了第一個道館。然而,它在月見山卻迷路了許久,即便是在經過5萬小時的訓練後,也沒能找到第二個道館。盡管如此,AI在遊戲中也展現了許多神奇且有趣的操作。例如,AI非常喜歡購買鯉魚王,累計購買次數超過了1萬次。另外,在野外成功捕捉到小拉達時,AI還將其命名為“AI”。

相關閱讀

熱點新聞