首頁>要聞>悅讀悅讀

為什么說AlphaGo的勝利是件驚天動地的大事？

2016年03月12日 09:49 | 來源：鳳凰科技

分享到：

“國際象棋和西洋棋與圍棋不同，它們不需要選手對棋局做復(fù)雜的形勢評估，”喬納森·謝弗(Jonathan Schaeffer)說道，他是加拿大阿爾伯塔大學(xué)的計算機(jī)科學(xué)家，此前他的Chinook程序曾戰(zhàn)勝過頂級的西洋棋選手。“在國際象棋和西洋棋中，只需簡單的啟發(fā)，你就知道下一步該怎么走，衡量各個棋子的價值是選手最重要的任務(wù)——如果在國際象棋中多一個車的棋子，那你已經(jīng)基本勝券在握了。但這些方式在圍棋中都行不通，從人類的角度來看，圍棋的棋路過于復(fù)雜，電腦很難學(xué)會。不過AlphaGo做到了，它擁有世界上首個有效的評估函數(shù)系統(tǒng)。

那么DeepMind是如何做到的呢？其實解決這個問題的關(guān)鍵是深度學(xué)習(xí)和類神經(jīng)網(wǎng)絡(luò)技術(shù)，有了它們，研究人員就能教AlphaGo下棋。就像Google Photos能幫你從無數(shù)圖片中找出貓咪一樣，其背后是該應(yīng)用對超大量級的貓咪圖片做分析后的結(jié)果，這些分析處理甚至細(xì)化到了像素級別。而AlphaGo能有如此成績，則得益于對數(shù)百萬項圍棋數(shù)據(jù)的學(xué)習(xí)，包括各種棋路和棋手的比賽。

眼下，AlphaGo還在不斷學(xué)習(xí)，其能力也在不斷增強(qiáng)。起初，它還是靠學(xué)習(xí)套路（策略網(wǎng)絡(luò)）來預(yù)測對手的落子方式，不過隨著價值網(wǎng)絡(luò)訓(xùn)練的深入，AlphaGo已經(jīng)有了那么點“直覺”，它可以分析出比賽的態(tài)勢了。在棋局中，AlphaGo已經(jīng)可以通過快速對各種可能性做分析，提前考慮后面幾步的落子和排兵布陣了。其實AlphaGo擁有的各項技術(shù)都是相互輔助的，類神經(jīng)網(wǎng)絡(luò)可以降低電腦的負(fù)載，提高工作效率；套路學(xué)習(xí)則可以減小其搜索范圍，而價值網(wǎng)絡(luò)則可讓它從每次的比賽中總結(jié)出自己的經(jīng)驗。

AlphaGo擁有自己的“思考”能力

這一增強(qiáng)版的學(xué)習(xí)系統(tǒng)讓AlphaGo變得更像人類，而不是靠驚人計算能力戰(zhàn)勝國際象棋大師的IBM深藍(lán)電腦，畢竟圍棋和國際象棋在復(fù)雜程度上不屬于一個量級，用深藍(lán)電腦的方法是無法在圍棋上戰(zhàn)勝人類的。在五場比賽的間歇，DeepMind都不會對AlphaGo做調(diào)整，因此電腦只能靠自己來學(xué)習(xí)，但每天一場比賽的量確實有些少。此外，DeepMind公司創(chuàng)始人杰米斯?哈薩比斯（Demis Hassabis）稱AlphaGo的計算能力在去年十月的比賽后一直都沒有得到增強(qiáng)，因此現(xiàn)在它的能力已經(jīng)達(dá)到現(xiàn)有硬件條件下的頂峰。

編輯：薛曉鈺

01 02 03 04

關(guān)鍵詞：AlphaGo 李世石尾氣