首頁>要聞>悅讀 悅讀
為什么說AlphaGo的勝利是件驚天動地的大事?
“國際象棋和西洋棋與圍棋不同,它們不需要選手對棋局做復(fù)雜的形勢評估,”喬納森·謝弗(Jonathan Schaeffer)說道,他是加拿大阿爾伯塔大學(xué)的計算機(jī)科學(xué)家,此前他的Chinook程序曾戰(zhàn)勝過頂級的西洋棋選手。“在國際象棋和西洋棋中,只需簡單的啟發(fā),你就知道下一步該怎么走,衡量各個棋子的價值是選手最重要的任務(wù)——如果在國際象棋中多一個車的棋子,那你已經(jīng)基本勝券在握了。但這些方式在圍棋中都行不通,從人類的角度來看,圍棋的棋路過于復(fù)雜,電腦很難學(xué)會。不過AlphaGo做到了,它擁有世界上首個有效的評估函數(shù)系統(tǒng)。
那么DeepMind是如何做到的呢?其實解決這個問題的關(guān)鍵是深度學(xué)習(xí)和類神經(jīng)網(wǎng)絡(luò)技術(shù),有了它們,研究人員就能教AlphaGo下棋。就像Google Photos能幫你從無數(shù)圖片中找出貓咪一樣,其背后是該應(yīng)用對超大量級的貓咪圖片做分析后的結(jié)果,這些分析處理甚至細(xì)化到了像素級別。而AlphaGo能有如此成績,則得益于對數(shù)百萬項圍棋數(shù)據(jù)的學(xué)習(xí),包括各種棋路和棋手的比賽。
眼下,AlphaGo還在不斷學(xué)習(xí),其能力也在不斷增強(qiáng)。起初,它還是靠學(xué)習(xí)套路(策略網(wǎng)絡(luò))來預(yù)測對手的落子方式,不過隨著價值網(wǎng)絡(luò)訓(xùn)練的深入,AlphaGo已經(jīng)有了那么點“直覺”,它可以分析出比賽的態(tài)勢了。在棋局中,AlphaGo已經(jīng)可以通過快速對各種可能性做分析,提前考慮后面幾步的落子和排兵布陣了。其實AlphaGo擁有的各項技術(shù)都是相互輔助的,類神經(jīng)網(wǎng)絡(luò)可以降低電腦的負(fù)載,提高工作效率;套路學(xué)習(xí)則可以減小其搜索范圍,而價值網(wǎng)絡(luò)則可讓它從每次的比賽中總結(jié)出自己的經(jīng)驗。
AlphaGo擁有自己的“思考”能力
這一增強(qiáng)版的學(xué)習(xí)系統(tǒng)讓AlphaGo變得更像人類,而不是靠驚人計算能力戰(zhàn)勝國際象棋大師的IBM深藍(lán)電腦,畢竟圍棋和國際象棋在復(fù)雜程度上不屬于一個量級,用深藍(lán)電腦的方法是無法在圍棋上戰(zhàn)勝人類的。在五場比賽的間歇,DeepMind都不會對AlphaGo做調(diào)整,因此電腦只能靠自己來學(xué)習(xí),但每天一場比賽的量確實有些少。此外,DeepMind公司創(chuàng)始人杰米斯?哈薩比斯(Demis Hassabis)稱AlphaGo的計算能力在去年十月的比賽后一直都沒有得到增強(qiáng),因此現(xiàn)在它的能力已經(jīng)達(dá)到現(xiàn)有硬件條件下的頂峰。
編輯:薛曉鈺
關(guān)鍵詞:AlphaGo 李世石 尾氣