首頁(yè)>要論>銳評(píng) 銳評(píng)
擊敗圍棋高手 人工智能仍沒(méi)人類(lèi)聰明
近日,人工智能又一次成為媒體和公眾關(guān)注的焦點(diǎn):谷歌旗下一家公司研制出的人工智能程序“阿爾法圍棋”(AlphaGo)在比賽中5:0完勝歐洲職業(yè)圍棋冠軍樊麾二段,在這種復(fù)雜度最高的棋類(lèi)游戲上,人工智能顯示出有望超越人類(lèi)頂尖高手的“智力”。今年3月,AlphaGo將挑戰(zhàn)世界冠軍李世石九段。 1997年,IBM開(kāi)發(fā)的計(jì)算機(jī)程序“更深的藍(lán)”在六局棋比賽中,擊敗國(guó)際象棋棋王卡斯帕羅夫,成為載入史冊(cè)的人工智能突破。然而,圍棋的復(fù)雜度遠(yuǎn)遠(yuǎn)高于國(guó)際象棋,前者最多有10的約170次方種局面,后者的最多局面僅為10的約47次方種。近年來(lái),人工智能有了什么發(fā)展,才有底氣與職業(yè)圍棋選手一較高下?它能否擊敗圍棋世界冠軍?如果擊敗,意味著什么?對(duì)于這些問(wèn)題,專(zhuān)家給予了解答。
深度學(xué)習(xí)“消化” 2000萬(wàn)局棋
復(fù)旦大學(xué)哲學(xué)學(xué)院教授、人工智能哲學(xué)專(zhuān)家徐英瑾介紹,傳統(tǒng)的計(jì)算機(jī)下棋程序的基本原理,是有限步數(shù)的搜索樹(shù),即采用數(shù)學(xué)和邏輯推理方法,把每一種可能的路徑都走一遍,從中選出最優(yōu)解。顯然,這種下棋思考方法是人類(lèi)無(wú)法做到的,發(fā)揮了計(jì)算機(jī)速度快、運(yùn)算量大的優(yōu)勢(shì)。不過(guò),這種“暴力算法”并不適用于圍棋。據(jù)計(jì)算,圍棋每回合有250種可能,一盤(pán)棋可長(zhǎng)達(dá)150回合,所以圍棋最多有10的170次方種局面。即便對(duì)計(jì)算機(jī)而言,這個(gè)運(yùn)算量也是相當(dāng)大的。除了復(fù)雜度高,圍棋還有一大特點(diǎn)——黑白兩方棋的每個(gè)棋子是一樣的,沒(méi)有大小之分、角色之別。這給計(jì)算機(jī)程序的運(yùn)算推理帶來(lái)了很大難度,因?yàn)閺恼軐W(xué)上看,圍棋具有“語(yǔ)境敏感性”,不太適合邏輯推理; 而棋子各不相同的中國(guó)象棋、國(guó)際象棋具有“超語(yǔ)境性”,每個(gè)棋子角色明確,不因棋局的變化而改變,非常適合邏輯推理,這正是計(jì)算機(jī)的強(qiáng)項(xiàng)。近年來(lái),不同于搜索樹(shù)的深度學(xué)習(xí)技術(shù)逐漸成熟,給圍棋程序的研發(fā)帶來(lái)了突破。深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò),其模仿對(duì)象是人腦。研究表明,人腦由約10的11次方個(gè)神經(jīng)元構(gòu)成,神經(jīng)元細(xì)胞的外表有很多突起。其中,比較短的放射性突起叫“樹(shù)突”,外形似樹(shù)枝分叉,具有接受刺激并將沖動(dòng)傳入細(xì)胞體的功能。而要把信息向其他神經(jīng)元輸送,就得依靠“軸突”。人工神經(jīng)網(wǎng)絡(luò)從信息處理角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行了抽象和模擬,建立運(yùn)算模型。這種網(wǎng)絡(luò)由大量模擬神經(jīng)元的節(jié)點(diǎn)相互連接構(gòu)成,每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù),稱(chēng)為激勵(lì)函數(shù)。每?jī)蓚€(gè)節(jié)點(diǎn)間的連接,都代表一個(gè)對(duì)于通過(guò)該連接信號(hào)的權(quán)重值,形成人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出則根據(jù)連接方式、權(quán)重值和激勵(lì)函數(shù)的不同而不同。 “深度學(xué)習(xí)系統(tǒng)是人工神經(jīng)網(wǎng)絡(luò)的升級(jí)版?!毙煊㈣忉屨f(shuō),這種系統(tǒng)由輸入層、中間層和輸出層構(gòu)成,其中,中間層由多層人工神經(jīng)網(wǎng)絡(luò)構(gòu)成,可多達(dá)七八十層,故名為“深度學(xué)習(xí)”。每增加一層,就意味著增加了一個(gè)人工智能分析維度。當(dāng)人把某種大數(shù)據(jù)樣本輸入系統(tǒng)后,這種系統(tǒng)即可進(jìn)行學(xué)習(xí),掌握樣本中蘊(yùn)含的規(guī)律。為了讓 Al-phaGo具有一流的圍棋水平,谷歌科研人員輸入了2000萬(wàn)局棋譜。假如一個(gè)人要學(xué)習(xí)2000萬(wàn)局棋,每局棋耗時(shí)15分鐘,他需要一刻不停地下570年!
戰(zhàn)勝?lài)迨澜绻谲娛沁t早的事
Facebook 專(zhuān)家也在研發(fā)圍棋程序,但谷歌走在了他們前面??戳斯雀鑼?zhuān)家近日以封面形式發(fā)表在《自然》上的論文后,F(xiàn)acebook人工智能組研究員田淵棟博士表示,從算法上說(shuō),這篇文章并沒(méi)有太多新意,主要是通過(guò)大量訓(xùn)練數(shù)據(jù),包括以往的棋譜和自我對(duì)局,把性能“堆”出來(lái)。谷歌團(tuán)隊(duì)訓(xùn)練了一個(gè)走子的神經(jīng)網(wǎng)絡(luò),又訓(xùn)練了一個(gè)可以評(píng)估局面的網(wǎng)絡(luò),然后在“蒙特卡羅樹(shù)搜索”中同時(shí)使用這兩個(gè)網(wǎng)絡(luò)。香港科技大學(xué)計(jì)算機(jī)科學(xué)碩士陳經(jīng)介紹,采用“蒙特卡羅樹(shù)搜索”這種算法,是圍棋程序在采用深度學(xué)習(xí)系統(tǒng)之前的一次突破。2010年左右,開(kāi)發(fā)者們引入“蒙特卡羅樹(shù)搜索”,其特點(diǎn)是模擬棋局一直到下完算子、判斷勝負(fù),模擬多次后,看哪個(gè)選點(diǎn)的獲勝概率最高。模擬時(shí),會(huì)利用“棋形”等經(jīng)驗(yàn)減少選點(diǎn),一直模擬下去直至終局。時(shí)間不夠或電腦計(jì)算能力不足,模擬的局面數(shù)就少,棋力就低。由此可見(jiàn),這是一種基于概率的“暴力搜索”算法。如今,AlphaGo將“暴力搜索”與“大數(shù)據(jù)+深度學(xué)習(xí)”結(jié)合在一起,取得了突破。經(jīng)過(guò)2000萬(wàn)局“自我對(duì)局”訓(xùn)練,它擁有了擊敗職業(yè)棋手的能力。“這個(gè)訓(xùn)練規(guī)模,我實(shí)在沒(méi)有想到過(guò),谷歌在這方面是很有優(yōu)勢(shì)的?!碧餃Y棟坦言,他們的“默認(rèn)策略”也是經(jīng)過(guò)處理的,能夠僅耗時(shí)2微秒就走一步,而且準(zhǔn)確率也不錯(cuò)??傊?,谷歌的做法充分利用了“大數(shù)據(jù)+深度學(xué)習(xí)”的優(yōu)勢(shì),而且?guī)缀跬耆从玫絿宓膶?zhuān)業(yè)知識(shí)。“若是以后棋力能再往上走,我也不會(huì)驚訝。” 不斷學(xué)習(xí)、不斷進(jìn)步的Al-phaGo,今年能否戰(zhàn)勝李世石?華東師范大學(xué)計(jì)算機(jī)系賀樑教授認(rèn)為,有這個(gè)可能,即使今年沒(méi)有戰(zhàn)勝,計(jì)算機(jī)程序擊敗圍棋世界冠軍也是遲早的事。這是因?yàn)?,?jì)算機(jī)的運(yùn)算速度比人腦快得多,能憑借“大數(shù)據(jù)+深度學(xué)習(xí)”在短期內(nèi)分析完一個(gè)人一生也無(wú)法窮盡的棋譜,棋力提升的速度和幅度會(huì)很驚人。
打造“通用人工智能” 需新算法
在不少人看來(lái),如果 Al-phaGo擊敗圍棋世界冠軍,意味著人類(lèi)將喪失在棋類(lèi)游戲中最后的尊嚴(yán)。對(duì)此,徐英瑾認(rèn)為大可不必妄自菲薄。從訓(xùn)練棋局?jǐn)?shù)量與圍棋水平的“投入/產(chǎn)出比”來(lái)看,人工智能還是沒(méi)有人類(lèi)圍棋高手聰明。要知道,Al-phaGo可是訓(xùn)練了2000萬(wàn)局棋后,才能戰(zhàn)勝職業(yè)圍棋二段選手。而一個(gè)人在成長(zhǎng)為職業(yè)九段高手前,訓(xùn)練的棋局?jǐn)?shù)量遠(yuǎn)小于2000萬(wàn)。從這個(gè)意義上說(shuō),人工智能程序的聰明程度遠(yuǎn)不如大多數(shù)人,盡管擁有了深度學(xué)習(xí)能力,但它戰(zhàn)勝人類(lèi)的主要原因仍和以前一樣:運(yùn)算速度快、不受生物屬性限制。因此,我們不必沮喪,而是要為人工智能技術(shù)的進(jìn)步感到欣喜。谷歌團(tuán)隊(duì)表示,他們打算利用研發(fā)AlphaGo過(guò)程中的技術(shù)來(lái)解決一些當(dāng)今社會(huì)的重要問(wèn)題,如醫(yī)學(xué)診斷、全球變暖。自然語(yǔ)言理解,也是人工智能研發(fā)的一個(gè)重點(diǎn)領(lǐng)域。目前,代表這一領(lǐng)域國(guó)際先進(jìn)水平的蘋(píng)果手機(jī)Siri,在與用戶(hù)對(duì)話(huà)時(shí),仍顯得較為幼稚,有時(shí)答非所問(wèn)。谷歌、Facebook、微軟、百度等許多知名互聯(lián)網(wǎng)企業(yè)都在投入重金,開(kāi)展研發(fā),以期在人機(jī)問(wèn)答領(lǐng)域取得突破。徐英瑾表示,AlphaGo擊敗圍棋高手,也許還稱(chēng)不上人工智能領(lǐng)域的重大突破。人工智能唯有能模仿“整全的人”,具備人類(lèi)思維的大多數(shù)功能,才是真正震撼人心的事件。他分析說(shuō),計(jì)算機(jī)程序的許多單項(xiàng)能力早已超越人類(lèi),即使是一個(gè)小小的計(jì)算器,其算數(shù)能力也非人類(lèi)可比。計(jì)算機(jī)程序如今成為圍棋高手,不過(guò)是增加了一種單項(xiàng)能力。與之相比,實(shí)現(xiàn)“通用人工智能”的難度高得多,要求一個(gè)人工智能系統(tǒng),可以像人一樣做很多事情:做算術(shù)、寫(xiě)文章、畫(huà)畫(huà)、下棋……這種系統(tǒng)能處理生活中紛繁復(fù)雜的情況,如果科學(xué)家能開(kāi)發(fā)出一套優(yōu)質(zhì)的家政服務(wù)系統(tǒng),能讓機(jī)器人獨(dú)立做各種家務(wù),那么它就基本可算作通用人工智能。賀樑和徐英瑾都認(rèn)為,“大數(shù)據(jù)+深度學(xué)習(xí)”技術(shù)并不能打造出通用人工智能系統(tǒng),科技界需要開(kāi)發(fā)出新的算法和技術(shù),更好地模擬人腦工作方式,才有望把人工智能推向新的高度。(俞陶然)
編輯:劉文俊
關(guān)鍵詞:人工智能 擊敗圍棋高手“阿爾法圍棋”