AI的圍棋怎么學(xué)
AI的圍棋怎么學(xué)
AI的圍棋深度學(xué)習(xí)能力再強(qiáng) 也與人腦相去甚遠(yuǎn)。下面學(xué)習(xí)啦小編給你介紹AI的圍棋學(xué)習(xí),歡迎閱讀。
AI的圍棋怎么學(xué)
深度學(xué)習(xí)背后是由數(shù)學(xué)模型支撐,所以人工智能的本質(zhì)仍只是解決問題的算法。
近日,人工智能在學(xué)習(xí)能力方面又有了一個(gè)較大的提升。斯坦福大學(xué)的一個(gè)研究小組發(fā)現(xiàn),人工智能系統(tǒng)已經(jīng)擁有了通過人類當(dāng)前所做的動(dòng)作預(yù)測其下一步舉動(dòng)的能力,而這一能力主要是通過人工智能對(duì)于故事的學(xué)習(xí)形成的。
研究人員將該系統(tǒng)與儲(chǔ)存了60多萬個(gè)故事的寫作社區(qū)Wattpad相連,這些故事包括主人公在進(jìn)入房間后需要開燈、被稱贊后會(huì)害羞、開會(huì)時(shí)就不會(huì)接電話等。人工智能則通過學(xué)習(xí)這些故事來實(shí)現(xiàn)預(yù)測人類舉動(dòng)的能力。
人工智能的主要目標(biāo)是使機(jī)器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。因此,深度學(xué)習(xí)的能力在其中顯的尤為重要。隨著技術(shù)的發(fā)展和人工智能的進(jìn)步,其深度學(xué)習(xí)能力也有了一個(gè)飛速的提升。
但是,深度學(xué)習(xí)的背后是由數(shù)學(xué)模型在支撐的,所以人工智能的本質(zhì)仍只是解決問題的算法。與真正的人類大腦相比,人工智能仍然相去甚遠(yuǎn)。
一、與圍棋大師一較高下,人工智能深度學(xué)習(xí)能力提升
在對(duì)上述人工智能的首次現(xiàn)場測試中,其能夠正確區(qū)分人與物體的概率高達(dá)91%,能準(zhǔn)確預(yù)測出人們下一步舉動(dòng)的概率為71%,這一成績與以往相比是很優(yōu)秀的。
而人工智能再次受到關(guān)注,則是由于即將到來的圍棋名將與人工智能系統(tǒng)的一場大戰(zhàn)。據(jù)外媒報(bào)道,3月9日,韓國圍棋名將李世石將在首爾接受來自谷歌(微博)的人工智能系統(tǒng)AlphaGo的挑戰(zhàn)。
而這場即將開始的圍棋比賽是十分重要的,甚至被認(rèn)為可以與1997年國際象棋大師卡斯帕羅夫與IBM超級(jí)計(jì)算機(jī)“深藍(lán)”之間的對(duì)決比肩。
1997年5月3日至5月11日,時(shí)年34歲的卡斯帕羅夫與IBM公司的國際象棋電腦“深藍(lán)”舉行了六局對(duì)抗賽。在前五局以2.5比2.5打平的情況下,第六局僅走了19步就使卡斯帕羅夫認(rèn)輸。“深藍(lán)”取得勝利,標(biāo)志著計(jì)算機(jī)技術(shù)的發(fā)展又上了一個(gè)臺(tái)階,也成為了科技史中的里程碑事件。
而此次人工智能系統(tǒng)AlphaGo與圍棋大師一較高下,則有著更加重要的意義。
圍棋是擁有2500多年歷史的、凝聚著中國古老智慧的游戲,從數(shù)學(xué)范疇來看,圍棋的復(fù)雜程度要比象棋高出N個(gè)級(jí)別,是世界公認(rèn)的最為困難的棋類游戲。
為了使AlphaGo能夠更好地應(yīng)對(duì)這種復(fù)雜的游戲,谷歌DeepMind團(tuán)隊(duì)的人工智能專家們做出了許多努力。
首先,他們往AlphaGo中輸入了包括3000萬步走法在內(nèi)的棋譜數(shù)據(jù)。盡管3000萬這一數(shù)字看起來很多,但與全部的圍棋走法相比就顯得微不足道了。因此,還要采取一些更先進(jìn)的辦法。
專家們并未像對(duì)待“深藍(lán)”那樣,為AlphaGo開發(fā)一些固有的程序,而是賦予了AlphaGo自我編程的能力,使之成為“數(shù)字自學(xué)者”。隨后,計(jì)算機(jī)開始進(jìn)行自我對(duì)弈,也就是深度學(xué)習(xí),直到其掌握高端的圍棋技巧。
對(duì)此,谷歌的研究人員Demis Hassabis表示:“傳統(tǒng)人工智能方法為所有可能位置建立搜索樹。對(duì)圍棋來說,這種方法行不通。因此,當(dāng)我們?cè)噲D打破圍棋的難題時(shí),我們采取了不同的方法。我們開發(fā)的系統(tǒng)將高級(jí)搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)以圍棋棋盤描述作為輸入,并通過包含數(shù)百萬個(gè)類神經(jīng)元連接的12個(gè)不同網(wǎng)絡(luò)層次進(jìn)行處理”。
由此可見,AlphaGo將比“深藍(lán)”更加厲害。而當(dāng)年“深藍(lán)”所掌握的程序中幾乎包含了其對(duì)手卡斯帕羅夫的全部對(duì)局分析,僅此一項(xiàng),就足以將任何高段的圍棋大師碾壓。那么,更加先進(jìn)的AlphaGo的出現(xiàn),無疑使人類棋手面臨著人工智能提出的更加高難度的挑戰(zhàn)。
二、深度學(xué)習(xí)背后是數(shù)學(xué)模型支撐,與人類大腦相去甚遠(yuǎn)
事實(shí)上,AlphaGo以往的成績已經(jīng)證明了其優(yōu)秀程度。AlphaGo曾在與其他圍棋人工智能系統(tǒng)進(jìn)行的500盤對(duì)弈中,贏得了499盤。去年10月,AlphaGo在五番棋的較量中,以5比0的成績擊敗了職業(yè)圍棋手、歐洲圍棋冠軍樊麾,這也是人工智能首次擊敗職業(yè)圍棋手。
對(duì)于即將到來的“谷李大戰(zhàn)”,圍棋界專業(yè)人士也發(fā)表了自己的看法。臺(tái)北“紅面棋王”、九段圍棋手周俊勛表示,之前曾堅(jiān)定地認(rèn)為李世石會(huì)以5比0完勝AlphaGo,但在看過一些報(bào)道以及科技界人士對(duì)于AlphaGo的分析之后,他的態(tài)度轉(zhuǎn)變?yōu)橹?jǐn)慎。
周俊勛認(rèn)為,從AlphaGo與樊麾對(duì)決的5局棋譜來看,在特定的條件下,尤其是官子階段,計(jì)算機(jī)的準(zhǔn)確度有明顯的提升。“不夸張地說,每個(gè)局部的定型收束不見得比全盛時(shí)代的‘石佛’李昌鎬差。如果再這么進(jìn)步下去,中盤戰(zhàn)斗力也會(huì)顯著提升”。
這一突破具有重大意義。在過去的幾十年時(shí)間里,圍棋軟件始終無法突破人類的初級(jí)水平,更遑論與人類中的高手相抗衡。如今人工智能圍棋系統(tǒng)突飛猛進(jìn)的局面,與其深度學(xué)習(xí)的能力是分不開的。
盡管人工智能領(lǐng)域的發(fā)展如火如荼,但與真正的人腦相比,仍然存在很大的差距。
深度學(xué)習(xí)是人工智能的重要能力,然而深度學(xué)習(xí)的本質(zhì)離不開數(shù)學(xué)模型。說白了就是由人類設(shè)計(jì)好一個(gè)框架,然后人工智能系統(tǒng)根據(jù)這一框架去進(jìn)行一系列運(yùn)作。
以“深藍(lán)”與卡斯帕羅夫的對(duì)決為例??ㄋ古亮_夫可以計(jì)算X個(gè)回合中可能產(chǎn)生的Y個(gè)變化,而“深藍(lán)”則能夠針對(duì)Y中的某一部分進(jìn)行推導(dǎo),從而演化出M個(gè)變化。
在這一過程中,可以明顯地看到M大于Y。那么在相同的比賽時(shí)間中,人類棋手卡斯帕羅夫必定會(huì)在M和Y的差值變化中出現(xiàn)漏洞,這也就是卡斯帕羅夫輸給“深藍(lán)”的主要原因。
對(duì)于即將到來的“谷李大戰(zhàn)”,周俊勛表示,與AlphaGo相比,李世石的最大優(yōu)勢就在于其擁有只屬于人類的想象力以及創(chuàng)造力。在中盤時(shí)出現(xiàn)一些“莫名其妙”的招式,可以對(duì)谷歌評(píng)估AlphaGo提出新的挑戰(zhàn)。
由此可見,谷歌對(duì)于勝者的100萬美元獎(jiǎng)勵(lì)也只是小投入。重頭戲則在于通過與全球公認(rèn)的優(yōu)秀圍棋手李世石的博弈,為AlphaGo提供驗(yàn)證其價(jià)值評(píng)估體系的頂尖樣本。
對(duì)于人類的科學(xué)界來說,這是一個(gè)很大的突破。但是對(duì)于人工智能本身來說,模仿人類進(jìn)行學(xué)習(xí)與思考是不太正確的方向。
法國思想家帕斯卡爾曾說:“人是一支有思想的蘆葦”。人類能夠在圍棋中迸發(fā)自己的智慧并從中感受到樂趣,所以圍棋對(duì)于人類是有意義的。而對(duì)于人工智能來說,它只是在執(zhí)行一些數(shù)學(xué)模型的運(yùn)算而已,并不能從中感受到樂趣。因此,人工智能仍與人類大腦相去甚遠(yuǎn)。
正所謂“授之以魚,不如授之以漁”。對(duì)于機(jī)器而言,真正的智能應(yīng)該是擁有自己獨(dú)特的思考方式。比如當(dāng)人工智能看到一堆數(shù)據(jù)時(shí),它能夠以自己的方式去思考,而不是單純地對(duì)人類的思維方式進(jìn)行模仿。
在實(shí)現(xiàn)上述情形的過程中,最重要的是人工智能的可改進(jìn)性。一個(gè)優(yōu)秀的人工智能,應(yīng)該做到通過自身修改核心代碼,來適應(yīng)周圍變幻不定的生存環(huán)境。甚至是應(yīng)該讓人工智能達(dá)到主動(dòng)創(chuàng)造的地步。當(dāng)然,要實(shí)現(xiàn)這些并非易事,人工智能仍需經(jīng)歷長時(shí)間的發(fā)展。