然而一個(gè)月前,搜狗CEO王小川在知乎上發(fā)表了評(píng)論。 王小川相信,谷歌的人工智能將徹底擊敗職業(yè)圍棋選手李世石。
王小川表示,AI的發(fā)布是一個(gè)偉大的里程碑。 深度學(xué)習(xí)的魅力在于谷歌人工智能李世石,只要能夠在某個(gè)領(lǐng)域進(jìn)行建模,并且有足夠的數(shù)據(jù),機(jī)器就可以在這個(gè)領(lǐng)域超越并取代人類。 王小川還大膽預(yù)測(cè),自己在3月份仍能完勝韓國九段棋手李世石。 “除了圍棋,人工智能也將橫掃一切,在其他封閉游戲中徹底擊敗人類。”
以下為王小川知乎全文:
的發(fā)布是一個(gè)偉大的里程碑,再次讓我如此興奮,以至于我需要談?wù)撍?/p>
先說我的主張一:兩個(gè)月后,我將擊敗李世石。
我就到此為止,讓我們?cè)诒疚哪┪灿懻摂嘌远?/p>
從中學(xué)開始,我就癡迷于用算法解決游戲問題,并創(chuàng)新性地利用搜索方法完成了一些問題。 這幾年深度學(xué)習(xí)出現(xiàn)之后,我覺得有機(jī)會(huì)突破Go。 我和清華大學(xué)聯(lián)合實(shí)驗(yàn)室進(jìn)行了幾次討論,他們都認(rèn)為這個(gè)方向是可行的。 遺憾的是,由于缺乏靈氣和能力,我無法組織這方面的投資。 。
這次出手的團(tuán)隊(duì)是深度學(xué)習(xí)領(lǐng)域最優(yōu)秀的團(tuán)隊(duì)。 資源、能力、氣場(chǎng)都沒有問題。 這項(xiàng)突破性技術(shù)基于深度學(xué)習(xí)的估值和下棋。
看看知乎上的很多討論,可以根據(jù)之前完成的棋局來判斷棋風(fēng),進(jìn)而推斷出這個(gè)算法的強(qiáng)大之處。 我們的核心是回歸到對(duì)這次所使用的技術(shù)的深刻理解。
為了方便討論,我們比較一下以搜索剪枝為核心的深藍(lán)象棋和以搜索剪枝+深度學(xué)習(xí)為核心的深藍(lán)象棋的三個(gè)區(qū)別:
1、圍棋和國際象棋最大的區(qū)別在于,國際象棋比賽的評(píng)價(jià)函數(shù)極其難以定義。 在國際象棋中,你可以找到各種計(jì)分的“特征”,比如失去一個(gè)馬會(huì)扣多少分,如果將??棋子向前推進(jìn)直到接近底線會(huì)增加多少分,但是這在 Go 中是做不到的。 旁邊是密密麻麻的黑白石子,前面還有很多點(diǎn)。 其中聯(lián)系和變化較多,難以概括規(guī)律。 這也是傳統(tǒng)算法相比人類最薄弱的問題之一。
就像我們?nèi)祟愖鋈四樧R(shí)別的時(shí)候,一眼就能看出是張三還是李四,但是機(jī)器算法卻很難下手。 這個(gè)問題恰恰是深度學(xué)習(xí)近年來最大的突破。 深度學(xué)習(xí)不需要人類設(shè)計(jì)算法來“尋找特征”。 通過大量原始數(shù)據(jù)和標(biāo)簽的積累,機(jī)器可以自動(dòng)發(fā)現(xiàn)特征,而且并不比人類差。
幾年前,許多人認(rèn)為機(jī)器在圖像處理方面舉步維艱。 如何定義和抽象鼻子? 耳朵? 眼睛? 但這兩年深度學(xué)習(xí)突飛猛進(jìn),一舉超越了人類。 就在2015年,在人臉識(shí)別方面,機(jī)器的識(shí)別能力已經(jīng)超越了人類。 這是人類幾千萬年進(jìn)化而來的核心能力之一。
圍棋游戲可以理解為一張19*19的圖片。 國際象棋的其他規(guī)則非常簡(jiǎn)單(很容易轉(zhuǎn)化為計(jì)算機(jī)規(guī)則),正好屬于深度學(xué)習(xí)所擅長(zhǎng)的領(lǐng)域。
搜索+深度學(xué)習(xí),這個(gè)算法可以完全覆蓋圍棋的規(guī)則以及人下棋的思維過程和模式,這只是一個(gè)子集。 這就決定了這個(gè)算法沒有上限,有機(jī)會(huì)在圍棋領(lǐng)域“過關(guān)”。
2、與深藍(lán)相比,最大的優(yōu)勢(shì)是“學(xué)習(xí)能力”。 深藍(lán)的開局更多依賴于數(shù)據(jù)庫棋譜的建立,但不具備泛化能力(不知道如何舉一例),玩沒見過的棋法可能會(huì)很愚蠢。 之后的核心能力就是計(jì)算能力。 通過暴力搜索(當(dāng)然也有最好的剪枝,但還是暴力),我們嘗試通過走10-20步來選擇最優(yōu)路徑。
這種復(fù)雜度是指數(shù)級(jí)的,成為一個(gè) NP 問題,受到計(jì)算能力的限制。 該系統(tǒng)的算法是硬編碼的,參數(shù)固定,就會(huì)有固定的性能。 調(diào)整參數(shù)、改變算法是工程師的事。 這個(gè)系統(tǒng)的天花板就是計(jì)算機(jī)有多強(qiáng)大,工程師有多聰明。
而且它更加由數(shù)據(jù)驅(qū)動(dòng)。 給他更多的棋局?jǐn)?shù)據(jù),他將能夠優(yōu)化“神經(jīng)元網(wǎng)絡(luò)”,在相同的計(jì)算資源下變得更加聰明,并具有舉一反三的能力,這與人類非常接近(換句話說,它是為了模擬人類而設(shè)計(jì)的)。
而且我們知道,機(jī)器處理數(shù)據(jù)的能力足夠快,沒有情緒就不會(huì)犯錯(cuò)誤。 這就決定了,如果這個(gè)系統(tǒng)學(xué)會(huì)了今天網(wǎng)上能收集到的所有棋譜,那么它就會(huì)成為頂級(jí)高手。
3、最可怕的不僅僅是前兩點(diǎn)。 對(duì)于下棋的問題,不僅僅是從網(wǎng)上收集數(shù)據(jù)進(jìn)行學(xué)習(xí)。 還可以與自己對(duì)戰(zhàn),實(shí)現(xiàn)“自學(xué)”。 你看過電影《超越》嗎?
隨著時(shí)間的推移,人工智能會(huì)變得更加聰明。 金庸小說里,老頑童讓左右手“左右”打架,成為無敵武林。 那只是一個(gè)故事,在國際象棋領(lǐng)域,但通過這樣的設(shè)計(jì),這樣的武功卻成真了!
距離比賽還有兩個(gè)月的時(shí)間。 這樣一臺(tái)在算法上沒有天花板的機(jī)器,很有可能在“左右廝殺”中登頂,成為無可超越的圍棋高手。
技術(shù)問題已經(jīng)進(jìn)行了討論。 如何查看其背后的完整動(dòng)作? 有人認(rèn)為這是過度解讀。 實(shí)際的制度相當(dāng)粗糙——入選的都是“歐洲冠軍”——說明制度不好。 這是一種錯(cuò)誤的理解。
更可能的原因是,在圍棋比賽中,公司員工粗心大意,提前泄露了很多信息。 于是,他們很快就發(fā)表了公司的文章,搶占了先機(jī),然后兩個(gè)月后就賣出期貨來和人類競(jìng)爭(zhēng)。 當(dāng)時(shí)的系統(tǒng)已經(jīng)足夠好了,適合競(jìng)爭(zhēng)環(huán)境。
事實(shí)上,兩家公司都已經(jīng)認(rèn)識(shí)到AI的重要性,并且在未來幾年將會(huì)有重大突破。
它被以 4 億美元收購。 當(dāng)時(shí)只有20人,現(xiàn)在已經(jīng)有200多人了,這是一次不計(jì)成本的瘋狂投資。
下圍棋只是體現(xiàn)人工智能進(jìn)步的一個(gè)極好的宣傳點(diǎn)和切入點(diǎn)。 從公開文獻(xiàn)中我們可以看到,Go的研發(fā)是基于共性技術(shù),并且是領(lǐng)域無關(guān)的( )。 此類技術(shù)未來可用于其他合適的領(lǐng)域。
深度學(xué)習(xí)的魅力就在于,只要你能在某個(gè)領(lǐng)域建模,有足夠的數(shù)據(jù),就可以超越、取代這個(gè)領(lǐng)域的人,可以在短時(shí)間內(nèi)從0到99分。
如果我們還固守舊觀念,用循序漸進(jìn)的方式來理解機(jī)器智能,比如之前有個(gè)大老板宣傳他的XX大腦有X歲孩子的智能,這是非常誤導(dǎo)的(che)。 我們還會(huì)錯(cuò)誤估計(jì)機(jī)器下圍棋的能力,并根據(jù)人類對(duì) 1D-9D 的理解來評(píng)估它。
總之,不要用評(píng)價(jià)人的方法來評(píng)價(jià)機(jī)器的人工智能能力。 這是一個(gè)完全不同的模型。
老羅曾這樣評(píng)價(jià)人工智能:“人工智能就像一列火車,當(dāng)它靠近時(shí)你聽到隆隆的聲音,你就不斷地期待它的到來。它終于到了,一閃而過,然后把你遠(yuǎn)遠(yuǎn)地拋在了后面。”
如果給這句話加上一個(gè)補(bǔ)丁,將人工智能的應(yīng)用限制在特定的封閉領(lǐng)域谷歌人工智能李世石,這是一個(gè)非常恰當(dāng)?shù)拿枋觥?我們不應(yīng)該過于傲慢。 例如,我們很容易受到自我優(yōu)越感的驅(qū)使,說動(dòng)物不如人類。 例如,人類可以直立行走、說話、使用實(shí)用工具來區(qū)別于其他動(dòng)物。 事實(shí)證明,動(dòng)物也是如此。
對(duì)于機(jī)器來說也是如此。 就在幾個(gè)月前,還有人叫囂十年之內(nèi)機(jī)器將無法下圍棋。 原因誰都一目了然:機(jī)器只能計(jì)算。 這些傲慢態(tài)度導(dǎo)致我們做出錯(cuò)誤判斷。 不必太自卑,認(rèn)為如果機(jī)器在圍棋中獲勝,整個(gè)人類智能就會(huì)被碾壓。 時(shí)至今日,機(jī)器在很多領(lǐng)域仍然完全無法勝任,只能在局部區(qū)域發(fā)揮作用。
最后說一下斷言二:除了圍棋之外,人工智能也將橫掃一切,在其他封閉游戲中徹底擊敗人類。
頁面鏈接:
186信息網(wǎng)原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明本文來自:m.icocr.cn