王小川烏鎮(zhèn)演講:人工智能是否會(huì)出現(xiàn)第三次退潮
在第三次世界互聯(lián)網(wǎng)大會(huì)上,王小川發(fā)表了演講,下面我們一起看看。
前面的十二場(chǎng)演講中,嘉賓有講技術(shù)、有講產(chǎn)品,我希望給大家的分享一些不同的內(nèi)容,以及自己獨(dú)有的視角。今天大家都提到了AlphaGo,作為引爆人工智能的開(kāi)端,深度學(xué)習(xí)在其中承擔(dān)了最重要的責(zé)任。
今天當(dāng)大家開(kāi)始暢想的時(shí)候,有可能認(rèn)為人工智能未來(lái)真的會(huì)取代人。那么我希望今天的分享更多地能夠知道人工智能在今天能做什么?不能做什么?未來(lái)終極的理想又是什么?
AlphaGo之后,我們看到最重要的突破領(lǐng)域是在語(yǔ)音和圖像領(lǐng)域,在文字領(lǐng)域的進(jìn)展很緩慢。今天我們?cè)跈C(jī)器翻譯方面取得了一些突破,但是問(wèn)答和對(duì)語(yǔ)義的理解是不夠的;氐綀D靈測(cè)試,上個(gè)世紀(jì)五十年代圖靈提出了問(wèn)答機(jī)器推想這樣一個(gè)概念,今天我們直觀感受是語(yǔ)音圖像進(jìn)步很快,但是自然語(yǔ)言的處理其實(shí)是比較慢的。
拋開(kāi)技術(shù),以一個(gè)產(chǎn)品經(jīng)理的身份來(lái)看,人工智能有三個(gè)產(chǎn)品方向,一是識(shí)別——語(yǔ)音識(shí)別、圖像識(shí)別、視頻識(shí)別;二是圖像——我們?nèi)ドa(chǎn)圖像,生成識(shí)別;三是創(chuàng)造。大家提到了人工智能進(jìn)步的層次,我想換一個(gè)方式描述——工程師在人工智能時(shí)代會(huì)處于越來(lái)越重要的位置。
我們開(kāi)始提到傳統(tǒng)的方法是把規(guī)則交給機(jī)器,隨著統(tǒng)計(jì)系統(tǒng)的發(fā)展,包括深度學(xué)習(xí),我們開(kāi)始更容易地將答案交給機(jī)器。,在數(shù)據(jù)的積累下我們就可以讓機(jī)器變得更加聰明。這里面更前沿的方式是將目標(biāo)交給機(jī)器,AlphaGo融合了幾套算法,但是我和他們工程師溝通的時(shí)候,這樣的把目標(biāo)交給機(jī)器的強(qiáng)化學(xué)習(xí),還并不成熟,也就是說(shuō)如果沒(méi)有之前三千萬(wàn)局人機(jī)對(duì)戰(zhàn)的棋譜的話,AlphaGo沒(méi)能夠做到只通過(guò)強(qiáng)化學(xué)習(xí)來(lái)戰(zhàn)勝人類(lèi),這是技術(shù)層面需要往下突破的重點(diǎn)。如果將目標(biāo)交給機(jī)器,機(jī)器能夠做自我學(xué)習(xí),這方面有新的突破,那我們離新的人工智能時(shí)代就更近了。
今年六月份,我去了英國(guó)倫敦,和DeepMind公司的工程師做了交流,我特別好奇的事情就是下棋的第四局機(jī)器輸?shù)袅,發(fā)生了什么事情?他們說(shuō)不是程序有BUG,就是深度學(xué)習(xí)本身有瓶頸,圍棋比賽是三月份,我是在六月份去的倫敦,已經(jīng)過(guò)了三個(gè)月,三個(gè)月的時(shí)間,這個(gè)問(wèn)題依然沒(méi)有解決。但是我離開(kāi)以后一個(gè)星期,他們的程序能夠正確面對(duì)之前的第四局棋譜,我問(wèn)他是否這個(gè)BUG修好了,工程師說(shuō)沒(méi)有,只是代表第四局那個(gè)特定問(wèn)題,正好機(jī)器可以解決。但是我們依然不知道再什么情況下, AlphaGo會(huì)繼續(xù)出錯(cuò)。所以深度學(xué)習(xí)這樣一個(gè)體系其實(shí)還是有瓶頸所在的。
所以在今天我更多想談的是以深度學(xué)習(xí)為代表的今天的人工智能技術(shù),還有哪些不靠譜的地方?在產(chǎn)品上不適用之處有哪些?
第一個(gè)問(wèn)題,語(yǔ)音識(shí)別靠譜嗎?在百度、騰訊,都提到了語(yǔ)音識(shí)別的能力,今天我給大家的演示也用到了語(yǔ)音識(shí)別,這是搜狗自己的技術(shù)。在安靜的環(huán)境里面我們的識(shí)別準(zhǔn)確度已經(jīng)到了95%,甚至97%,但是一旦有噪音,準(zhǔn)確率迅速下降。當(dāng)噪音還只是汽車(chē)的引擎噪音、風(fēng)的噪音時(shí),我們把噪音當(dāng)成原始數(shù)據(jù)進(jìn)入監(jiān)督學(xué)習(xí)系統(tǒng)里去,把這種噪音變成機(jī)器見(jiàn)過(guò)的問(wèn)題之一。但是事實(shí)上我們見(jiàn)到更多的情況,如果同時(shí)兩個(gè)人說(shuō)話會(huì)怎樣?在今天的學(xué)術(shù)界依然無(wú)解。
今年六月份,我問(wèn)學(xué)術(shù)界的人,人和機(jī)器在語(yǔ)音識(shí)別上的區(qū)別,究竟怎么破解?我們用機(jī)器的時(shí)候,采用立體聲的方式做定向的`識(shí)別,也就是說(shuō)我們做一個(gè)麥克風(fēng)矩陣,通過(guò)立體的方式知道其中一個(gè)人在說(shuō)話,把另外一個(gè)人說(shuō)話去掉,但人本身是這樣干的嗎?如果把一只耳朵堵上,我是否沒(méi)辦法分離出誰(shuí)在說(shuō)話?或者把兩個(gè)說(shuō)話的聲音錄在一個(gè)單聲道里面,人可以識(shí)別嗎?人當(dāng)然是可以的,所以人的方法和機(jī)器不一樣。人怎么識(shí)別?因?yàn)槿说囊羯灰粯,還是因?yàn)閮蓚(gè)人的一個(gè)聲音大一個(gè)聲音小,還是因?yàn)樗麄儾煌恼Z(yǔ)音,博士說(shuō)但凡同時(shí)兩個(gè)人說(shuō)話的時(shí)候,只要能夠找到差別,人就能夠把其中的一個(gè)聲音識(shí)別出來(lái),所以人在和機(jī)器處理過(guò)程當(dāng)中有巨大的不同。語(yǔ)音識(shí)別最成熟的領(lǐng)域其實(shí)還是和人有很大的區(qū)別。
另外一件事情是語(yǔ)義靠譜嗎?對(duì)語(yǔ)言的理解,谷歌在之前是用知識(shí)圖譜的方法解決,現(xiàn)在遇到了瓶頸,也是今年六月,我在一個(gè)實(shí)驗(yàn)室看到最先進(jìn)的人機(jī)對(duì)話系統(tǒng),這個(gè)系統(tǒng)可以幫你訂餐訂酒店,對(duì)話過(guò)程當(dāng)中機(jī)器的表現(xiàn)非常驚艷,我們上去試,有一個(gè)環(huán)節(jié),機(jī)器問(wèn)你:“你是需要停車(chē)位還是不要停車(chē)位?”這個(gè)時(shí)候我們回答要或者不要都沒(méi)問(wèn)題,如果回答“我沒(méi)車(chē)”,大家知道機(jī)器會(huì)怎么樣嗎?他們完全不理解我沒(méi)車(chē)代表著我不需要停車(chē)位,因?yàn)榻裉斓臋C(jī)器,在自然語(yǔ)言概念的理解方面,還是遠(yuǎn)遠(yuǎn)不夠的。所以自然語(yǔ)言處理是可以做的,但是語(yǔ)義理解到現(xiàn)在還是一個(gè)不靠譜的階段。谷歌也在今年發(fā)布了一套對(duì)于自然語(yǔ)言能夠做句子分析的引擎,把主語(yǔ)、謂語(yǔ)、賓語(yǔ)提出來(lái),但是準(zhǔn)確度只有90%,提不上去了,因?yàn)檫@個(gè)時(shí)候光靠統(tǒng)計(jì)靠語(yǔ)法已經(jīng)不能支撐,往下是需要對(duì)句子當(dāng)中的具體概念有理解才能消除歧義。我們知道不能把馬路放在冰箱上面,這對(duì)于人來(lái)講非常好理解,但是對(duì)計(jì)算機(jī)的挑戰(zhàn)非常大,這是深度學(xué)習(xí)人工智能還不夠的地方。
很敏感的問(wèn)題,無(wú)人駕駛靠譜嗎?今天百度在大會(huì)上也提出了發(fā)布無(wú)人駕駛汽車(chē),但是從我的了解,如果以今天人類(lèi)的技術(shù),我們確實(shí)再見(jiàn)過(guò)的場(chǎng)景和封閉場(chǎng)景中都可以使用。但是對(duì)于真正開(kāi)放的環(huán)境,不只跑在高速上的汽車(chē),以現(xiàn)在人類(lèi)的技術(shù)是不安全的,因?yàn)檫@個(gè)場(chǎng)景只要沒(méi)見(jiàn)過(guò),可能會(huì)犯嚴(yán)重的錯(cuò)誤,就像AlphaGo下棋一樣會(huì)突然發(fā)瘋,所以作為輔助駕駛是可以的,無(wú)人駕駛在真正的技術(shù)突破以前還做不到。今天的深度學(xué)習(xí)缺乏推理,缺乏對(duì)符號(hào)的理解,如果沒(méi)有符號(hào),對(duì)自然語(yǔ)言的理解就會(huì)成為瓶頸。
即便是這樣,我們也提到了(人工智能)能夠取代一些行業(yè),比如說(shuō)棋手、醫(yī)生、司機(jī),機(jī)器在里面都可以做很好的輔助,但是對(duì)于大家沒(méi)見(jiàn)過(guò)的創(chuàng)造性的事情,比如規(guī)劃、科研,其實(shí)對(duì)于機(jī)器來(lái)說(shuō)還很難,今天在媒體上機(jī)器自動(dòng)寫(xiě)文章、自動(dòng)畫(huà)圖,在科研層面展示出了一些魔力,但是還沒(méi)有到可以取代人的階段,所以在這里面我先把大家對(duì)人工智能預(yù)期降低下來(lái)。
有人在問(wèn),(人工智能)是否會(huì)出現(xiàn)第三次退潮,前兩次我們都認(rèn)為人工智能到來(lái)了,但是這次可能會(huì)比之前好,之前的人工智能兩次退潮前,我們問(wèn)一個(gè)老師,說(shuō)你是研究人工智能的嗎?這是罵他的話。因?yàn)?大家認(rèn)為)人工智能不靠譜,這次是(人工智能)第一次真正進(jìn)入到了使用,切實(shí)在語(yǔ)言處理、聲音處理、圖象處理,和在一些高維數(shù)據(jù)空間上能夠比人做的更好。所以這次的區(qū)別就是大量資金、資本投入到了人工智能。也有大量的研究人員在畢業(yè)以后從事人工智能工作,這是和之前不一樣的。所以一方面我們開(kāi)始使用這項(xiàng)技術(shù),另外一方面我們開(kāi)始期待不斷產(chǎn)生新的突破。
我個(gè)人對(duì)這次人工智能的浪潮是樂(lè)觀的,但是我也很緊張,也許我們自己做的搜索引擎就是會(huì)被顛覆的一部分。
在這里面我們開(kāi)始暢想未來(lái)的路在什么地方,從我自己的描述來(lái)看,搜索的未來(lái)就是人工智能時(shí)代的皇冠,為什么這么說(shuō),搜索的未來(lái)是什么,人工智能的未來(lái)又是什么,為什么是皇冠?
簡(jiǎn)單來(lái)講,我認(rèn)為搜索的未來(lái)就是問(wèn)答機(jī)器人。因?yàn)槲覀兞?xí)慣了一件事情:做搜索的時(shí)候我們先輸入關(guān)鍵詞,然后搜索給你十條結(jié)果,或者叫十條鏈接。但是這真是最好的方法嗎?肯定是不夠的。我們也會(huì)提到是否我們用個(gè)性化的方法能夠使得搜索的結(jié)果更準(zhǔn),但是其實(shí)個(gè)性化能夠提供的信息非常的有限。真正能夠使得這個(gè)系統(tǒng)變得有用的辦法是用問(wèn)句。以前不用問(wèn)句的原因是因?yàn)闄C(jī)器聽(tīng)不懂你在說(shuō)什么,真正到了問(wèn)句以后,機(jī)器會(huì)從給你十條鏈接,變成給你一個(gè)答案,就會(huì)好很多。如果你去問(wèn)機(jī)器四個(gè)字,“烏鎮(zhèn)大會(huì)”,機(jī)器不可能給你想要的內(nèi)容,最多把新聞,烏鎮(zhèn)的百科或者是官網(wǎng)介紹給你,只有你問(wèn)烏鎮(zhèn)大會(huì)哪天開(kāi),這個(gè)時(shí)候機(jī)器才能理解你要什么,才有機(jī)會(huì)給你最好的答案,我相信隨著技術(shù)的突破,搜索引擎會(huì)自然而然演化成為問(wèn)答引擎。
很多公司都在做這件事,蘋(píng)果、微軟、亞馬遜、谷歌。這里面起步最早做對(duì)話系統(tǒng)的是蘋(píng)果的Siri。但是這個(gè)系統(tǒng)并不成功,在中國(guó)用的人很少。為什么?因?yàn)楝F(xiàn)在技術(shù)沒(méi)有到來(lái),對(duì)于自然語(yǔ)言的處理能力、自然語(yǔ)言的理解能力非常有限。那么為什么蘋(píng)果這樣一個(gè)追求極致的公司,會(huì)把這個(gè)系統(tǒng)發(fā)布出來(lái)呢?一種可能性是蘋(píng)果對(duì)技術(shù)了解不夠;另一種可能性是我認(rèn)為這是喬布斯的一個(gè)遺愿。我們知道發(fā)布iPhone手機(jī)的時(shí)候,喬布斯病重,只能躺在病床上看發(fā)布會(huì),發(fā)布會(huì)完成之后,他很快就離開(kāi)人世了,所以Siri就像一個(gè)早產(chǎn)的嬰兒,在iPhone4s里面發(fā)布出來(lái),所以我認(rèn)為這樣的系統(tǒng)代表著人類(lèi)終極人機(jī)交互的暢想。
事實(shí)上在大量的文學(xué)作品、科幻電影里面,都會(huì)提到問(wèn)答機(jī)器人,不管是《星球大戰(zhàn)》、《超能陸戰(zhàn)隊(duì)》,還是《星際穿越》都提到了。阿西莫夫的短篇小說(shuō)《最后的問(wèn)題》,描繪就是人類(lèi)造了一個(gè)機(jī)器,把所有的資源都用了上去。這個(gè)機(jī)器可以回答其他任何問(wèn)題,卻有一個(gè)問(wèn)題回答不了,就是“宇宙是怎么誕生的”,這是文學(xué)作品對(duì)問(wèn)答機(jī)器的思考。
除了搜索引擎做問(wèn)答以外,咱們知道在中國(guó)搜狗輸入法在移動(dòng)端擁有三億用戶,輸入法的未來(lái)是什么呢?和自動(dòng)問(wèn)答有關(guān)系,大家一起來(lái)看一個(gè)視頻。
之前我們討論輸入法的時(shí)候很多朋友和我說(shuō)語(yǔ)音是最重要的,搜狗有完整的語(yǔ)音識(shí)別技術(shù)和語(yǔ)音合成技術(shù),但是在我內(nèi)心,這個(gè)遠(yuǎn)不是輸入法的極致。輸入法真正的極致是能夠開(kāi)始尋找信息,幫你思。剛才給大家演示的是搜狗輸入法的分享的能力,真正的回答能力可以在后面給大家做一個(gè)新的演示。
在我們討論問(wèn)答技術(shù)和討論人機(jī)對(duì)話的時(shí)候,輸入法也許是最好的一個(gè)切入場(chǎng)景。輸入法作為一個(gè)人的分身,更容易幫助你建立思考。輸入法也會(huì)從一個(gè)拼音工具走向一個(gè)對(duì)話和問(wèn)答系統(tǒng)。
搜狗有兩個(gè)核心產(chǎn)品,一個(gè)是輸入法一個(gè)是搜索,一個(gè)是搜索信息一個(gè)是表達(dá)信息。隨著AI技術(shù)的發(fā)展,我們能更好地解放人的思考。我們有一個(gè)理念,包括兩件事情:一個(gè)是做自然的交互,不只是語(yǔ)音,還包括語(yǔ)言;另外就是做知識(shí)的計(jì)算,能讓機(jī)器開(kāi)始逐步建立推理的能力。搜狗輸入法在中國(guó)擁有最大的語(yǔ)言數(shù)據(jù)處理積累,我們有機(jī)會(huì)在這個(gè)領(lǐng)域取得突破。
這是我今天的分享,謝謝大家!
【王小川烏鎮(zhèn)演講:人工智能是否會(huì)出現(xiàn)第三次退潮】相關(guān)文章:
《遇見(jiàn)王瀝川》經(jīng)典臺(tái)詞05-28
測(cè)你是否是辦公室人氣王02-09
烏鎮(zhèn)自由行旅游攻略04-06
晨會(huì)求職小故事08-25
元旦小長(zhǎng)假四川有什么旅游景點(diǎn)04-04
烏鎮(zhèn)的自助游攻略11-30
烏鎮(zhèn)自助游住宿攻略03-27
西塘烏鎮(zhèn)自助游攻略03-23
上海去烏鎮(zhèn)自助游攻略03-18