把Google當(dāng)拼寫檢查器用 – 云計(jì)算帶來(lái)人工智能的春天?
tzb 發(fā)表于 2012.8.1| 點(diǎn)擊數(shù)6248
人工智能(Artificial Intelligence)在其短暫的歷史中經(jīng)歷了不少大起大落。既有著50年代研究人員對(duì)發(fā)明“和人類一樣聰明的機(jī)器”的樂(lè)觀判斷,也有著70年代和90年代兩次“AI的冬天”。對(duì)于IT界來(lái)說(shuō),人工智能之前的表現(xiàn)差強(qiáng)人意,投資人和各公司都賠了不少錢。不過(guò),進(jìn)入2012年,在技術(shù)上的種種客觀條件的變化,尤其是云計(jì)算的盛行,也許會(huì)使人工智能迎來(lái)一個(gè)真正的上升期。
在本周的一個(gè)討論會(huì)上,來(lái)自MIT商學(xué)院的Michael Schrage教授提出了有關(guān)云計(jì)算和機(jī)器學(xué)習(xí)的問(wèn)題(Machine learning)。馬克·安得森則表示,機(jī)器學(xué)習(xí)實(shí)現(xiàn)人工智能真正的方法恐怕不是教會(huì)電腦像人類一樣思考,而是用算法去處理極其大量的數(shù)據(jù),而云計(jì)算和云存儲(chǔ)將會(huì)在這里發(fā)揮極其巨大的作用。在說(shuō)到這個(gè)現(xiàn)象時(shí),他舉了一個(gè)非常有趣而又吸引人的例子,那就是很多人會(huì)把Google當(dāng)成一個(gè)拼寫檢查器來(lái)用。我們所說(shuō)的檢查拼寫不僅僅包括了英語(yǔ)單詞的拼寫,還有中文語(yǔ)法的搭配,成語(yǔ)用法,甚至是一些古詩(shī)詞中的用字,以及不斷涌現(xiàn)的網(wǎng)絡(luò)流行語(yǔ),等等。檢查拼寫一直以來(lái)都是一個(gè)經(jīng)典的人工智能問(wèn)題,因?yàn)樵谶@個(gè)問(wèn)題之中我們的目的就是要教會(huì)電腦像人一樣說(shuō)話,讓它們學(xué)會(huì)人類語(yǔ)言的詞匯、語(yǔ)法、句型,然后再拿這些我們教給電腦的規(guī)則來(lái)檢查我們的語(yǔ)言和語(yǔ)法。
一直以來(lái),專業(yè)的拼寫檢查器(spell checker)都沒(méi)有達(dá)到人們的應(yīng)用要求,其原因有很多。比如說(shuō),人類的語(yǔ)言是極其復(fù)雜而且內(nèi)容繁多的,有非常多的規(guī)則需要設(shè)計(jì),同一句話可表達(dá)不同意思,不同的話可表達(dá)相同意思,流行語(yǔ)更新很快,等等。比較起來(lái),目前最先進(jìn)的拼寫檢查工具不是任何一個(gè)專業(yè)的工具,而是搜索引擎! 很多用戶大概都有過(guò)這種經(jīng)歷,就是對(duì)于一個(gè)句子,一個(gè)單詞,一句古詩(shī)不確定的時(shí)候,拿Google或者百度搜一下。有意思的是,不管Google還是百度都不是作為拼寫檢查器被設(shè)計(jì)出來(lái)的,而且他們也沒(méi)有專門的“拼寫檢查”功能。之所以這個(gè)歪打正著的功能居然這么好用,是因?yàn)樗占医M織了極其大量的信息。搜索引擎能看到所有人們提出的問(wèn)題,所以如果你在拼寫中或者用詞中犯了一個(gè)錯(cuò)誤,它能通過(guò)比對(duì)海量數(shù)據(jù)來(lái)預(yù)測(cè)出你的這個(gè)錯(cuò)誤 – 而結(jié)果就是搜索引擎事實(shí)上成為了目前為止最先進(jìn)的拼寫檢查器。
相同的方法和原理在人工智能、預(yù)測(cè)分析學(xué)的很多其他方面都有著應(yīng)用,比如人臉識(shí)別技術(shù),等等。這些應(yīng)用的基礎(chǔ)只有一個(gè) – 那就是極其大量的數(shù)據(jù)。從這個(gè)角度上說(shuō),云存儲(chǔ)和云計(jì)算帶來(lái)的大量數(shù)據(jù)也許會(huì)對(duì)類似的應(yīng)用帶來(lái)無(wú)限的機(jī)會(huì),怪不得Peter Thiel前段時(shí)間又一反傳統(tǒng)觀點(diǎn)的預(yù)測(cè)人工智能的黃金時(shí)代剛剛開始。把Google當(dāng)拼寫檢查器用 – 這個(gè)有趣的現(xiàn)象值得我們好好去觀察和思考,也許海量數(shù)據(jù)真的會(huì)帶來(lái)人工智能的新時(shí)代。
轉(zhuǎn)自:http://www.36kr.com/p/141442.html