【中國(guó)智能制造網(wǎng) 企業(yè)動(dòng)態(tài)】先是微軟、然后Facebook、現(xiàn)在是谷歌。又一次,互聯(lián)網(wǎng)巨頭們將目光聚焦在了同一個(gè)未來趨勢(shì)上:聊天機(jī)器人。
這些公司許諾說,在未來的幾個(gè)月和幾年內(nèi),你可以像跟朋友聊天一樣,與互聯(lián)網(wǎng)服務(wù)商聊天。聊天機(jī)器人會(huì)即時(shí)回復(fù)你的提問、回應(yīng)你的需求,甚至預(yù)測(cè)你的需求。跟老同學(xué)聊天約聚會(huì)的時(shí)候,你可以讓OpenTable機(jī)器人找找有什么餐廳好吃。不用另外打開一個(gè)APP,你就能用Travelocity機(jī)器人訂酒店。
不過,還有一個(gè)關(guān)鍵問題沒有解決:打造一個(gè)真的可以聊天的聊天機(jī)器人。機(jī)器人可以以某些方式來模擬聊天,但是距離真正理解人們聊天的方式,還有很大的差距。上個(gè)月底,為了推動(dòng)這方面AI技術(shù)的進(jìn)步——并且與競(jìng)爭(zhēng)對(duì)手爭(zhēng)搶公關(guān)眼球——谷歌開源了SyntaxNet,公司自然語(yǔ)言理解技術(shù)所使用的工具之一(開源分享可以讓更多的人來推動(dòng)技術(shù)進(jìn)步)。現(xiàn)在,為了不被超越,F(xiàn)acebook展示了自己的一項(xiàng)重要技術(shù),一個(gè)稱為DeepText的自然語(yǔ)言引擎。
Facebook還沒有將這項(xiàng)技術(shù)開源。而且,公司也才剛剛開始在自己各項(xiàng)服務(wù)中使用DeepText。但是據(jù)Facebook稱,DeepText讓人們看到公司希望在未來加速自然語(yǔ)言理解的進(jìn)展。為了打造系統(tǒng),他們希望少一點(diǎn)依賴人類,多一點(diǎn)依賴數(shù)據(jù)——互聯(lián)網(wǎng)上的海量數(shù)據(jù)。
谷歌和Facebook都在使用深度神經(jīng)網(wǎng)絡(luò)來推進(jìn)他們的自然語(yǔ)言處理能力。深度神經(jīng)網(wǎng)絡(luò)在許多別的在線任務(wù)中都已經(jīng)獲得了成功,例如識(shí)別照片中的人臉、識(shí)別智能電話的語(yǔ)音指令,人們希望這些能夠通過分析海量數(shù)據(jù)學(xué)會(huì)任務(wù)的軟件和硬件網(wǎng)絡(luò),也能夠成功學(xué)會(huì)理解語(yǔ)言,并以自然的方式回應(yīng)人類語(yǔ)言。
谷歌新開源的系統(tǒng)“SyntaxNet”使用神經(jīng)網(wǎng)絡(luò)來理解句子中的語(yǔ)法邏輯。神經(jīng)網(wǎng)絡(luò)可以通過分析幾百萬(wàn)張貓咪照片來學(xué)會(huì)識(shí)別貓咪,同樣地,神經(jīng)網(wǎng)絡(luò)可以分析幾百萬(wàn)個(gè)句子,從而學(xué)會(huì)理解語(yǔ)法——名詞、動(dòng)詞、以及動(dòng)詞如何與名詞聯(lián)系起來等等。這種方法稱為句法分析,很有用,但是也有局限性。人類必須將幾百萬(wàn)個(gè)例句仔細(xì)標(biāo)記,標(biāo)出句子中的每一個(gè)部分,以及每個(gè)部分與句子剩余部分是什么關(guān)系,這樣SyntaxNet才能從數(shù)據(jù)中學(xué)習(xí)。而且,即便是機(jī)器成功學(xué)會(huì)理解一個(gè)句子的語(yǔ)法,它還得更進(jìn)一步才能理解一個(gè)聊天對(duì)話的完整意義。
但是,現(xiàn)在Facebook的研究人員說,他們已經(jīng)將這項(xiàng)技術(shù)推向了全新領(lǐng)域。”(DeepText)幫我們彌補(bǔ)了數(shù)據(jù)庫(kù)標(biāo)記的不足。”Facebook工程總監(jiān)HusseinMehanna說,“它有非常巨大的結(jié)構(gòu)。它可以通過無監(jiān)管的方式來學(xué)習(xí)。”換句話說,F(xiàn)acebook的系統(tǒng)更多依賴數(shù)學(xué),而非語(yǔ)法精度。
"他們說這話的意思是,關(guān)于語(yǔ)言結(jié)構(gòu),他們沒有去教神經(jīng)網(wǎng)絡(luò)任何東西。”ChrisNicholson這樣解釋道,他是深度學(xué)習(xí)創(chuàng)業(yè)公司Skymind的創(chuàng)始人,他說Facebook的研究之前已經(jīng)在一些公開研究論文中討論過了。這很重要,他補(bǔ)充說,因?yàn)檫@可以打造更加靈活的系統(tǒng)——系統(tǒng)可以馬上擴(kuò)展到眾多不同的情景。Facebook的系統(tǒng)可以像學(xué)英語(yǔ)一樣,學(xué)會(huì)法語(yǔ)、西班牙語(yǔ)——只要將語(yǔ)言解構(gòu),將語(yǔ)言看做只是數(shù)學(xué)而已。據(jù)Mehanna說,DeepText已經(jīng)能用20種不同的語(yǔ)言運(yùn)行了。
過去,研究人員使用仔細(xì)編碼的規(guī)則來打造自然語(yǔ)言引擎——這是種困難又耗時(shí)的方法。這也是蘋果打造Siri的方法。通過打造可以自主學(xué)習(xí)的系統(tǒng),谷歌和Facebook等公司希望系統(tǒng)不需要很多人類干涉,就能夠自己成長(zhǎng)、越來越智能。不過,我們還沒實(shí)現(xiàn)這個(gè)目標(biāo)。Facebook的方法還在早期階段,而且并不是所有人都相信Facebook的系統(tǒng)真像公司說的那么好用。
NoahSmith是華盛頓大學(xué)的計(jì)算機(jī)科學(xué)家,他的專業(yè)領(lǐng)域就是自然語(yǔ)言理解。他說不只有Facebook想通過未經(jīng)標(biāo)記的數(shù)據(jù)實(shí)現(xiàn)理解。他說,基于Facebook的一篇近期研究論文,他不覺得公司的方法特別酷炫。不過,他和許多人都認(rèn)為,這是未來研究會(huì)探索的方向。
當(dāng)用戶聊天時(shí)出現(xiàn)以下聊天內(nèi)容,軟件會(huì)自動(dòng)識(shí)別出用戶想打出租車,并出現(xiàn)叫車按鈕:“我需要打車。”、“我們打個(gè)車去吧。”、“打個(gè)車。”、“叫個(gè)出租。”、“但是我得打個(gè)車。”當(dāng)用戶說“嗨!”、“我不需要打車。”和“我想騎毛驢。”的時(shí)候,軟件不會(huì)出現(xiàn)叫車按鈕。圖片來源:Facebook。
Mehanna說,F(xiàn)acebook會(huì)在今年夏天發(fā)表更多關(guān)于DeepText的新研究論文。他說,公司正在開始測(cè)試該項(xiàng)技術(shù),作為支持FacebookMessenger內(nèi)部聊天機(jī)器人的工具。據(jù)Mehanna說,系統(tǒng)可以在你平時(shí)跟朋友聊天的時(shí)候自動(dòng)識(shí)別出你想打出租車。而且,我們有理由相信Facebook可能在此方面有一種競(jìng)爭(zhēng)優(yōu)勢(shì)——數(shù)據(jù)。
要學(xué)會(huì)自然語(yǔ)言,你需要大量的自然語(yǔ)言——以數(shù)字化的形式。以前這是難以實(shí)現(xiàn)的。但是這對(duì)Facebook來說是小菜一碟——公司的社交媒體上,每一天都有幾百萬(wàn)真實(shí)的聊天對(duì)話在發(fā)生。據(jù)Mehanna稱,人們每分鐘發(fā)布的新消息多達(dá)40萬(wàn)條,而這些新消息下面,每天都會(huì)發(fā)布8千萬(wàn)條評(píng)論。
對(duì),這也就是說,F(xiàn)acebook利用自己網(wǎng)站上生成的數(shù)據(jù)來訓(xùn)練DeepText,而公司以外的研究員很難驗(yàn)證公司所說的技術(shù)。不過,這個(gè)數(shù)據(jù)也至關(guān)重要?,F(xiàn)在,F(xiàn)acebook上幾乎所有的聊天都是人與人之間的進(jìn)行的。但是有了正在傾聽和學(xué)習(xí)的機(jī)器人,也許有一天,我們也會(huì)在Facebook上和機(jī)器人聊天。