當(dāng)次聽(tīng)到世界的社交網(wǎng)絡(luò)公司不是專(zhuān)心發(fā)展搜索機(jī)制,而是正在進(jìn)行機(jī)器人研究的時(shí)候,確實(shí)讓人感到十分驚訝。
Facebook是一個(gè)有著眾多競(jìng)爭(zhēng)優(yōu)先權(quán)的大型組織,雖然這些機(jī)器人不會(huì)直接影響用戶(hù)的Facebook體驗(yàn),但公司從它們身上學(xué)到的東西可能會(huì)對(duì)多方面產(chǎn)生影響。
機(jī)器人技術(shù)作為Facebook的一個(gè)全新研究領(lǐng)域,對(duì)人工智能和前沿研究的依賴(lài)是眾所周知的。可以說(shuō)人工智能的機(jī)制控制著機(jī)器人的各項(xiàng)機(jī)能,從相機(jī)效果到限制內(nèi)容的自動(dòng)調(diào)節(jié)。
人工智能和機(jī)器人是自然重疊的領(lǐng)域,其中一個(gè)領(lǐng)域的進(jìn)步往往也能在另一個(gè)領(lǐng)域帶來(lái)全新發(fā)展。而Facebook對(duì)在現(xiàn)實(shí)和社交媒體世界中使用人工智能完成任務(wù)有著十分濃厚的興趣,因此它希望涉足機(jī)器人技術(shù)以挖掘人工智能的洞察力也就不足為奇了。
那么,它目前宣布的機(jī)器人技術(shù)項(xiàng)目有哪些廣泛的應(yīng)用呢?
從零開(kāi)始學(xué)走路
行走是一個(gè)非常復(fù)雜的動(dòng)作,尤其是有六條腿的時(shí)候,就像這個(gè)實(shí)驗(yàn)中使用的機(jī)器人。
研究人員可以設(shè)定它應(yīng)該如何移動(dòng)雙腿向前,轉(zhuǎn)身等等,但這有點(diǎn)像作弊,不是嗎?畢竟我們?nèi)祟?lèi)必須自己學(xué)習(xí)行走,并沒(méi)有什么說(shuō)明書(shū)或設(shè)置可以導(dǎo)入。
因此,研究小組打算讓機(jī)器人自學(xué)走路。這其實(shí)并不是一項(xiàng)新型的研究,很多機(jī)器人學(xué)家和人工智能研究人員都參與其中。
通過(guò)給機(jī)器人一些基本的優(yōu)先權(quán),比如只要它向前移動(dòng)就可以獲得相應(yīng)“獎(jiǎng)勵(lì)”。但沒(méi)有真正操縱其肢體的設(shè)置,團(tuán)隊(duì)只是不斷讓它嘗試不同的方式,慢慢地學(xué)習(xí)并改進(jìn)它移動(dòng)的模型。目標(biāo)是讓機(jī)器人從零開(kāi)始學(xué)習(xí)走路到能夠穩(wěn)定行走的時(shí)間能夠縮短到數(shù)周到數(shù)小時(shí)不等。
這對(duì)Facebook有什么用呢?
眾所周知,F(xiàn)acebook是一個(gè)龐大的數(shù)據(jù)庫(kù),結(jié)構(gòu)相當(dāng)復(fù)雜。雖然學(xué)習(xí)管理一個(gè)數(shù)據(jù)網(wǎng)絡(luò)與學(xué)習(xí)管理一個(gè)機(jī)器人是非常不同的,但是系統(tǒng)在給定一些簡(jiǎn)單規(guī)則和目標(biāo)后,短時(shí)間內(nèi)自學(xué)基礎(chǔ)知識(shí)的方式是相通的。
學(xué)習(xí)人工智能系統(tǒng)如何自學(xué),以及如何消除諸錯(cuò)誤的優(yōu)先級(jí)、規(guī)則欺騙、奇怪的數(shù)據(jù)存儲(chǔ)習(xí)慣等障礙,對(duì)于那些在現(xiàn)實(shí)和虛擬世界中的算法來(lái)說(shuō)是很重要的。
也許下一次Facebook需要在其平臺(tái)上監(jiān)控人道主義危機(jī)時(shí),有助于監(jiān)控的人工智能模型將從這里出現(xiàn)的自動(dòng)學(xué)習(xí)機(jī)器人中得到啟發(fā)。
利用好奇心
這項(xiàng)研究聽(tīng)上去并不是那么直觀,但每個(gè)人都有一定程度的好奇心,雖然俗話(huà)說(shuō):好奇心害死貓。
但大多數(shù)時(shí)候它是一種驅(qū)使我們更有效地學(xué)習(xí)的動(dòng)力,F(xiàn)acebook將好奇心的概念應(yīng)用于執(zhí)行各種日常任務(wù)的機(jī)械臂。
給機(jī)械臂灌輸“好奇心”似乎很奇怪,但在這種情況下,這個(gè)名詞的意思是說(shuō),負(fù)責(zé)手臂的人工智能,無(wú)論是觀察還是決定如何抓握,還是確定移動(dòng)速度的過(guò)程,都被賦予了減少動(dòng)作不確定性的動(dòng)機(jī)。
這意味著很多事情:也許在識(shí)別物體的時(shí)候稍微扭轉(zhuǎn)一下相機(jī),會(huì)讓它有一點(diǎn)更好的視野,提高它識(shí)別物體的信心;也許它會(huì)先查看目標(biāo)區(qū)域,來(lái)檢查距離并確保沒(méi)有障礙物。
不管是什么情況,給予人工智能自由尋找增強(qiáng)信心的行動(dòng),終可能會(huì)讓它更快地完成任務(wù),即使在開(kāi)始時(shí),它可能會(huì)因?yàn)?ldquo;好奇心”放慢進(jìn)程。
這對(duì)Facebook有什么用呢?
Facebook在計(jì)算機(jī)視覺(jué)方面一直走在前列,正如我們?cè)谒南鄼C(jī)和圖像處理程序以及Portal等設(shè)備上看到的那樣,Potal會(huì)用它的“臉”跟著用戶(hù)在房間里轉(zhuǎn)來(lái)轉(zhuǎn)去。
雖然聽(tīng)上去有些驚悚,但是好奇心對(duì)于這些需要了解他們所看到或感覺(jué)到的環(huán)境才能正常工作的應(yīng)用程序來(lái)說(shuō)都是至關(guān)重要的。
任何在應(yīng)用程序或設(shè)備上運(yùn)行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當(dāng)一張臉進(jìn)入畫(huà)面時(shí),十幾個(gè)新的算法就會(huì)同時(shí)啟動(dòng)并開(kāi)始工作。如果有人舉起一個(gè)物體,攝像頭就會(huì)忙著分析:它有文字內(nèi)容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠(yuǎn)?
如果設(shè)備要及時(shí)完成這些任務(wù),就會(huì)產(chǎn)生CPU使用率峰值、可見(jiàn)延遲以及用戶(hù)或系統(tǒng)工程師不希望出現(xiàn)的種種情況。
相反,如果人工智能助理在對(duì)場(chǎng)景感到不確定性時(shí),發(fā)揮它的好奇心去檢查這些東西,確定分析物體的優(yōu)先級(jí),是個(gè)相當(dāng)不錯(cuò)的折衷辦法。
通過(guò)觸摸感知
盡管視覺(jué)很重要,但它不是我們或機(jī)器人感知世界的方式。許多機(jī)器人都配備了運(yùn)動(dòng)、聲音和其他形式的傳感器,但對(duì)物體的實(shí)際接觸相對(duì)較少。我們可以把它歸因于缺乏良好的觸覺(jué)接口。
盡管如此,F(xiàn)acebook的研究人員還是想研究使用觸覺(jué)數(shù)據(jù)代替視覺(jué)數(shù)據(jù)的可能性。
仔細(xì)想想,這完全是正常的,就像有視覺(jué)障礙的人用觸覺(jué)來(lái)了解周?chē)沫h(huán)境,獲取關(guān)于物體的細(xì)節(jié)。
因此,F(xiàn)acebook的研究人員部署了一個(gè)人工智能模型,機(jī)器人根據(jù)視頻來(lái)決定采取什么行動(dòng),但不是實(shí)際的視頻數(shù)據(jù),而是給它輸入高分辨率的觸摸數(shù)據(jù)。
結(jié)果表明,該算法并不真正關(guān)心它是否像我們平時(shí)觀察世界的圖像,只要數(shù)據(jù)是以視覺(jué)方式呈現(xiàn)的,例如作為觸覺(jué)傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對(duì)Facebook有什么用呢?
雖然Facebook對(duì)用戶(hù)接觸并沒(méi)有多大興趣。但這不僅僅是接觸的問(wèn)題,而是跨模式應(yīng)用學(xué)習(xí)。
試想你次看到兩個(gè)不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來(lái)。為什么會(huì)這樣?
因?yàn)楫?dāng)你看到某個(gè)東西時(shí),你不只是觀察到它的樣子,還構(gòu)想了一個(gè)內(nèi)部模型來(lái)表示它,包含了多種感官和視角。
類(lèi)似地,人工智能助理可能需要將其學(xué)習(xí)的內(nèi)容從一個(gè)領(lǐng)域轉(zhuǎn)移到另一個(gè)領(lǐng)域,比如說(shuō)聽(tīng)覺(jué)數(shù)據(jù)告訴握力傳感器如何握緊物體,或者視覺(jué)數(shù)據(jù)告訴麥克風(fēng)如何分離聲音。
現(xiàn)實(shí)世界是一個(gè)復(fù)雜的環(huán)境,這里的數(shù)據(jù)更嘈雜,信息量更大。無(wú)論數(shù)據(jù)類(lèi)型如何,都能夠利用這些數(shù)據(jù)對(duì)于可靠理解和與現(xiàn)實(shí)交互非常重要。
所以你會(huì)發(fā)現(xiàn),這些研究本有趣,而且事實(shí)上也很重要。正如描述這項(xiàng)研究的博客文章所言:“我們專(zhuān)注于使用機(jī)器人技術(shù),這不僅會(huì)生產(chǎn)出更有能力的機(jī)器人,還將在未來(lái)數(shù)年或者數(shù)十年內(nèi)挑戰(zhàn)人工智能的極限。如果我們想要更接近像人類(lèi)那樣思考、計(jì)劃和推理的機(jī)器,那么我們需要構(gòu)建人工智能系統(tǒng),使其能夠在多種場(chǎng)景中自主學(xué)習(xí),不僅僅是在虛擬的數(shù)字世界。”
隨著各大網(wǎng)絡(luò)社交媒體不斷擴(kuò)大其影響力,其應(yīng)用程序和服務(wù)的的范圍涉及日常生活的方方面面,它對(duì)人工智能助力的要求也就越來(lái)越復(fù)雜。
雖然我們不會(huì)很快看到一個(gè)“Facebook機(jī)器人”,但未來(lái)可期。
(原標(biāo)題:Facebook研究機(jī)器人,是打的什么算盤(pán)?)