国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:機(jī)器翻譯新突破,微軟中英新聞翻譯達(dá)人類水平

      機(jī)器翻譯新突破,微軟中英新聞翻譯達(dá)人類水平

      2018-03-16 09:10:25來源:雷鋒網(wǎng) 關(guān)鍵詞:機(jī)器翻譯微軟閱讀量:29785

      導(dǎo)讀:14日晚,微軟亞洲研究院與雷德蒙研究院的研究人員宣布,其研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上,達(dá)到了可與人工翻譯媲美的水平。
        【中國智能制造網(wǎng) 企業(yè)動(dòng)態(tài)】14日晚,微軟亞洲研究院與雷德蒙研究院的研究人員宣布,其研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上,達(dá)到了可與人工翻譯媲美的水平;這是在新聞報(bào)道的翻譯質(zhì)量和準(zhǔn)確率上可以比肩人工翻譯的翻譯系統(tǒng)。
       
        newstest2017測(cè)試集由來自產(chǎn)業(yè)界和學(xué)術(shù)界的團(tuán)隊(duì)共同開發(fā)完成,并于2017年在WMT17大會(huì)上發(fā)布。而新聞(news)測(cè)試集則是三類翻譯測(cè)試集中的一個(gè),其他兩類為生物醫(yī)學(xué)(biomedical)和多模式(multimodal)。
       
        四大技術(shù)
       
        我們知道,對(duì)于同一個(gè)意思人類可以用不同的句子來表達(dá),因此翻譯并沒有標(biāo)準(zhǔn)答案,即使是兩位專業(yè)的翻譯人員對(duì)于完全相同的句子也會(huì)有略微不同的翻譯,而且兩個(gè)人的翻譯都不錯(cuò)。微軟亞洲研究院副院長(zhǎng)、自然語言計(jì)算組負(fù)責(zé)人周明表示:“這也是為什么機(jī)器翻譯比純粹的模式識(shí)別任務(wù)復(fù)雜得多,人們可能用不同的詞語來表達(dá)完全相同的意思,但未必能準(zhǔn)確判斷哪一個(gè)更好。”
       
        這也是為什么科研人員在機(jī)器翻譯上攻堅(jiān)了數(shù)十年,甚至曾經(jīng)很多人都認(rèn)為機(jī)器翻譯永遠(yuǎn)不可能達(dá)到人類翻譯的水平。近兩年隨著深度神經(jīng)網(wǎng)絡(luò)的引入,機(jī)器翻譯的表現(xiàn)取得了很多顯著的提升,翻譯結(jié)果相較于以往的統(tǒng)計(jì)機(jī)器翻譯結(jié)果更加的自然流暢。
       
        據(jù)了解,在這次的工作中來自微軟亞洲研究院和雷德蒙研究院的三個(gè)研究組通過多次交流合作,將他們的研究工作相結(jié)合,再次更進(jìn)一步地提高了機(jī)器翻譯的質(zhì)量,其中用到的技術(shù)包括對(duì)偶學(xué)習(xí)(Dual Learning)、推敲網(wǎng)絡(luò)(Deliberation Networks)、聯(lián)合訓(xùn)練(Joint Training)和一致性規(guī)范(Agreement Regularization)等。
       
        對(duì)偶學(xué)習(xí),即利用任務(wù)的對(duì)偶結(jié)構(gòu)來進(jìn)行學(xué)習(xí)。例如,在翻譯領(lǐng)域,我們關(guān)心從英文翻譯到中文,也同樣關(guān)心從中文翻譯回英文。由于存在這樣的對(duì)偶結(jié)構(gòu),兩個(gè)任務(wù)可以互相提供反饋信息,而這些反饋信息可以用來訓(xùn)練深度學(xué)習(xí)模型。也就是說,即便沒有人為標(biāo)注的數(shù)據(jù),有了對(duì)偶結(jié)構(gòu)也可以做深度學(xué)習(xí)。另一方面,兩個(gè)對(duì)偶任務(wù)可以互相充當(dāng)對(duì)方的環(huán)境,這樣就不必與真實(shí)的環(huán)境做交互,兩個(gè)對(duì)偶任務(wù)之間的交互就可以產(chǎn)生有效的反饋信號(hào)。因此,充分地利用對(duì)偶結(jié)構(gòu),就有望解決深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的瓶頸——訓(xùn)練數(shù)據(jù)從哪里來、與環(huán)境的交互怎么持續(xù)進(jìn)行等問題。
       
        推敲網(wǎng)絡(luò)中的“推敲”二字可以認(rèn)為是來源于人類閱讀、寫文章以及做其他任務(wù)時(shí)候的一種行為方式,即任務(wù)完成之后,并不當(dāng)即終止,而是會(huì)反復(fù)推敲。微軟亞洲研究院機(jī)器學(xué)習(xí)組將這個(gè)過程沿用到了機(jī)器學(xué)習(xí)中。推敲網(wǎng)絡(luò)具有兩段解碼器,其中階段解碼器用于解碼生成原始序列,第二階段解碼器通過推敲的過程打磨和潤色原始語句。后者了解全局信息,在機(jī)器翻譯中看,它可以基于階段生成的語句,產(chǎn)生更好的翻譯結(jié)果。
       
        聯(lián)合訓(xùn)練可以認(rèn)為是從源語言到目標(biāo)語言翻譯(Source to Target)的學(xué)習(xí)與從目標(biāo)語言到源語言翻譯(Target to Source)的學(xué)習(xí)的結(jié)合。中英翻譯和英中翻譯都使用初始并行數(shù)據(jù)來訓(xùn)練,在每次訓(xùn)練的迭代過程中,中英翻譯系統(tǒng)將中文句子翻譯成英文句子,從而獲得新的句對(duì),而該句對(duì)又可以反過來補(bǔ)充到英中翻譯系統(tǒng)的數(shù)據(jù)集中。同理,這個(gè)過程也可以反向進(jìn)行。這樣雙向融合不僅使得兩個(gè)系統(tǒng)的訓(xùn)練數(shù)據(jù)集大大增加,而且準(zhǔn)確率也大幅提高。
       
        一致性規(guī)范,即翻譯結(jié)果可以從左到右按順序產(chǎn)生,也可以從右到左進(jìn)行生成。該規(guī)范對(duì)從左到右和從右到左的翻譯結(jié)果進(jìn)行約束。如果這兩個(gè)過程生成的翻譯結(jié)果一樣,一般而言比結(jié)果不一樣的翻譯更加可信。這個(gè)約束,應(yīng)用于神經(jīng)機(jī)器翻譯訓(xùn)練過程中,以鼓勵(lì)系統(tǒng)基于這兩個(gè)相反的過程生成一致的翻譯結(jié)果。
       
        與人類比較
       
        由于機(jī)器翻譯沒有“正確的”翻譯結(jié)果,為了與人類的翻譯水平進(jìn)行比較,就必須嚴(yán)格地定義什么是與人類翻譯水平相當(dāng)。根據(jù)其發(fā)表的論文中表述,這種定義有兩種:
       
        1、如果一個(gè)具備雙語能力的人判斷人類輸出的譯文質(zhì)量與機(jī)器輸出的譯文質(zhì)量相當(dāng),則機(jī)器達(dá)到人類水平。
       
        2、如果機(jī)器翻譯系統(tǒng)在測(cè)試集上的譯文質(zhì)量得分(人工評(píng)分)與人類譯文得分沒有顯著差別,則機(jī)器達(dá)到人類水平。
       
        微軟選擇了第二種定義,因?yàn)檫@樣相對(duì)而言比較公平且有實(shí)際意義。
       
        newstest2017新聞報(bào)道測(cè)試集中共包括了約2000個(gè)句子,它們是由專業(yè)人員從在線報(bào)紙樣本翻譯而來。
       
        微軟團(tuán)隊(duì)對(duì)測(cè)試集進(jìn)行了多輪評(píng)估,每次評(píng)估會(huì)隨機(jī)挑選數(shù)百個(gè)句子進(jìn)行翻譯。
       
        隨后,為了驗(yàn)證微軟的機(jī)器翻譯是否達(dá)到了人類翻譯水平,微軟從外部聘請(qǐng)了一群雙語語言顧問,讓他們對(duì)微軟的翻譯結(jié)果和人工的翻譯進(jìn)行比較和評(píng)分,結(jié)果顯示:微軟的系統(tǒng)(Combo-4, 5, 6)已經(jīng)與人類翻譯(Reference-HT)無顯著差別,遠(yuǎn)遠(yuǎn)超過Reference-PE(人類翻譯—基于機(jī)器翻譯后的編輯)以及Reference-WMT。
       
        任重而道遠(yuǎn)
       
        對(duì)于這項(xiàng)結(jié)果,來自微軟的研究人員卻表現(xiàn)地極為自然。
       
        微軟技術(shù)院士黃學(xué)東告訴記者:
       
        “在機(jī)器翻譯方面達(dá)到與人類相同的水平是所有人的夢(mèng)想,我們沒有想到這么快就能實(shí)現(xiàn)。消除語言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力。”
       
        微軟機(jī)器翻譯團(tuán)隊(duì)研究經(jīng)理Arul Menezes表示:
       
        “團(tuán)隊(duì)想要證明的是:當(dāng)一種語言對(duì)(比如中-英)擁有較多的訓(xùn)練數(shù)據(jù),且測(cè)試集中包含的是常見的大眾類新聞詞匯時(shí),那么在人工智能技術(shù)的加持下機(jī)器翻譯系統(tǒng)的表現(xiàn)可以與人類媲美。”
       
        微軟亞洲研究院副院長(zhǎng)、自然語言計(jì)算組負(fù)責(zé)人周明則表示任重而道遠(yuǎn):
       
        “在WMT17測(cè)試集上的翻譯結(jié)果達(dá)到人類水平很鼓舞人心,但仍有很多挑戰(zhàn)需要我們解決,比如在實(shí)時(shí)的新聞報(bào)道上測(cè)試系統(tǒng)等。”
       
        而微軟亞洲研究院副院長(zhǎng)、機(jī)器學(xué)習(xí)組負(fù)責(zé)人劉鐵巖對(duì)技術(shù)的進(jìn)展表示樂觀:
       
        “我們不知道哪一天機(jī)器翻譯系統(tǒng)才能在翻譯任何語言、任何類型的文本時(shí),都能在“信、達(dá)、雅”等多個(gè)維度上達(dá)到專業(yè)翻譯人員的水準(zhǔn)。我們可以預(yù)測(cè)的是,新技術(shù)的應(yīng)用一定會(huì)讓機(jī)器翻譯的結(jié)果日臻完善。”
       
        據(jù)了解,此次的技術(shù)突破將很快應(yīng)用到微軟的商用多語言翻譯系統(tǒng)產(chǎn)品中,從而幫助其它語言或詞匯更復(fù)雜、更專業(yè)的文本實(shí)現(xiàn)更準(zhǔn)確、更地道的翻譯。此外,這些新技術(shù)還可以被應(yīng)用在機(jī)器翻譯之外的其他領(lǐng)域,催生更多人工智能技術(shù)和應(yīng)用的突破。
       
        (原標(biāo)題:機(jī)器翻譯新突破,微軟中英新聞翻譯達(dá)人類水平)
      我要評(píng)論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個(gè)字符)

      所有評(píng)論僅代表網(wǎng)友意見,與本站立場(chǎng)無關(guān)。

      版權(quán)與免責(zé)聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺(tái)或個(gè)人從本站轉(zhuǎn)載時(shí),必須保留本站注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯(cuò)過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機(jī)嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機(jī)械包裝機(jī)械工程機(jī)械倉儲(chǔ)物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機(jī)器人3D打印設(shè)備生物識(shí)別傳感器電機(jī)電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時(shí)代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
      智能制造網(wǎng)APP

      功能豐富 實(shí)時(shí)交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號(hào)

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號(hào):gkzhan

      打開抖音 搜索頁掃一掃

      視頻號(hào)

      智能制造網(wǎng)

      公眾號(hào):智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號(hào)

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了