如今,隨著新一代科技革命和產(chǎn)業(yè)變革的到來(lái),人工智能技術(shù)愈發(fā)受到了越來(lái)越多國(guó)家和企業(yè)的青睞。今年以來(lái),我國(guó)連續(xù)第三次將人工智能寫入政府工作報(bào)告之中,且提出“智能+”新概念;國(guó)內(nèi)35所高校成功建設(shè)人工智能相關(guān)專業(yè)和學(xué)院;以及人社部等三部門發(fā)布人工智能有關(guān)新職業(yè),無(wú)不推動(dòng)了人工智能建設(shè)的提速發(fā)展。
而作為人工智能重要分支之一,AI語(yǔ)音技術(shù)也在這樣積極向上的大環(huán)境中迎來(lái)了快速崛起。目前,除了傳統(tǒng)意義上的AI語(yǔ)音識(shí)別、AI語(yǔ)音服務(wù)等之外,又誕生出了AI語(yǔ)音合成、AI語(yǔ)音辨人等新突破和新應(yīng)用。其中,AI語(yǔ)音合成由于在應(yīng)用上的“善惡難定”,更是引發(fā)了人們的廣泛關(guān)注和爭(zhēng)議。
AI語(yǔ)音合成技術(shù)發(fā)展迅猛
眾所周知,交流和交互的方式有很多種,比如語(yǔ)言、文字、圖像、動(dòng)作等等。在人機(jī)交互方面,從上世紀(jì)70年代開(kāi)始,人類便在不斷探索便捷、自然的交流方式,不管是計(jì)算機(jī)時(shí)代的鍵盤打字,還是智能手機(jī)時(shí)代的觸摸屏,都是對(duì)應(yīng)時(shí)代的潮流創(chuàng)新式探索。而如今,顯然輪到了AI語(yǔ)音技術(shù)。
據(jù)了解,語(yǔ)音交互對(duì)人機(jī)語(yǔ)音通信的作用主要依賴兩方面技術(shù),其一是語(yǔ)音識(shí)別技術(shù),其二便是語(yǔ)音合成技術(shù)。和語(yǔ)音識(shí)別相比,目前語(yǔ)音合成的技術(shù)相對(duì)說(shuō)來(lái)要成熟一些,并已開(kāi)始向產(chǎn)業(yè)化方向成功邁進(jìn),大規(guī)模應(yīng)用指日可待。不過(guò),AI與語(yǔ)音合成的融合發(fā)展尚處于起步探索階段。
在此過(guò)程中,以科大訊飛、阿里、百度、搜狗、谷歌等為代表的一大批先進(jìn)科技企業(yè),都在助推AI語(yǔ)音合成技術(shù)的穩(wěn)步突破。
比如2018年,谷歌便隆重推出了一款A(yù)I語(yǔ)音合成器,作為其機(jī)器學(xué)習(xí)云工具套件的一部分,該合成器能滿足任何開(kāi)發(fā)人員和企業(yè)的語(yǔ)音合成需求。此外,今年阿里達(dá)摩院也再度秀出了新型的AI語(yǔ)音合成技術(shù),不僅定制成本降低了10倍,同時(shí)能夠讓企業(yè)與個(gè)人定制其專屬“AI聲音”。
總的來(lái)說(shuō),在各大科技巨頭的加速布局與持續(xù)突破下,目前AI語(yǔ)音合成在技術(shù)上已經(jīng)取得了不小成果,商業(yè)化應(yīng)用探索也開(kāi)始逐步啟動(dòng),發(fā)展速度令人咋舌。未來(lái),隨著應(yīng)用的日漸成熟,產(chǎn)品大規(guī)模進(jìn)入市場(chǎng),AI語(yǔ)音技術(shù)走進(jìn)人們的日常生產(chǎn)和生活指日可待。
現(xiàn)實(shí)生活中應(yīng)用愈發(fā)廣泛
那么,AI語(yǔ)音合成技術(shù),到底能在哪些領(lǐng)域獲得應(yīng)用呢?
從當(dāng)前來(lái)看,AI語(yǔ)音合成能落地的領(lǐng)域著實(shí)不少,比如影視娛樂(lè)、汽車行業(yè)、銷售服務(wù)行業(yè)等等。其中,在影視娛樂(lè)方面,2017年以來(lái)我國(guó)已經(jīng)利用AI語(yǔ)音合成技術(shù)打造了《創(chuàng)新中國(guó)》等創(chuàng)新性的節(jié)目,由人工智能合成配音的紀(jì)錄片打破了人們的固有印象,原來(lái)除了指令語(yǔ)和提示音,AI加語(yǔ)音還能夠合成出如此惟妙惟肖的自然聲音。
與此同時(shí),我國(guó)還利用AI語(yǔ)音合成讓那些曾經(jīng)美好但卻已逝去的聲音重返人間。2016年的百度世界大會(huì)上,百度大腦便利用情感語(yǔ)音合成技術(shù)再現(xiàn)了港星張國(guó)榮的聲音,讓觀眾與已在天堂的“哥哥”來(lái)了場(chǎng)“隔空對(duì)話”。此外,央視也通過(guò)人工智能技術(shù)模擬《焦點(diǎn)訪談》主播員李易嗓音,讓人聽(tīng)后好評(píng)如潮。
而在汽車行業(yè),在人們聽(tīng)?wèi)T了一眾林志玲、郭德綱等導(dǎo)航的聲音之后,AI語(yǔ)音合成技術(shù)無(wú)疑帶來(lái)了更多的選擇。就像阿里推出的新一代語(yǔ)音合成技術(shù)KAN-TTS,將其應(yīng)用到汽車導(dǎo)航之中,人們便能夠獲得定制化的導(dǎo)航提示聲音,這進(jìn)一步豐富了大家的出行體驗(yàn)和生活趣味性。
除此之外,利用AI語(yǔ)音合成的聲音應(yīng)用在客服、教育、銷售等方面,都能大大提高用戶體驗(yàn)和人機(jī)交互感受。由此可見(jiàn),AI語(yǔ)音合成的確大有用武之地!
行善or作惡引發(fā)人們爭(zhēng)議
當(dāng)然,作為一項(xiàng)剛剛興起缺乏監(jiān)管的創(chuàng)新性技術(shù),其負(fù)面應(yīng)用也有不少,比如有人借助該技術(shù)進(jìn)行詐騙,也有人利用該技術(shù)進(jìn)行惡搞......這些應(yīng)用不僅侵犯了人們的名譽(yù)和財(cái)產(chǎn),同時(shí)也危害了大家的隱私和信息安全,令人倍感煩惱。
行善還是作惡?這一問(wèn)題困擾著人們對(duì)于AI語(yǔ)音合成應(yīng)用的看法。
但其實(shí),就像硬幣有兩面、利劍有雙刃一樣,任何技術(shù)都有善惡之用,關(guān)鍵在于使用的人和是否有良好的監(jiān)管?;诖耍珹I語(yǔ)音合成技術(shù)也是這樣,只有培養(yǎng)了人們對(duì)技術(shù)的正確認(rèn)識(shí),加強(qiáng)了對(duì)技術(shù)研發(fā)和應(yīng)用的完善監(jiān)管,才能讓該技術(shù)趨利避害、實(shí)現(xiàn)善用。
今年4月份,政府在《民法典人格權(quán)編(草案)》里加了這樣一條規(guī)定:任何組織和個(gè)人不得以利用信息技術(shù)手段偽造的方式侵害他人的肖像權(quán)。也就是說(shuō),政府對(duì)于AI語(yǔ)音合成技術(shù)的監(jiān)管正在變得完善。
而未來(lái),隨著更加明確規(guī)范AI新產(chǎn)品和應(yīng)用的專項(xiàng)法律的陸續(xù)出臺(tái),AI語(yǔ)音合成的應(yīng)用可能將變得更加向善行善,我們對(duì)此滿懷期待!