国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:星火再進化,科大訊飛智駕方案新鮮出爐

      星火再進化,科大訊飛智駕方案新鮮出爐

      2023-10-31 13:36:37來源:蓋世汽車 關鍵詞:大模型車載音頻系統(tǒng)閱讀量:24093

      導讀:以數(shù)據(jù)驅動為開發(fā)模式的自動駕駛發(fā)展階段,大模型賦能自動駕駛在車端、云端實現(xiàn)端到端的平臺管理,在數(shù)據(jù)采集標注、仿真、算法優(yōu)化等各個層面賦能自動駕駛發(fā)展,科大訊飛這類的大模型AI廠商,或將迎來時代機遇。
        “從ChatGPT發(fā)布至今短短不到一年的時間,人工智能企業(yè)、大模型廠商以及社會各界風起云涌,在不到一年時間內,我們欣喜地看到,大模型正日益深入地跟每個人息息相關。”在10月20日舉辦的2023科大訊飛全球1024開發(fā)者大會上,科大訊飛董事長劉慶峰感嘆到。
       
        ChatGPT的出現(xiàn)引爆了一場人工智能的狂歡,各方勢力紛紛下場,開啟“百模大戰(zhàn)”。今年5月6日,訊飛星火認知大模型V1.0發(fā)布時,科大訊飛定下了今年的三個發(fā)展目標:6月9日,突破開放式問答、多輪對話能力明顯提升、數(shù)學能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升;10月24日,實現(xiàn)通用模型對標ChatGPT,并在教育、醫(yī)療等領域做到業(yè)界領先。
       
        10月24日,科大訊飛如期交出成績單。訊飛星火認知大模型V3.0正式發(fā)布,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)能力方面都有所提升。
       
        此外,訊飛聯(lián)合行業(yè)龍頭共同發(fā)布12個行業(yè)大模型,加速產(chǎn)業(yè)落地。其自主創(chuàng)新的大模型算力平臺已經(jīng)啟動。訊飛聯(lián)合昇騰生態(tài)共同發(fā)布“飛星一號”大模型算力平臺,并啟動對標GPT-4的更大參數(shù)規(guī)模的星火大模型訓練。
       
        此次開發(fā)者大會上,劉慶峰定下了一個新目標:2024年上半年,訊飛星火將實現(xiàn)對標GPT-4。在劉慶峰看來,這不僅僅是一個簡單的技術對標問題,“我們要走出自己的技術路線,走出自己的產(chǎn)業(yè)方向,形成自己完整的生態(tài)。從這個角度來說,大模型時代的序幕才剛剛拉開!”劉慶峰說到。
       
        而對于汽車行業(yè)來說,大模型上車的步伐也才剛剛拉開。
       
        訊飛智駕方案新鮮出爐
       
        人們對于大模型賦能汽車的想象空間主要集中在幾個方面:一是伴隨著大模型在深度理解、邏輯推理、情感捕捉等方面的進步,打造類人的座艙交互體驗。二是依托大模型,通過多模態(tài)融合等人工智能技術,進一步助力智能駕駛發(fā)展。此外,還有大模型會帶來更廣泛的應用生態(tài),以及促進“軟件定義汽車”的發(fā)展等。
       
        10月24日,科大訊飛同步召開以“釋放想象力·智能新出行”為主題的智能汽車新品發(fā)布會,會上,科大訊飛發(fā)布了基于訊飛星火V3.0的座艙、音效、智駕三大方向的產(chǎn)品升級。
       
        大模型的理解、推理、表達和多模態(tài)知識學習等能力給自動駕駛帶來了更多新的技術思路,基于訊飛星火認知大模型,科大訊飛發(fā)布了兩款行泊一體智駕解決方案——智駕STD和智駕PRO,配備增強型高速NOA(HNOA)、記憶行車和記憶泊車等功能。
       
        對于大模型如何提升自動駕駛能力,行業(yè)還在探索初期,在科大訊飛看來,大模型利用海量數(shù)據(jù)以及駕駛領域知識的強化,可以用于自動駕駛場景數(shù)據(jù)以及駕駛策略的生成,并支持以交互的方式增強對基礎駕駛模型的理解。
       
        基于此,科大訊飛自研了從深度學習訓練到模型調優(yōu)量化、模型推理部署的全棧工具鏈,并打造了智駕應用開發(fā)框架和中間件,支撐跨平臺算法快速移植,以及自研4D重建與自動標注系統(tǒng)提升標注的效率和質量。
       
        星火大模型將從技術架構層面賦能BEV+transformer智駕感知大模型的研發(fā),意圖解決智能駕駛當前存在的感知不精準、決策不智能、長尾不收斂三大技術難題。
       
        據(jù)訊飛介紹,通過統(tǒng)一的BEV+Transformer網(wǎng)絡,可以實現(xiàn)多模態(tài)、多任務、長時序4D感知等能力。此外,科大訊飛還開發(fā)了基于機器學習的超聲波感知算法應用,提升感知準確性和泛化性。
       
        重感知正成為當下推動高階輔助駕駛快速落地的一大趨勢,視覺感覺的技術也在加速發(fā)展。機器視覺是科大訊飛2030Top計劃的核心,在自動駕駛對視覺依賴越來越強的今天,科大訊飛依托在機器視覺方面的積累和投入打造智駕方案。
       
        科大訊飛智能汽車事業(yè)部副總經(jīng)理李衛(wèi)兵認為,視覺感知技術能夠加速智能駕駛落地,具有輕地圖、重感知、低成本、快落地等特點。
       
        科大訊飛的兩款智駕方案,其中智駕STD算力為15TOPS,憑借6個攝像頭、5個毫米波雷達和12個超聲波雷達,能夠實現(xiàn)基礎ADAS、自動泊車(APA)、高速NOA、記憶泊車等在內的32項功能點。智駕PRO算力為50TOPS,硬件方案為11個攝像頭、5個毫米波雷達和12個超聲波雷達,支持的功能點達40項。
       
        AI算法研發(fā)能力、完整的數(shù)據(jù)閉環(huán)云平臺、工程技術能力等,是科大訊飛行泊一體智駕解決方案的支撐,科大訊飛在此基礎上打造車云一體的智駕研發(fā)體系。
       
        具體來看,科大訊飛通過算法迭代提供基礎設施支撐和數(shù)據(jù)服務,打造功能平臺為安全研發(fā)優(yōu)化神經(jīng)網(wǎng)絡推理提供數(shù)據(jù),保證其模型的訓練的效率和訓練的質量。同時科大訊飛將會增建百輛規(guī)模的算法研發(fā)測試數(shù)據(jù)回流的開發(fā)平臺等。
       
        在智駕領域,科大訊飛除提供行泊一體智駕解決方案外,另有四大服務:采集服務、數(shù)據(jù)服務、標注服務、訓練服務。
       
        以數(shù)據(jù)標注為例,自動駕駛所需標注的數(shù)據(jù)類型呈現(xiàn)多樣化,數(shù)據(jù)數(shù)量也在呈現(xiàn)指數(shù)級的提升。然而,目前普遍存在的問題是標注數(shù)據(jù)的準確性較低及綜合成本較高。
       
        用人工標注的數(shù)據(jù)去訓練云端大平臺,再用訓練過后的云端大平臺去協(xié)助進行自動標注,結合少量的質檢和人工調整,能生成更多的標注數(shù)據(jù),形成正向循環(huán),逐步用來提升感知大模型的自動標注的程度和效果,并進一步的降低成本??拼笥嶏w自研4D重建與自動標注系統(tǒng),以提升標注效率和質量。
       
        “未來我們結合大模型的精準的識別能力,數(shù)據(jù)挖掘能力和強大的生成能力,進一步豐富我們的仿真場景,構建更接近現(xiàn)實的仿真環(huán)境,以大幅提升我們算法的迭代效率,支撐整個智駕系統(tǒng)的快速高效的進化。”李衛(wèi)兵說到。
       
        李衛(wèi)兵指出,智能汽車這個新物質的本質需求在不斷的進化。要能夠做到全生命周期的持續(xù)迭代OTA,需要Tier 1方案提供商有強大的技術實力,堅定的長期戰(zhàn)略。在李衛(wèi)兵看來這也不是一般的小公司能夠做得到。
       
        以數(shù)據(jù)驅動為開發(fā)模式的自動駕駛發(fā)展階段,大模型賦能自動駕駛在車端、云端實現(xiàn)端到端的平臺管理,在數(shù)據(jù)采集標注、仿真、算法優(yōu)化等各個層面賦能自動駕駛發(fā)展,科大訊飛這類的大模型AI廠商,或將迎來時代機遇。
       
        大模型與智能座艙,碰撞出更多火花
       
        大模型在智能座艙領域的應用已有一些產(chǎn)品出現(xiàn),科大訊飛將訊飛星火V3.0與智能座艙進一部結合,面向多樣化的汽車使用場景,推出星火座艙OS、星火汽車APP和星火座艙域控三大產(chǎn)品,支持實時檢索,可以實現(xiàn)插件化調度,并集成了多模態(tài)生成的能力,目的是為合作伙伴提供自主可控、組件化、更開放的座艙解決方案。
       
        大模型上車的一個典型應用是助力實現(xiàn)對話式交互,為車輛的駕駛出行、導航、娛樂等環(huán)節(jié)提供強大的支持,使駕駛員和車輛之間的交流更為自然流暢。這種新型的交互方式正在改變著人們對于汽車智能座艙的認知。
       
        科大訊飛介紹到,在過去,人們常常將車機屏幕視為車內的一個平板電腦,然而,隨著對話式交互的出現(xiàn),人們開始意識到汽車智能座艙可以提供更多的可能性。
       
        據(jù)悉,星火座艙OS包括星火汽車助理和星火場景應用兩大部分,語音合成MOS>4.6,大模型業(yè)務貫穿支持十輪以上的上下文語義繼承,新增實時檢索能力。借力大模型賦能,星火座艙OS打造了多個沉浸式的使用場景,并支持自定義,一句話生成復雜場景,觸達200+車控動作。
       
        至于星火汽車APP則是圍繞用車場景打造的多樣化大模型車端應用,涵蓋用車顧問、兒童故事、口語陪練、心靈SPA、旅行伙伴等等。
       
        座艙體驗的很大組成部分在于其內容、應用生態(tài),科大訊飛除了基于其自研的兒童教育、K12教育、音娛資源、聽見會議以及訊飛翻譯五大自建生態(tài)資源外,訊飛星火大模型賦能的智能座艙已經(jīng)與支付寶、咪咕文娛、騰訊音樂、喜馬拉雅、高德、火山引擎、雷石、能鏈、喜泊客等九家企業(yè)開展了深度生態(tài)合作,以滿足車主多元化需求。此外,科大訊飛智能座艙還與百余家企業(yè)生態(tài)積極合作,期望以豐富全面的軟件生態(tài)賦能智能座艙。
       
        星火座艙域控是科大訊飛打造的智能化AI底座,面向行業(yè)輸出兼容核心AI算法的“核心板”,基于全棧的座艙AI算法和結合芯片的異構算法優(yōu)勢實現(xiàn)芯算融合,SOC算力消耗降低10%。
       
        科大訊飛智能汽車事業(yè)部副總裁和衛(wèi)民表示,是否具備AI算力或NPU加速能力是座艙域控開發(fā)的核心競爭力。“我們的目標是基于星火座艙域控方案,可以提供給Tier 1或車企一個平臺,讓其可以開發(fā)自己的差異化應用,讓大家以最小的資源,最快的時間,更好的做產(chǎn)品的差異化。”和衛(wèi)民說到。
       
        車載音效,還有更多玩法
       
        作為駕駛場景下最安全和高效的交互方式,聽覺感官在車內備受關注,用戶對汽車場景下的聽感品質要求逐漸提高,對高級別車載音響系統(tǒng)的需求也在持續(xù)增長,
       
        特別是隨著自動駕駛技術的發(fā)展,人們在車里面的精力被釋放出來,有更多的機會可以去學習、工作、娛樂和休息。現(xiàn)在智能座艙的發(fā)展,有很多應用場景與音效息息相關,諸如K歌、會議、看視頻等,要想打造沉浸式的體驗,車載音效的設計也必須與時俱進,從單一維度向多維度發(fā)展,從單一場景向多場景延伸。
       
        這為汽車音效品牌實現(xiàn)智能化提供了新的機遇。當下無論是新老品牌都在積極推動著智能化產(chǎn)業(yè)升級。
       
        科大訊飛在智能音效領域算是老玩家了,其認為車載音頻系統(tǒng)的發(fā)展可分為三個階段:第一個階段,1930-1984年,是基礎音效階段,包含收音機、磁帶機等產(chǎn)品;第二個階段,1994-2016年,環(huán)繞音效體驗階段,涵蓋模擬功放、數(shù)字功放等產(chǎn)品;第三個階段,2021年往后,車載音頻系統(tǒng)開始進入多維表達與全場景覆蓋的階段,標志性產(chǎn)品便是智能音效管理系統(tǒng)。
       
        科大訊飛給汽車智能音效也做了一個分級,與自動駕駛類似,從L1到L5,對應著從基礎音效、基礎功能到身臨其境的極致體驗。
       
        兩年前,科大訊飛在廣州發(fā)布了提供16個以上通道、20個以上揚聲器的智能車載音頻系統(tǒng),開始進入L3階段。此次,科大訊飛有發(fā)布了支持24個通道、30個以上揚聲器,具有更強大的AI技術加持的新一代音頻管理系統(tǒng)。
       
        為了適配不同級別的車型,科大訊飛推出了靈活的軟硬一體平臺,分別是iFlySound STD平臺、iFlySound PRO平臺、iFlySound PLUS平臺。其iFlySound Plus 24ch功放硬件平臺,將基于應用場景的交互、聽感、內容、顯示與車控深度融合。
       
        據(jù)介紹,在硬件層面,iFlySound Plus24ch功放硬件平臺使用高性能浮點DPS,擁有最高2GHZ*2的高速音頻處理加速器和128通道數(shù)字音頻處理能力,可以獲得24bit 96kHz的HD Audio支持,并且兼容未來E-E架構。同時,科大訊飛在保證性能的前提下,降低了硬件的尺寸和重量,實現(xiàn)“小型化輕量化”。
       
        在軟件算法層面,基于科大訊飛自研技術,當前已具備3D環(huán)繞、聲場分區(qū)、車內交流償、車載K歌和大模型音效等多個音效算法。以此為基礎,科大訊飛推出了基于持續(xù)豐富的聲音庫、聲浪庫、音效庫、功能庫的訂閱模式。
       
        論大模型如何提升音效體驗,科大訊飛做出一些嘗試。在調音層面,科大訊飛基于大模型聲學理論體系實現(xiàn)人機耦合,端云協(xié)同AI調音,基于iFlyDSP GUI工具,無需代碼更改,可以快速完成定制需求,價值全自研MCU基礎軟件架構,可使跨平臺代碼復用度超70%,基于此適配不同定位和級別的車型。
       
        “未來,我們可以通過車內設備來采集整車的環(huán)境,上傳到云端,在云端的話我們會有深度學習的大模型,能夠對車載環(huán)境進行深入分析,并且結合車型本身的音效綜合定位來進行自動化調音,可以完成調音師70%以上的技術性工作,確保在降低成本、提高效率情況下,滿足調音流程的標準化。”科大訊飛蘇研院常務副院長、科大訊飛汽車事業(yè)部副總經(jīng)理支洪平說到。
       
        據(jù)悉,當前,科大訊飛車載音效產(chǎn)品已獲得國內13家主流車企平臺化項目定點,合作車型超過30款。
       
        結語
       
        在智能汽車領域,“大模型上車”已經(jīng)成為一種趨勢,它將為智能座艙、自動駕駛帶來更多的智能化、個性化、高效化的特點,提升用戶的使用體驗。
       
        隨著技術的不斷進步和應用場景的不斷擴展,“大模型上車”將會為智能汽車產(chǎn)業(yè)的發(fā)展和創(chuàng)新帶來更加廣闊的空間和機遇。
       
        更深層次的是,大模型將不僅聚焦具體的車端應用體驗,而是賦能整個汽車產(chǎn)業(yè)鏈條的發(fā)展,無論是生產(chǎn)、研發(fā)、營銷、售后等環(huán)節(jié),都有所助力,現(xiàn)在才只是剛剛開始。
      我要評論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

      所有評論僅代表網(wǎng)友意見,與本站立場無關。

      版權與免責聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-智能制造網(wǎng)合法擁有版權或有權使用的作品,未經(jīng)本站授權不得轉載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關法律責任。

      本站轉載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內容、版權等問題,請與本站聯(lián)系并提供相關證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機械包裝機械工程機械倉儲物流環(huán)保設備化工設備分析儀器工業(yè)機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

      我要投稿
      • 投稿請發(fā)送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時代智能制造領域“互聯(lián)網(wǎng)+”服務平臺
      智能制造網(wǎng)APP

      功能豐富 實時交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務

      微信公眾號

      關注我們

      抖音

      智能制造網(wǎng)

      抖音號:gkzhan

      打開抖音 搜索頁掃一掃

      視頻號

      智能制造網(wǎng)

      公眾號:智能制造網(wǎng)

      打開微信掃碼關注視頻號

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關注
      意見反饋
      我要投稿
      我知道了