AI已無處不在。其中,邊緣AI基于流量占用少、時延低、隱私性強等優(yōu)勢,也已被廣泛用于交通、醫(yī)療、智能零售、智能工廠、智能城市等各行各業(yè)。
4月9日,AMD(超威半導體)宣布擴展 AMD Versal™ 自適應片上系統(tǒng)(SoC)產(chǎn)品組合,推出全新第二代Versal AI Edge系列和第二代Versal Prime系列自適應SoC,為AI驅動型
嵌入式系統(tǒng)提供端到端加速。
據(jù)介紹,第二代Versal系列產(chǎn)品組合中的首批器件以第一代為基礎進行構建,具備強大的全新AI引擎,預計每瓦TOPS較之初代Versal AI Edge系列器件提升至多3倍,同時全新高性能集成Arm® CPU預計可提供比第一代Versal AI Edge和Versal Prime系列器件至高10倍的標量算力。
并且,第二代Versal系列器件將預處理、AI 推理與后處理集成于單器件中,能夠為AI驅動型嵌入式系統(tǒng)提供端到端加速。此外,其還平衡了性能、功耗、占板面積以及先進的功能安全與信息安全,提供的全新功能與特性支持為汽車、工業(yè)、視覺、醫(yī)療、廣播與專業(yè)音視頻市場設計高性能邊緣優(yōu)化型產(chǎn)品。
目前,斯巴魯已成為首批宣布計劃部署AMD第二代Versal AI Edge系列的客戶之一,為下一代EyeSight ADAS視覺系統(tǒng)提供支持。
為嵌入式系統(tǒng)帶來單芯片智能
在過去十余年時間里,數(shù)據(jù)經(jīng)歷了“野蠻式”增長,以物聯(lián)網(wǎng)感知為背景的應用程序運行和海量數(shù)據(jù)處理,疊加智能電動汽車走向中央集成式的電子電氣架構,傳統(tǒng)的云計算難以完全滿足毫秒級響應時間、安全性等高要求。也由此,邊緣計算應運而生,并愈發(fā)重要。
當然,高要求意味著更大的工作負載,當前邊緣AI也面臨著更多限制,包括功耗、尺寸、算力、安全與可靠性等多方面。
一般而言,由人工智能驅動的嵌入式系統(tǒng),首先要對數(shù)據(jù)進行預處理,包括傳感器的融合以及數(shù)據(jù)的交集;然后通過矢量處理器進行推斷;最后再利用高性能的嵌入式CPU進行后處理,這樣才可以通過推斷的結果做出決策。
AMD自適應與嵌入式計算事業(yè)部(AECG)Versal產(chǎn)品營銷總監(jiān)Manuel Uhm強調(diào),在預處理階段,必須要實現(xiàn)實時處理,這樣才可以真正做到整個系統(tǒng)的實時處理。而這就需要可編程邏輯。
“因為可編程邏輯無論是對于傳感器還是對于各種類型的接口,都可以非常靈活地去適應,做到真正的實時,同時還可以保證低時延、確定性,甚至可以在現(xiàn)場部署之后,還可以進行升級。”他進一步談到,在實時AI驅動嵌入式系統(tǒng)當中,三個步驟的算力都必須能夠加速,才能夠真正實現(xiàn)全系統(tǒng)的實時。
不過,Manuel Uhm指出,當前市面上還沒有一類處理器能夠針對三個階段直接完成優(yōu)化,多數(shù)采用多芯片的解決方案,然而這就會對整個嵌入式系統(tǒng)帶來一系列問題與限制。比如,更高的功率需求和供電復雜性,更高的占板面積和終端系統(tǒng)尺寸,更高的外部內(nèi)存需求和芯片間的凸性帶來的時延增加,更多的安全漏洞和報廢挑戰(zhàn),以及工作效率低下等。
這也是AMD此次推出第二代Versal自適應SoC的原因所在——多個器件疊加運行才能實現(xiàn)的功能,通過單一芯片的智能來解決。同時,實現(xiàn)對第一代產(chǎn)品的補充。
第二代Versal AI Edge系列和第二代Versal Prime系列自適應SoC所擁有的單芯片智能性,消除了構建多芯片處理解決方案的需求,進而帶來了更小、更高效的嵌入式AI系統(tǒng),并為縮短上市時間提供潛能。
根據(jù)介紹,該系列器件在預處理階段采用FPGA可編程邏輯架構用于實時處理,靈活連接各種傳感器并實現(xiàn)高吞吐量、低時延數(shù)據(jù)處理工作流程;在AI推理階段,則通過矢量處理器陣列構成下一代AI引擎,實現(xiàn)高效AI推理;在后處理階段,以Arm CPU內(nèi)核為安全關鍵型應用提供復雜決策與控制所需的后處理能力。
與此同時,該系列器件還能帶來較之初代至高10倍的標量算力。但不可忽視的是,標量算力顯著提升的同時,也帶來了相應功耗的增長。
據(jù)Manuel Uhm透露,第二代的功耗會比一代的VE2302高出很多。但是他也補充,“如果要實現(xiàn)同樣的DMIPS,使用一代2302產(chǎn)品的話,就需要使用外部的處理器,由此產(chǎn)生的總功耗實際上還是要高于二代的產(chǎn)品。”
值得一提的是,此次新產(chǎn)品的推出還有一個很大的亮點在于,相較于第一代產(chǎn)品,第二代則主要針對中央計算引擎,而第一代更多的是進行CPU的加速。
當前,汽車行業(yè)已經(jīng)進入到ADAS標配時代,越來越多傳感器被集中在一個域控制器內(nèi),即中央計算。
沿著這種趨勢,AMD推出的第二代Versal產(chǎn)品能夠在“汽車大腦”進行數(shù)據(jù)融合。用官方的話來說,就是第二代Versal AI Edge系列與第二代Versal Prime系列產(chǎn)品組合為AI驅動型系統(tǒng)提供了從邊緣傳感器到中央計算的可擴展性,支持客戶選擇性能、功耗以及占板面積,以高效實現(xiàn)應用性能與安全目標。
此外,該產(chǎn)品組合也能簡化設計周期。AMD表示,AMD Vivado™ 設計套件工具及庫有助于為嵌入式硬件系統(tǒng)開發(fā)人員提升生產(chǎn)力并簡化設計周期,從而縮短編譯時間與提升結果質量。對于嵌入式軟件開發(fā)人員,AMD Vitis™統(tǒng)一軟件平臺支持在用戶首選的抽象級別進行嵌入式軟件、信號處理和AI設計開發(fā),無需具備FPGA經(jīng)驗。
對于AMD而言,其在FPGA領域實力的突破與在數(shù)據(jù)中心領域大舉進攻,很大一部分原因在于,于2022年2月完成對全球FPGA第一大品牌賽靈思(Xilinx)的收購。
彼時,原賽靈思總裁兼CEO,后擔任AMD自適應與嵌入式計算事業(yè)部(AECG)總裁的Victor Peng認為,“快速發(fā)展的連接設備和嵌入式人工智能的數(shù)據(jù)密集型應用,推動了對高效和自適應高性能計算解決方案需求的不斷增長。AMD和賽靈思的結合,將提供非常全面的自適應計算平臺組合,為廣泛的智能應用提供動力,從而加速我們定義計算新時代的能力。”
AMD在AI時代的動作還在持續(xù)加速。目前,AMD第二代Versal產(chǎn)品早期訪問文檔已經(jīng)發(fā)布。據(jù)透露,AMD預計于2025年上半年提供第二代 Versal系列芯片樣片,2025年年中提供評估套件及系統(tǒng)模塊(SOM)樣品,并預計于2025年末提供量產(chǎn)芯片。
“對人工智能化嵌入式應用的需求正呈爆炸式增長,并帶動了對能在嵌入式系統(tǒng)的功耗和占板面積限制內(nèi)實現(xiàn)高效端到端加速的單芯片解決方案的需求。依托于40余年來自適應計算的先進地位,這些最新一代Versal器件將多個計算引擎集成于一個架構之上,將提供高計算效率與性能以及從低端到高端的可擴展性。”AMD高級副總裁兼自適應和嵌入式計算事業(yè)部總經(jīng)理Salil Raje談到。