国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:“千模大戰(zhàn)”下,訊飛星火被評(píng)為中國(guó)“最聰明”的大模型

      “千模大戰(zhàn)”下,訊飛星火被評(píng)為中國(guó)“最聰明”的大模型

      2023-08-18 14:19:28來(lái)源:科大訊飛 關(guān)鍵詞:大模型人工智能閱讀量:24869

      導(dǎo)讀:《麻省理工科技評(píng)論》中國(guó)從研發(fā)和商業(yè)化能力、外界態(tài)度以及發(fā)展趨勢(shì)等維度全方位檢測(cè)大模型的能力,力圖評(píng)出“最聰明”的國(guó)產(chǎn)大模型。選取了“訊飛星火”、“百度文心一言”、“商湯商量”、“阿里通義千問(wèn)”作為中文大模型平臺(tái)的代表,展開(kāi)系統(tǒng)、科學(xué)的評(píng)測(cè)。
        國(guó)內(nèi)“千模大戰(zhàn)”下,誰(shuí)是最聰明的大模型?《麻省理工科技評(píng)論》中國(guó)最新發(fā)布的大模型評(píng)測(cè)報(bào)告給出了答案。
       
        報(bào)告顯示,在8個(gè)一級(jí)大類的600道題目的測(cè)試和盲評(píng)中,訊飛星火認(rèn)知大模型V2.0在6個(gè)大類中得分率排名第一,在此次評(píng)測(cè)中表現(xiàn)突出,以 81.5 分(百分制計(jì))的成績(jī)?cè)诒敬卧u(píng)測(cè)中登頂,榮獲“最聰明”的國(guó)產(chǎn)大模型稱號(hào)。
       
      圖:大模型評(píng)測(cè)綜合得分率
       
      圖:4個(gè)大模型各項(xiàng)能力雷達(dá)圖
       
        《麻省理工科技評(píng)論》中國(guó)從研發(fā)和商業(yè)化能力、外界態(tài)度以及發(fā)展趨勢(shì)等維度全方位檢測(cè)大模型的能力,力圖評(píng)出“最聰明”的國(guó)產(chǎn)大模型。選取了“訊飛星火”、“百度文心一言”、“商湯商量”、“阿里通義千問(wèn)”作為中文大模型平臺(tái)的代表,展開(kāi)系統(tǒng)、科學(xué)的評(píng)測(cè)。
       
        本次評(píng)測(cè)使用的測(cè)試集包含600道題目,覆蓋了語(yǔ)言專項(xiàng)、數(shù)學(xué)專項(xiàng)、理科綜合、文科綜合、邏輯思維、編程能力、綜合知識(shí)、安全性共 8 個(gè)一級(jí)大類,126 個(gè)二級(jí)分類,290 個(gè)三級(jí)標(biāo)簽,并針對(duì)問(wèn)題的豐富性和多樣性做了優(yōu)化。
       
        在題目類型上,為了兼顧定量、定性的評(píng)價(jià)與測(cè)試,設(shè)置了“單選”、“多選”、“填空”、“簡(jiǎn)答”4個(gè)題型,分別有 145 道、138 道、136 道和 181 道。大模型評(píng)測(cè)體系使用盲評(píng)方式,客觀評(píng)估國(guó)產(chǎn)大模型的聰明程度。
       
        作為“最聰明”的大模型的基礎(chǔ)能力,語(yǔ)言專項(xiàng)評(píng)測(cè)包含對(duì)話理解、多語(yǔ)種、諷刺、古詩(shī)詞理解、文本生成、要點(diǎn)總結(jié)、情感分析、語(yǔ)義判斷等 61 個(gè)二級(jí)分類,題型則以簡(jiǎn)答為主。結(jié)果顯示,訊飛星火 85.73%的得分率排名第一,明顯高于平均值。
       
      圖:語(yǔ)言專項(xiàng)評(píng)測(cè)得分率
       
        數(shù)學(xué)專項(xiàng)評(píng)測(cè),是“最聰明”大模型必不可少的評(píng)測(cè)維度。本次評(píng)測(cè)包含代數(shù)、幾何、解方程、復(fù)雜數(shù)學(xué)、統(tǒng)計(jì)學(xué)等 9 個(gè)二級(jí)分類,以選擇題為主。
       
        其中,訊飛星火以 77.75% 的得分率名列第一,遠(yuǎn)高于平均得分率 56%,其他平臺(tái)得分率基本相當(dāng)。報(bào)告稱,在大模型普遍“數(shù)學(xué)不好”的情況下,訊飛星火這一成績(jī)頗為難得,其在數(shù)學(xué)專項(xiàng)上的領(lǐng)先同樣體現(xiàn)在二級(jí)分類的評(píng)分結(jié)果上,在 77.8%的二級(jí)分類中得分率第一,遠(yuǎn)超其他平臺(tái),初步判斷其擅長(zhǎng)幾何與情景應(yīng)用。
       
      圖:數(shù)學(xué)專項(xiàng)評(píng)測(cè)得分率
       
        作為體現(xiàn)大模型“聰明程度”不可或缺的“硬核”部分,理科綜合評(píng)測(cè)包含表格問(wèn)答、化學(xué)、生物、物理、醫(yī)學(xué) 5 個(gè)二級(jí)分類,題型上以單選和簡(jiǎn)答為主。
       
        評(píng)測(cè)結(jié)果中,訊飛星火 78.50% 的得分率排名第一。另外,訊飛星火在理科綜合大類下 80% 的二級(jí)分類評(píng)測(cè)中得分率為第一,化學(xué)與生物較為突出。
       
      圖:理科綜合評(píng)測(cè)得分率
       
        邏輯思維也是“最聰明”大模型的重要體現(xiàn),本次邏輯思維評(píng)測(cè)在邏輯推理、思維鏈等方面設(shè)計(jì)了較多的題目,包含類比、常識(shí)推理、空間方位、演繹推理、邏輯謬誤檢測(cè)、因果推理等 19 個(gè)二級(jí)分類,題型上相對(duì)平均,其中填空題最多,多選題最少。
       
        在邏輯思維題目中,訊飛星火 81.25%的得分率名列第一,明顯高于 72.6% 的平均值。此外,訊飛星火在邏輯思維 63.2% 的二級(jí)分類問(wèn)題上得分率第一。邏輯思維對(duì)于大模型真正理解物理世界相當(dāng)重要。
       
      圖:邏輯思維評(píng)測(cè)得分率
       
        編程能力是大模型比較高階的能力,本次的編程能力評(píng)測(cè)包含 ASCII、ASCII碼識(shí)別、Python、代碼、代碼修正、計(jì)算機(jī) 6 個(gè)二級(jí)分類,其中 Python 主要以簡(jiǎn)答形式評(píng)估大模型的代碼生成能力和正確率,其他則以客觀題的形式考察。
       
        結(jié)果顯示,訊飛星火 80% 的得分率明顯高于 71%的平均值,其他平臺(tái)得分率基本相當(dāng)。值得一提的是,在許多人關(guān)心的生成代碼的簡(jiǎn)答題單項(xiàng)上,訊飛星火的得分率高達(dá) 82%,遠(yuǎn)高于其他平臺(tái),表現(xiàn)頗為亮眼。
       
      圖:編程能力評(píng)測(cè)綜合得分率
       
        作為比較難的評(píng)測(cè)維度,綜合知識(shí)對(duì)大模型的“聰明”程度要求也很高,涉及的題目較雜,包含百科問(wèn)答、常識(shí)、科學(xué)知識(shí)、事實(shí)問(wèn)答、工作技巧、謎語(yǔ)等 13 個(gè)二級(jí)分類,題型以多選為主。
       
        在綜合知識(shí)評(píng)測(cè)上,訊飛星火 80.61% 的得分率排名第一,在 84.6% 的二級(jí)分類上得分率第一,初步顯示出在百科問(wèn)答和歷史人文上的“過(guò)人之處”。
       
      圖:綜合知識(shí)評(píng)測(cè)得分率
       
        報(bào)告指出,在本輪大模型評(píng)測(cè)中,訊飛星火以 81.5 分的成績(jī)拔得頭籌,成為“最聰明”的國(guó)產(chǎn)大模型。
       
        訊飛星火在編程能力、理科綜合、邏輯思維、數(shù)學(xué)專項(xiàng)、語(yǔ)言專項(xiàng)和綜合知識(shí)這 6 個(gè)一級(jí)大類中得分率排名第一,在此次評(píng)測(cè)中表現(xiàn)十分全面,尤其是在代碼生成、數(shù)學(xué)能力、理科與邏輯等方面優(yōu)勢(shì)明顯,是本次“最聰明的理科生”。
       
        值得一提的是,從題型角度來(lái)看,主觀簡(jiǎn)答題中訊飛星火憑借 83.98% 的得分率位居第一;而在客觀題上,訊飛星火以 75.7% 的得分率排名第一,在主客觀體型中均有良好表現(xiàn)。
       
        此外,就在8月12日,新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗(yàn)報(bào)告2.0》中,訊飛星火V1.5以總分1013分位列本次國(guó)產(chǎn)主流大模型測(cè)評(píng)榜首位,在四大評(píng)測(cè)維度中的智商指數(shù)和工具提效指數(shù)兩個(gè)維度獲得第一,《報(bào)告》認(rèn)為訊飛星火“在工作提效方面優(yōu)勢(shì)明顯”。
       
        在剛剛過(guò)去的8月15日,訊飛星火認(rèn)知大模型V2.0如期發(fā)布,進(jìn)一步突破代碼能力和多模態(tài)能力。技術(shù)獲得重大突破的同時(shí),搭載訊飛星火V2.0核心能力的應(yīng)用和產(chǎn)品也越來(lái)越豐富:既有輔助程序員高效工作的智能編碼助手iFlyCode1.0、能夠進(jìn)行視頻創(chuàng)作的訊飛智作2.0、能夠便捷搭建輕應(yīng)用的教育數(shù)字基座應(yīng)用開(kāi)發(fā)助手,還有幫助教師設(shè)計(jì)教學(xué)活動(dòng)、一鍵生成課件的星火教師助手、面向英語(yǔ)學(xué)習(xí)者口語(yǔ)練習(xí)的星火語(yǔ)伴2.0,訊飛AI學(xué)習(xí)機(jī)也升級(jí)AI 1對(duì)1智能編程助手和AI 1對(duì)1創(chuàng)意繪畫(huà)伙伴。此外,科大訊飛還和華為聯(lián)合發(fā)布星火一體機(jī),讓每一家企業(yè)都有機(jī)會(huì)構(gòu)建專屬大模型。
      我要評(píng)論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個(gè)字符)

      所有評(píng)論僅代表網(wǎng)友意見(jiàn),與本站立場(chǎng)無(wú)關(guān)。

      • 未來(lái)的工廠:機(jī)器人技術(shù)和人工智能如何開(kāi)創(chuàng)下一個(gè)工業(yè)革命

        未來(lái)的工廠正逐漸成為高度智能化、自動(dòng)化和高效化的生產(chǎn)場(chǎng)所,一場(chǎng)新的工業(yè)革命正在悄然拉開(kāi)帷幕。機(jī)器人技術(shù)和人工智能正在深刻地改變著制造業(yè)的未來(lái),它們不僅能夠提高生產(chǎn)效率、增強(qiáng)生產(chǎn)精度和質(zhì)量,還能夠?qū)崿F(xiàn)預(yù)測(cè)性維護(hù)、優(yōu)化生產(chǎn)流程和促進(jìn)可持續(xù)發(fā)展。
        機(jī)器人技術(shù)智能制造人工智能
        2025-03-20 12:00:56
      • “人工智能+公交” 打造智慧公交管理新范式

        在人工智能技術(shù)迅猛發(fā)展的背景下,公共交通行業(yè)尤其是公交車運(yùn)行安全可通過(guò)AI技術(shù)實(shí)現(xiàn)多維度的優(yōu)化與保障。
        人工智能智慧公交
        2025-03-20 10:20:42
      • 人工智能推動(dòng)“中國(guó)制造”走向“中國(guó)智造”

        今年全國(guó)兩會(huì)上,多位全國(guó)政協(xié)委員暢談AI賦能,建言 AI創(chuàng)新,他們建議,我國(guó)應(yīng)加強(qiáng)頂層設(shè)計(jì),加快形成以人工智能為引擎的新質(zhì)生產(chǎn)力,助推“中國(guó)制造”加速向“中國(guó)智造”跨越。
        人工智能中國(guó)智造
        2025-03-17 10:02:04
      • 《廣西“人工智能+制造”行動(dòng)方案(2025-2027年)》印發(fā)

        《廣西“人工智能+制造”行動(dòng)方案(2025-2027年)》提出,力爭(zhēng)到2027年,突破一批關(guān)鍵技術(shù),形成100個(gè)標(biāo)志性智能產(chǎn)品,打造100個(gè)人工智能典型應(yīng)用場(chǎng)景,培育10家有全國(guó)影響力的鏈主企業(yè)、龍頭企業(yè),支持建設(shè)中國(guó)—東盟人工智能創(chuàng)新合作中心和10家以上研發(fā)創(chuàng)新平臺(tái)等。
        人工智能智能制造
        2025-03-14 13:14:17
      • 誤報(bào)率降低90%以上!??低暟l(fā)布視覺(jué)大模型周界攝像機(jī)

        現(xiàn)在,基于大模型周界攝像機(jī)強(qiáng)大的硬件性能,能以更小像素實(shí)現(xiàn)目標(biāo)檢出,檢出距離大幅提升,相較于傳統(tǒng)周界相機(jī)5-20米的縱深檢測(cè),大模型周界產(chǎn)品可實(shí)現(xiàn)至少5-65米的精準(zhǔn)檢測(cè)。
        大模型周界攝像機(jī)
        2025-03-14 10:26:36
      • 更準(zhǔn)!海康威視發(fā)布大模型交通卡口抓拍系列產(chǎn)品

        為提升交通卡口抓拍檢測(cè)精準(zhǔn)度,海康威視基于??涤^瀾大模型技術(shù)體系將大模型能力直接部署至交通卡口抓拍系列產(chǎn)品上,相比傳統(tǒng)檢測(cè)算法,安全帶、打電話、玩手機(jī)等行為誤檢率降低75%以上(根據(jù)項(xiàng)目實(shí)測(cè)數(shù)據(jù))。
        大模型交通卡口
        2025-03-14 10:16:58
      版權(quán)與免責(zé)聲明:

      凡本站注明“來(lái)源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

      本站轉(zhuǎn)載并注明自其它來(lái)源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺(tái)或個(gè)人從本站轉(zhuǎn)載時(shí),必須保留本站注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來(lái)源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

      鑒于本站稿件來(lái)源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯(cuò)過(guò)行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來(lái)訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機(jī)嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機(jī)械包裝機(jī)械工程機(jī)械倉(cāng)儲(chǔ)物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機(jī)器人3D打印設(shè)備生物識(shí)別傳感器電機(jī)電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時(shí)代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
      智能制造網(wǎng)APP

      功能豐富 實(shí)時(shí)交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號(hào)

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號(hào):gkzhan

      打開(kāi)抖音 搜索頁(yè)掃一掃

      視頻號(hào)

      智能制造網(wǎng)

      公眾號(hào):智能制造網(wǎng)

      打開(kāi)微信掃碼關(guān)注視頻號(hào)

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開(kāi)快手 掃一掃關(guān)注
      意見(jiàn)反饋
      我要投稿
      我知道了