2023年以來,ChatGPT、GPT-4掀起了通用人工智能(AGI)的熱潮,給人工智能系統(tǒng)帶來巨大變革。面對AI新藍(lán)海,國內(nèi)外既有科技巨頭,也包括初創(chuàng)企業(yè)與科研院校在AGI方向上已有布局。賽迪顧問研究顯示,2023年國產(chǎn)大模型開始爆發(fā)式增長,僅2023年1月-7月就有共計64個大模型發(fā)布。截至2023年7月,我國已累計發(fā)布130個大模型。
為了加強(qiáng)生成式AI監(jiān)管,引導(dǎo)行業(yè)規(guī)范發(fā)展,國家互聯(lián)網(wǎng)信息辦公室發(fā)布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,同時公布《境內(nèi)深度合成服務(wù)算法備案清單》,之后國家網(wǎng)信辦聯(lián)合國家發(fā)改委、教育部、科技部等七部門公布《生成式人工智能服務(wù)管理暫行辦法》。辦法明確生成式AI實施算法 “備案制”,也意味著算法備案已成為AIGC產(chǎn)品的入市門檻。
據(jù)悉,國內(nèi)11家已通過《生成式人工智能服務(wù)管理暫行辦法》備案,相關(guān)AI大模型產(chǎn)品將陸續(xù)上線,面向全社會開放。8月31日(今日),首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型百度文心一言、百川智能、商湯商量SenseChat等宣布面向全社會開放服務(wù)。除首批上線的8家大模型外,360智腦、訊飛星火、阿里通義千問也將對外開放。
首批上線的大模型:
百度文心一言
8月31日凌晨,百度宣布文心一言率先向全社會全面開放。用戶可以在應(yīng)用商店下載文心一言 App或登錄文心一言體驗。百度還將開放一批經(jīng)過全新重構(gòu)的 AI 原生應(yīng)用,讓用戶體驗生成式 AI 的理解、生成、邏輯、記憶四大核心能力。
截至目前,百度文心一言大模型已經(jīng)迭代到3.5版本。與3.0版本相比,訓(xùn)練速度提升了2倍,推理速度提升了17倍,模型效果累計提升超過50%。“文心大模型3.5版本,不僅是技術(shù)上的升級,更是安全上的升級。”百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏強(qiáng)調(diào),“在數(shù)據(jù)質(zhì)量、生成效果和內(nèi)容安全性上,都得到了明顯提升。”而此次向全社會開放,將使文心一言更進(jìn)一步。
百川智能大模型
周三晚間(8月30日),百川智能宣布通過《生成式人工智能服務(wù)管理暫行辦法》備案,今日(8月31日)起面向全社會開放服務(wù)。廣大用戶可以登錄其下載,感受百川大模型在知識問答、文本創(chuàng)作等領(lǐng)域帶來的全新體驗。
百川智能成立于2023年4月10日,由前搜狗公司CEO王小川創(chuàng)立。成立僅四個月,百川智能便相繼發(fā)布了三款通用大語言模型。今年8月8日,百川智能發(fā)布參數(shù)量530億的大語言模型Baichuan-53B,在知識性上表現(xiàn)優(yōu)異,擅長知識問答、文本創(chuàng)作等領(lǐng)域。截止今日,Baichuan-7B/13B 兩款開源模型在 Huggingface下載量已突破三百萬。
商湯商量SenseChat
今日(8月31日),商湯科技官宣,商湯日日新大模型旗下自然語言應(yīng)用“商量 SenseChat”正式面向廣大用戶開放服務(wù)。用戶可以通過公布的網(wǎng)址進(jìn)行體驗。用戶手機(jī)注冊后即可以與 “商量 SenseChat” 進(jìn)行對話。
據(jù)介紹,商湯大模型 “日日新”于今年4月正式推出,包括自然語言處理模型 “商量”、文生圖模型 “秒畫” 和數(shù)字人視頻生成平臺 “如影” 等。其中,“商量 SenseChat”是國內(nèi)非常早的基于千億參數(shù)大語言模型之一。“商量 SenseChat”的功能包括文本編輯器、智能伙伴、綜合知識庫、數(shù)理計算器、編程助手等。
清華系A(chǔ)I公司智譜華章的“智譜清言”
8月31日,智譜AI正式上線首款生成式AI助手“智譜清言”,已在各大應(yīng)用商店上線,或在小程序中搜索「智譜清言」體驗其功能。這款工具基于智譜AI自主研發(fā)的中英雙語對話模型ChatGLM2。
據(jù)悉,該助手基于智譜AI自主研發(fā)的中英雙語對話模型ChatGLM2,經(jīng)過萬億字符的文本與代碼預(yù)訓(xùn)練,并采用有監(jiān)督微調(diào)技術(shù),以通用對話的形式為用戶提供智能化服務(wù)。目前,“智譜清言” 已具備 “通用問答、多輪對話、創(chuàng)意寫作、代碼生成以及虛擬對話” 等豐富能力,未來還將開放多模態(tài)等生成能力。
抖音的云雀大模型
8月中旬,字節(jié)跳動旗下抖音的一款基于云雀大模型開發(fā)的AI
機(jī)器人“豆包”開始小范圍邀請測試。用戶可通過手機(jī)號、抖音或者Apple ID登錄。
中科院旗下 “紫東太初”
作為升級后的2.0版本,中科院旗下 “紫東太初”不僅實現(xiàn)能力提升,還做到全鏈條“中國造”,打造出全棧國產(chǎn)化的通用人工智能底座。“紫東太初” 將于明日(9月1日)面向公眾開放服務(wù)。“紫東太初” 定位為跨模態(tài)通用人工智能平臺,于2021年正式發(fā)布,擁有視覺、文本、語音多種模態(tài),基于全棧國產(chǎn)化基礎(chǔ)軟硬件平臺建立。
上海人工智能實驗室的書生大模型
上海人工智能實驗室聯(lián)合商湯、香港中文大學(xué)、上海交通大學(xué)首發(fā)書生通用大模型體系,包含多模態(tài)、浦語、天際3個基座模型,同時推出了首個面向大模型研發(fā)與應(yīng)用的全鏈條開源體系。
MiniMax 的ABAB大模型
MiniMax 的ABAB大模型是一款先進(jìn)的通用大語言模型,具有強(qiáng)大的語言處理能力,可以理解和生成自然語言文本。3 月,MiniMax 推出面向企業(yè)用戶的 API 開放平臺,支持文本和語音模型的服務(wù)調(diào)用。同一時間,MiniMax 另一款生成式對話 AI “ Inspo” 開啟內(nèi)測,具體能力包括寫作、獲取信息、提供建議,并且記得住前文,能完成連續(xù)任務(wù)。
2023年,受ChatGPT帶動,大模型發(fā)展邁向新階段,國產(chǎn)大模型一時間呈現(xiàn)出爆發(fā)式增長態(tài)勢。筆者認(rèn)為,大模型需要走向全社會開放,加速AI原生應(yīng)用落地,才能更好地發(fā)揮其功用,完成大數(shù)據(jù)意義上學(xué)習(xí)資料的累積,達(dá)成深度學(xué)習(xí)。
伴隨著審批的落地,多家搶跑,這是否意味著AI大模型百“模”大戰(zhàn)已打響?到底誰是大模型時代“應(yīng)用之王”讓我們拭目以待吧!