国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:抓錯(cuò)能手!MIT發(fā)布首個(gè)貝葉斯“數(shù)據(jù)清理”機(jī)器人:7.5小時(shí)洗220萬條數(shù)據(jù)

      抓錯(cuò)能手!MIT發(fā)布首個(gè)貝葉斯“數(shù)據(jù)清理”機(jī)器人:7.5小時(shí)洗220萬條數(shù)據(jù)

      2021-05-18 09:23:43來源:智能制造網(wǎng) 關(guān)鍵詞:機(jī)器人數(shù)據(jù)清洗閱讀量:22811

      導(dǎo)讀:麻省理工學(xué)院的研究人員發(fā)明了一種新的系統(tǒng),可以自動(dòng)清除“臟數(shù)據(jù)”——數(shù)據(jù)分析師、數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家害怕的打字錯(cuò)誤、重復(fù)、拼寫錯(cuò)誤和不一致。
        麻省理工學(xué)院(MIT)的研究人員發(fā)明了一種新的系統(tǒng),可以自動(dòng)清除“臟數(shù)據(jù)”(dirty data)——數(shù)據(jù)分析師、數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家害怕的打字錯(cuò)誤、重復(fù)、缺失值、拼寫錯(cuò)誤和不一致。
       
        這個(gè)系統(tǒng)被稱為PClean,是概率計(jì)算項(xiàng)目(Probabilistic Computing Project)研究人員編寫的針對(duì)特定領(lǐng)域的概率編程語言,旨在簡(jiǎn)化人工智能應(yīng)用程序的開發(fā)并實(shí)現(xiàn)自動(dòng)化,例如時(shí)間序列和數(shù)據(jù)庫進(jìn)行建模。
       
        根據(jù)Anaconda和Figure Eight進(jìn)行的調(diào)查,數(shù)據(jù)清理可能需要數(shù)據(jù)科學(xué)家四分之一的時(shí)間。自動(dòng)化數(shù)據(jù)清理這項(xiàng)任務(wù),一直是很有挑戰(zhàn)性的,因?yàn)椴煌臄?shù)據(jù)集需要不同類型的清理,而且經(jīng)常需要對(duì)世界上的對(duì)象進(jìn)行常理性的判斷。PClean為這些判斷用提供了通用的常識(shí)性模型,這些判斷可以根據(jù)特定的數(shù)據(jù)庫和錯(cuò)誤類型進(jìn)行定制。
       
        PClean使用一種基于知識(shí)的方法來自動(dòng)化數(shù)據(jù)清理過程:用戶對(duì)數(shù)據(jù)庫的背景知識(shí)以及可能出現(xiàn)的問題進(jìn)行編碼。用戶可以給PClean關(guān)于域和關(guān)于數(shù)據(jù)可能被破壞的背景知識(shí)。PClean通過常識(shí)概率推理結(jié)合這些知識(shí)來得出答案。
       
        這篇論文的主要作者、電子工程和計(jì)算機(jī)科學(xué)系(EECS)的博士生亞歷克斯·盧(Alex Lew)說,他最興奮的是PClean提供了一種從計(jì)算機(jī)獲取幫助的方式,就像人們相互尋求幫助一樣。
       
        “PClean是第一個(gè)基于生成數(shù)據(jù)建模的可擴(kuò)展、設(shè)計(jì)良好、通用的解決方案,這必須是正確的道路。結(jié)果不言自明。”合著者Agrawal補(bǔ)充說:“現(xiàn)有的數(shù)據(jù)清理方法在表達(dá)能力上受到了更多的限制,而這可能更加用戶友好,但代價(jià)是相當(dāng)有限。”此外,我們發(fā)現(xiàn)PClean可以擴(kuò)展到非常大的數(shù)據(jù)集,這些數(shù)據(jù)集在現(xiàn)有系統(tǒng)下運(yùn)行時(shí)不現(xiàn)實(shí)。”
       
        PClean建立在概率編程的最新進(jìn)展之上,包括在麻省理工概率計(jì)算項(xiàng)目中建立的一個(gè)新的人工智能編程模型,該模型使應(yīng)用人類知識(shí)的現(xiàn)實(shí)模型來解釋數(shù)據(jù)變得更加容易。PClean的修復(fù)是基于貝葉斯推理(Bayesian reasoning)的,這種方法結(jié)合了先驗(yàn)概率(給定的手頭數(shù)據(jù))和后驗(yàn)概率,能夠?qū)μ钛a(bǔ)的數(shù)據(jù)給出一個(gè)概率值。
       
        PClean是第一個(gè)貝葉斯數(shù)據(jù)清理系統(tǒng),它可以結(jié)合領(lǐng)域?qū)I(yè)知識(shí)和常識(shí)性推理,自動(dòng)清理數(shù)據(jù)庫中的數(shù)百萬條記錄。PClean通過三項(xiàng)創(chuàng)新實(shí)現(xiàn)了這一效率:
       
        - 首先,PClean的腳本語言允許用戶對(duì)他們知道的內(nèi)容進(jìn)行編碼。這將產(chǎn)生精確的模型,即使對(duì)于復(fù)雜的數(shù)據(jù)庫也是如此。
       
        - 第二,PClean的推理算法使用了一種兩階段的方法,基于一次處理記錄,對(duì)如何清除記錄做出有根據(jù)的猜測(cè),然后重新訪問判斷調(diào)用來修復(fù)錯(cuò)誤。這將產(chǎn)生強(qiáng)大、準(zhǔn)確的推理結(jié)果。
       
        - 第三,PClean提供了一個(gè)自定義編譯器,可以生成快速推理代碼。這使得PClean能夠以比其他競(jìng)爭(zhēng)方法更快的速度運(yùn)行在有上百萬條記錄的數(shù)據(jù)庫上。
       
        與所有概率程序一樣,該工具工作所需的代碼行數(shù)要比其他最先進(jìn)的選擇少得多:PClean程序只需要大約50行代碼就可以在準(zhǔn)確性和運(yùn)行時(shí)方面超過基準(zhǔn)測(cè)試。做個(gè)比較你就明白這種提升有多明顯:一款簡(jiǎn)單的蛇形手機(jī)游戲需要兩倍多的代碼才能運(yùn)行,而《我的世界》的代碼就超過了100萬行。
       
        在他們剛剛于2021年人工智能和統(tǒng)計(jì)學(xué)會(huì)會(huì)議上提交的論文中,作者展示了PClean的能力,通過使用PClean來檢測(cè)錯(cuò)誤,并在220萬行全國(guó)醫(yī)療保險(xiǎn)醫(yī)師比較數(shù)據(jù)集中輸入缺失值,可以擴(kuò)展到包含數(shù)百萬條記錄的數(shù)據(jù)集。僅僅運(yùn)行了7個(gè)半小時(shí),PClean就發(fā)現(xiàn)了8000多個(gè)錯(cuò)誤。然后作者通過手工驗(yàn)證(通過搜索醫(yī)院網(wǎng)站和醫(yī)生LinkedIn頁面),結(jié)果顯示:對(duì)于超過96%的患者,PClean提出的修復(fù)方案是正確的。
       
        由于PClean是基于貝葉斯概率的,它也可以給出其不確定性的校準(zhǔn)估計(jì)。它可以維持多個(gè)假設(shè)——給你分級(jí)的判斷,而不僅僅是是/否的答案。
       
        (原標(biāo)題:抓錯(cuò)能手!MIT發(fā)布首個(gè)貝葉斯“數(shù)據(jù)清理”機(jī)器人:7.5小時(shí)洗220萬條數(shù)據(jù))
      我要評(píng)論
      文明上網(wǎng),理性發(fā)言。(您還可以輸入200個(gè)字符)

      所有評(píng)論僅代表網(wǎng)友意見,與本站立場(chǎng)無關(guān)。

      • 國(guó)內(nèi)機(jī)器人領(lǐng)域投融資活躍!這五家企業(yè)宣布融資好消息

        國(guó)內(nèi)機(jī)器人領(lǐng)域投融資活動(dòng)頻繁發(fā)生,為企業(yè)創(chuàng)新發(fā)展提供了強(qiáng)有力的資金支持。2025年5月,傲意科技、自變量機(jī)器人、艾豚科技、山東未來機(jī)器人、傲鯊智能等多家企業(yè)紛紛宣布融資好消息!
        機(jī)器人人形機(jī)器人投融資
        2025-05-14 11:21:58
      • 涉及電力、機(jī)器人等領(lǐng)域 近期企業(yè)融資動(dòng)態(tài)匯總

        近日,不少科技企業(yè)宣布完成數(shù)千萬元融資,小編在本文中整理了近期數(shù)千萬元融資的科技企業(yè)。具身智能公司“自變量機(jī)器人”近日完成數(shù)億元A輪融資,由美團(tuán)戰(zhàn)投領(lǐng)投、美團(tuán)龍珠跟投;新能源檢測(cè)技術(shù)企業(yè)“川源科技”宣布完成數(shù)千萬元A輪融資......
        電力機(jī)器人
        2025-05-14 09:12:07
      • 機(jī)器人交警“夸父”上崗:說著一口流利的四川話

        “夸父” 機(jī)器人作為全尺寸高動(dòng)態(tài)雙足仿人形機(jī)器人,基本實(shí)現(xiàn)國(guó)產(chǎn)化,支持360度全向移動(dòng),最高時(shí)速可達(dá)5公里,還能輕松完成20厘米高度的跳躍。
        機(jī)器人人形機(jī)器人夸父
        2025-05-06 09:53:20
      • 宇樹機(jī)器人五一兼職靶場(chǎng)累癱 蹲下休息蹺二郎腿充電走紅

        據(jù)現(xiàn)場(chǎng)工作人員透露,機(jī)器人連續(xù)工作一小時(shí)左右就會(huì)出現(xiàn)電量不足、過熱等狀況,甚至在表演時(shí)直接“癱倒”在地,不得不緊急暫?;顒?dòng)進(jìn)行搶修和更換電池。
        機(jī)器人宇樹H1機(jī)器人
        2025-05-06 09:49:54
      • 禾賽科技與三家科技企業(yè)達(dá)成合作

        禾賽科技的激光雷達(dá)與群核科技的空間理解模型 SpatialLM、空間智能解決方案 SpatialVerse 融合,可實(shí)現(xiàn)毫米級(jí) 3D 空間建模與物理屬性智能標(biāo)注。
        激光雷達(dá)機(jī)器人仿真訓(xùn)練
        2025-04-22 14:40:39
      • 早報(bào)|OpenAI發(fā)布GPT-4.1;Hugging Face進(jìn)軍機(jī)器人領(lǐng)域

        OpenAI推出了三款GPT-4.1系列模型GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,該系列模型需要通過API使用;人工智能開發(fā)平臺(tái)Hugging Face近日宣布收購法國(guó)人形機(jī)器人初創(chuàng)公司Pollen Robotics,進(jìn)一步拓展其在機(jī)器人領(lǐng)域的布局......
        GPT-4.1機(jī)器人
        2025-04-15 10:49:57
      版權(quán)與免責(zé)聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺(tái)或個(gè)人從本站轉(zhuǎn)載時(shí),必須保留本站注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯(cuò)過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機(jī)嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機(jī)械包裝機(jī)械工程機(jī)械倉儲(chǔ)物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機(jī)器人3D打印設(shè)備生物識(shí)別傳感器電機(jī)電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時(shí)代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
      智能制造網(wǎng)APP

      功能豐富 實(shí)時(shí)交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號(hào)

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號(hào):gkzhan

      打開抖音 搜索頁掃一掃

      視頻號(hào)

      智能制造網(wǎng)

      公眾號(hào):智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號(hào)

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了