直播推薦
企業(yè)動態(tài)
- 喜報 | 鑫精誠傳感器榮獲高工人形機器人“年度投資價值企業(yè)”
- 威邁爾VMR類人形機器人榮獲2024年度創(chuàng)新產(chǎn)品“金球獎”
- 中藥龍頭云端之旅,信銳帶你探索智造發(fā)展新路徑!
- 哈爾濱工業(yè)大學張教授蒞臨東莞市皓天試驗設(shè)備參觀指導
- 皓天鑫攜手公牛集團,深化合作共推產(chǎn)業(yè)升級
- 惠普連續(xù)兩年亮相鏈博會,創(chuàng)新技術(shù)驅(qū)動供應(yīng)鏈轉(zhuǎn)型
- 攜手共筑綠色未來:同方威視護航第29屆聯(lián)合國氣候變化大會
- 廣晧天工業(yè)干燥烤箱成功完成生產(chǎn)調(diào)試,助力行業(yè)高效干燥解決方案升級
推薦展會
人臉識別到底是什么?
人臉識別,是視覺模式識別的一個細分問題,也大概是zui難解決的一個問題。其實我們?nèi)嗣繒r每刻都在進行視覺模式識別,我們通過眼睛獲得視覺信息,這些信息經(jīng)過大腦的處理被識別為有意義的概念。于是我們知道了放在我們面前的是水杯、書本,還是什么別的東西。
我們也*不在進行人臉識別,我們每天生活中遇到無數(shù)的人,從中認出那些熟人,和他們打招呼,打交道,忽略其他的陌生人。甚至躲開那些我們欠了錢還暫時還不上的人。
然而這項看似簡單的任務(wù),對機器來說卻并不那么容易實現(xiàn)。
對計算機來講,一幅圖像信息,無論是靜態(tài)的圖片,還是動態(tài)視頻中的一幀,都是一個由眾多像素點組成的矩陣。比如一個1080p的數(shù)字圖像,是一個由1980*1080個像素點組成矩陣,每個像素點,如果是8bit的rgb格式,則是3個取值在0-255的數(shù)。
機器需要在這些數(shù)據(jù)中,找出某一部分數(shù)據(jù)代表了何種概念:哪一部分數(shù)據(jù)是水杯,哪一部分是書本,哪一部分是人臉,這是視覺模式識別中的粗分類問題。
而人臉識別,需要在所有機器認為是人臉的那部分數(shù)據(jù)中,區(qū)分這個人臉屬于誰,這是個細分類問題。
人臉可以分為多少類呢?
取決于所處理問題的人臉庫大小,人臉庫中有多少目標人臉,就需要機器進行相應(yīng)數(shù)量的細分類。如果想要機器認出每個他看到的人,則這世界上有多少人,人臉就可以分為多少類,而這些類別之間的區(qū)別是非常細微的。由此可見人臉識別問題的難度。
更不要提,這件事還要受到光照,角度,人臉部的裝飾物等各種因素的影響。這也不難解釋為什么人臉識別技術(shù)目前還沒有大量應(yīng)用在日常生活中,大部分人只能在科幻電影中接觸人臉識別了。
傻傻分不清楚——一些容易被混淆的概念
一些不太被人熟悉的事物,經(jīng)常會伴隨著大量的概念混淆。
比如對西方宗教不太了解的國人,可能搞不清楚為什么有些人信上帝但不信耶穌;都是在教堂工作的大叔,為什么有些要禁欲,有些卻能結(jié)婚。
而人臉識別作為一個新事物,也伴隨著大量的概念混淆,而分清這些概念,對于理解人臉識別還是比較重要的。
人臉檢測與人臉識別
完成人臉識別的工作,要經(jīng)過幾個步驟。首先計算機需要在圖像或視頻中找到人臉的位置,這部分工作一般叫做人臉檢測。如前所述,這是一種粗分類,具體到人臉檢測中,實際上是二分類,計算機只需要判斷目標圖像是或者不是人臉。但由于并不能事先確定人臉的大小和位置,計算機需要以每個可能的人臉大小對全圖進行掃描,逐個判斷子窗口所截取的圖像是否為人臉。而每次掃描過程,子窗口移動的步長可能是幾個像素。
所以你可以大致想象下,作一張圖的人臉檢測,計算機需要作多少次二分類判斷。
人臉檢測步驟從一張圖中獲得人臉的位置和大小,并將該部分圖像送給后續(xù)步驟,包括:人臉部件點定位,人臉圖像的對齊和歸一化,人臉圖像質(zhì)量選取,特征提取,特征比對。所有步驟完成后,才能得知該人臉的身份。
當然,我們也可以單獨使用人臉檢測功能來完成某些應(yīng)用,比如當前大部分照相機,及手機攝像頭都有人臉檢測功能,可以自動獲得人臉位置,從而對圖片作一些自動調(diào)焦和優(yōu)化。甚至對人臉做一些初步的判斷,比如性別、年齡,甚至顏值。
1v1人臉驗證與1vN人臉查找
主人公通過各種方式,蒙混過層層身份驗證,成功進入某機要部門,這是電影中經(jīng)常出現(xiàn)的情節(jié)。而這層層的身份驗證就經(jīng)常包括人臉識別。在這種應(yīng)用中,使用者往往需要提供自己的身份。
比如使用門卡,計算機可以通過門卡在后臺中獲取門卡所有者的人臉樣本,將其與當前使用門卡人的人臉圖像進行對比,以確認當前使用門卡的人與門卡的所有者是否匹配,如此可以避免撿到你門卡的人輕松混入公司。
這是一種1v1的身份驗證,計算機對當前人臉和庫存人臉進行一次比對,是對其他驗證方式的一種輔助,從而提高身份驗證的可靠性。這種應(yīng)用目前已經(jīng)大量使用,比如敏感設(shè)施的準入,互聯(lián)網(wǎng)金融領(lǐng)域的遠程開戶及大額提取的身份驗證等。
文章開始時提到的《機械戰(zhàn)警》中的橋段,則是1vN的人臉查找。機械戰(zhàn)警可以聯(lián)機查找一個保存了所有通緝犯數(shù)據(jù)的人臉庫,每次他遇到一個人,都會先獲取該人的人臉信息,用所獲得信息去通緝犯數(shù)據(jù)庫中去逐個比對,如果發(fā)現(xiàn)匹配度足夠高的,就當場抓捕。每次人臉識別,計算機要作n次人臉比對,n為待識別庫中的人臉模板數(shù)。
如果要求計算機只憑借人臉識別出一個人的身份,這實際上也是一種1vN的人臉查找,其目標人臉庫是一個由n個人臉組成的“熟人庫”,隨著n的增大,準確識別的難度也會增大,一次識別所需要的計算時間也會增加。我們可以考慮一下,一個普通人能對多少個人臉進行準確識別?大概也就在幾十個這個數(shù)量級上吧。
而目前的人臉識別技術(shù)實際上已經(jīng)超過了這個水平。
例如國內(nèi)*的人臉識別公司,一般會有一面屏幕墻,演示公司各個攝像頭所拍攝到人員活動,并對身份進行準確識別,而公司內(nèi)一般維護一個百人數(shù)量級的人臉庫。但如果N再繼續(xù)增大,達到千人庫,萬人庫,那么實時查找*的匹配人臉就成為一種科幻要求了,在較大的人臉庫應(yīng)用中,一般會降低對實時性的要求,并且只要求查出前m名非常匹配的疑似人臉,以便縮小人工檢索的范圍。
免責聲明
- 凡本網(wǎng)注明"來源:智能制造網(wǎng)"的所有作品,版權(quán)均屬于智能制造網(wǎng),轉(zhuǎn)載請必須注明智能制造網(wǎng),http://towegas.com。違反者本網(wǎng)將追究相關(guān)法律責任。
- 企業(yè)發(fā)布的公司新聞、技術(shù)文章、資料下載等內(nèi)容,如涉及侵權(quán)、違規(guī)遭投訴的,一律由發(fā)布企業(yè)自行承擔責任,本網(wǎng)有權(quán)刪除內(nèi)容并追溯責任。
- 本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品來源,并自負版權(quán)等法律責任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
2025中國(武漢)國際網(wǎng)絡(luò)信息安全博覽會暨高峰論壇
展會城市:武漢市展會時間:2025-06-26