物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊(cè)

揭密:人臉識(shí)別系統(tǒng)如何"畫(huà)"出哨兵遇襲案疑犯

作者:中國(guó)青年報(bào)
來(lái)源:來(lái)源網(wǎng)絡(luò)(侵權(quán)刪)
日期:2009-04-30 09:45:52
摘要:清華大學(xué)電子工程系教授,主持研制“人臉識(shí)別系統(tǒng)”的蘇光大,曾利用該項(xiàng)技術(shù),協(xié)助公安部門(mén)成功破獲數(shù)起要案。在他看來(lái),模糊圖像復(fù)原和人像組合技術(shù),在中國(guó)已經(jīng)相對(duì)成熟,而綜合了兩者技術(shù)特性的人臉識(shí)別系統(tǒng),正越來(lái)越多地被人們運(yùn)用,成為輔助識(shí)別犯罪嫌疑人的有效辦法。
 2009年3月19日晚7時(shí)42分,重慶一名執(zhí)勤哨兵被襲擊身亡,襲擊者還搶走了哨兵的半自動(dòng)步槍。這便是震動(dòng)整個(gè)中國(guó)的重慶“3·19”哨兵遇襲案。  

  3月30日,重慶市沙坪壩區(qū)公安分局發(fā)布懸賞公告,公開(kāi)了由現(xiàn)場(chǎng)監(jiān)控錄像抓拍的4張視頻截圖,但截圖中并沒(méi)有襲擊者的正面影像。一星期后,在重慶市江北區(qū)公安分局公布的電腦模擬畫(huà)像中,襲擊者的頭部被“轉(zhuǎn)正了90度”,一張隱藏在淺色線(xiàn)帽下的面孔逐漸清晰。  

  畫(huà)像公布之后,很多人好奇,原本模糊的視頻截圖,如何能變得清晰?襲擊者的頭部是怎么被“扭正”的?最終是否能夠識(shí)破這張隱藏在線(xiàn)帽下的“廬山真面目”?  

  清華大學(xué)電子工程系教授,主持研制“人臉識(shí)別系統(tǒng)”的蘇光大,曾利用該項(xiàng)技術(shù),協(xié)助公安部門(mén)成功破獲數(shù)起要案。在他看來(lái),模糊圖像復(fù)原和人像組合技術(shù),在中國(guó)已經(jīng)相對(duì)成熟,而綜合了兩者技術(shù)特性的人臉識(shí)別系統(tǒng),正越來(lái)越多地被人們運(yùn)用,成為輔助識(shí)別犯罪嫌疑人的有效辦法。  

  人工繪圖,得到便于抓捕的正面圖像 

  “3·19”槍匪到底是誰(shuí),目前不得而知。不過(guò),在以往的案件里,根據(jù)視頻截圖生成人臉正面清晰圖像,進(jìn)而破案,早有先例。  

  蘇教授回憶起他曾協(xié)助警方破獲的“京城超市投毒第一案”:北京市的7家超市,先后接到一男子的匿名電話(huà)。他以投毒相要挾,勒令商場(chǎng)向他指定的賬戶(hù)匯款。為了鎖定犯罪嫌疑人,警方利用銀行內(nèi)的電子眼,拍攝其提款過(guò)程,想從視頻中組合出男子的模樣。  

  圖像組合的原理,其實(shí)并不復(fù)雜——通過(guò)獲取嫌疑人臉部不同角度的多張圖片,經(jīng)人工繪圖,得到便于抓捕的正面圖像。  

  然而,想要從連貫的視頻中,精確地“剝離”出接近真實(shí)的清晰人臉,其難度比組合幾幅靜態(tài)圖片大得多。這就需要借助“模糊圖像增強(qiáng)系統(tǒng)”,對(duì)多幅圖片進(jìn)行逐個(gè)分析。  

  “這就像放大每一個(gè)慢動(dòng)作里人物模糊的腦袋,再用數(shù)學(xué)公式重新疊加出一張眉眼清晰的臉來(lái)?!闭掳匦医忉尩?。他是公安部人臉識(shí)別標(biāo)準(zhǔn)委員會(huì)委員,也是蘇光大科研小組成員之一,曾直接參與系統(tǒng)研發(fā)。  

  問(wèn)題的關(guān)鍵是,在“超市投毒案”的視頻中,嫌疑人的行跡相對(duì)連貫清晰,而截取其中單幅畫(huà)并“摳”出頭部后,分析對(duì)象僅僅是一張大小不足一厘米的圖片,面部細(xì)節(jié)非常模糊。如果進(jìn)一步放大分析,眼睛、鼻子等關(guān)鍵部位的信息更是丟失殆盡。  

  “這就像是拍照抖了手,或者嫌疑人走路太快,焦點(diǎn)沒(méi)法對(duì)準(zhǔn)。”章柏幸說(shuō)。  

  而“看清”這張臉,正是案件破獲的關(guān)鍵。于是,將截圖輸入“模糊圖像增強(qiáng)系統(tǒng)”后,系統(tǒng)會(huì)根據(jù)模糊成因,進(jìn)行參數(shù)分析。然后,再自動(dòng)篩選出特征較為清晰的10張。如果將10張左側(cè)臉疊加為1張后,含有嫌疑人明顯眼部信息的一個(gè)側(cè)臉,就會(huì)顯示出來(lái)。  

  約一小時(shí)的時(shí)間里,同樣的程序反復(fù)運(yùn)行三四次,最后,警方繪圖專(zhuān)家已經(jīng)可以通過(guò)系統(tǒng)細(xì)化后的臉部多角度畫(huà)面,繪制出犯罪嫌疑人的正面模樣。  

  當(dāng)這個(gè)名叫尹剛的東北籍投毒犯被抓獲時(shí),他吃驚地說(shuō):“原以為在北京,不可能有人認(rèn)得我?!?nbsp;

  “人像組合系統(tǒng)”幫助“摘墨鏡” 

  然而,制造重慶“3·19”哨兵遇襲案的襲擊者,顯然比尹剛謹(jǐn)慎得多。始終掩蓋在淺色線(xiàn)帽下的,到底是怎樣一張面孔?  

  對(duì)于這樣的情況,人眼識(shí)別困難重重。以至于曾目擊槍匪逃竄的廢品鋪老板不勝其擾,每次面對(duì)記者,只能反復(fù)說(shuō):“他腦袋上套著帽子,只露出眼睛?!?nbsp; 

  的確,劉海、口罩、帽子、眼鏡,是人臉圖像中最常見(jiàn)的遮擋物,對(duì)識(shí)別準(zhǔn)確率影響很大。墨鏡更是絕佳工具。章柏幸和他的研究小組就曾接到某國(guó)家部門(mén)的一張視頻截圖,畫(huà)面中的人用墨鏡遮擋住大部分的臉部特征,難以辨識(shí)。  

  “但這并不直接影響‘人像組合系統(tǒng)’畫(huà)出臉的大致模樣?!闭掳匦艺f(shuō),“即便他隱藏了某個(gè)‘部件’。”  

  這些“部件”,指構(gòu)成人臉的五要素:臉型、眼睛、鼻子、嘴巴和眉毛。“人像組合系統(tǒng)”的計(jì)算原理,正是分析五部件的各自特征。系統(tǒng)將人臉識(shí)別分解為:人面像識(shí)別,眼睛識(shí)別,嘴巴識(shí)別,鼻子識(shí)別,眼眉識(shí)別。如此細(xì)分,可以有效避免由年齡、姿態(tài)等變化產(chǎn)生的面部變形對(duì)捕捉人臉信息造成的影響,“摘掉”眼鏡和口罩,也不是什么難事兒。  

  在“人像組合系統(tǒng)”的作用下,幾分鐘后,一張隱藏在墨鏡下的人臉逐漸清晰,新圖像隨即交由當(dāng)?shù)鼐剑谳爡^(qū)范圍內(nèi)排查鎖定嫌疑人。  

  “摘墨鏡”看似簡(jiǎn)單,系統(tǒng)卻需要運(yùn)行一系列龐大的運(yùn)算。因?yàn)槿嗣娌康奈骞俳Y(jié)構(gòu)各有不同,為獲得準(zhǔn)確結(jié)果,每個(gè)細(xì)部的識(shí)別都需要用不同的方法分析計(jì)算。  

  而操作者只需“做道選擇題”:向系統(tǒng)輸入“戴墨鏡”的人臉之前,不選眼睛,只在其余四“部件”前打上鉤。用章柏幸的話(huà)講,要讓計(jì)算機(jī)明白,這次眼睛“不做數(shù)”。  

  置換一個(gè)最簡(jiǎn)單的例子,即便本·拉登刮掉了標(biāo)志性的濃密長(zhǎng)胡子,去掉下巴,也能畫(huà)出他的模樣。  

  “人臉識(shí)別系統(tǒng)”運(yùn)算分析 

  但是,從視頻中還原并組合出相對(duì)清晰的人臉,只是兩步必要的“準(zhǔn)備”工作,要想從茫茫人海中揪出嫌犯,還需要“人臉識(shí)別系統(tǒng)”的運(yùn)算分析。  

  而這一系統(tǒng),在2008年北京奧運(yùn)會(huì)開(kāi)幕式的入場(chǎng)安檢中,就曾發(fā)揮過(guò)作用。  

  這是奧運(yùn)史上首次采用具有“生物特征”的身份識(shí)別方式。8月8日當(dāng)晚,觀眾進(jìn)入“鳥(niǎo)巢”,除了憑借那張價(jià)格不菲的門(mén)票,還必須逐一在進(jìn)場(chǎng)通道前“留張影兒”。  

  “拍照”由一部安裝在人臉識(shí)別認(rèn)證設(shè)備頂端的攝像頭完成。這個(gè)攝像頭,與另一臺(tái)識(shí)別門(mén)票信息的刷票機(jī),共同組成了人臉識(shí)別認(rèn)證系統(tǒng)的終端。  

  持票人刷票時(shí),攝像頭在一兩秒鐘內(nèi)抓拍人臉,系統(tǒng)再自動(dòng)分析1秒內(nèi)的25幀畫(huà)面(或2秒內(nèi)50幀畫(huà)面,依次疊加),選取角度合適并且相對(duì)清晰的5幀(或10幀),定位面部關(guān)鍵點(diǎn),并提取特征,隨后將持票人和票內(nèi)信息的認(rèn)證結(jié)果同時(shí)上傳到中轉(zhuǎn)服務(wù)器,再由中轉(zhuǎn)服務(wù)器上傳至安保中心服務(wù)器。觀眾信息獲得認(rèn)證并通過(guò),只需要兩三秒時(shí)間。  

  “定位關(guān)鍵點(diǎn)和提取特征,是整個(gè)識(shí)別系統(tǒng)中最關(guān)鍵的一步?!闭掳匦艺f(shuō)。  

  然而,困難在于,人臉本身雖不易改變,神態(tài)卻千變?nèi)f化,甚至在人的一生中,一張面孔上絕對(duì)不會(huì)出現(xiàn)兩種完全相同的表情。加上年齡增長(zhǎng)和不同光照下的明暗變化,識(shí)別人臉對(duì)于只認(rèn)數(shù)字和計(jì)算的電腦來(lái)說(shuō),困難重重。  

  “但是在識(shí)別過(guò)程中,電腦必須和人腦一樣,看一眼就知道‘他是不是他’?!敝锌圃河?jì)算機(jī)研究所博士孫慶南說(shuō)。北京奧運(yùn)會(huì)期間,他作為奧運(yùn)會(huì)電子門(mén)票協(xié)調(diào)小組成員之一,直接參與了人臉識(shí)別快速身份驗(yàn)證系統(tǒng)的實(shí)施和操作。  

  其實(shí),人的面部有許多無(wú)法改變的特征:眼眶內(nèi)外側(cè)的比例,鼻梁長(zhǎng)度和鼻翼寬度的比例……這些由人的面部骨骼決定的比例關(guān)系,組成了無(wú)數(shù)個(gè)“關(guān)鍵點(diǎn)”,不會(huì)因?yàn)榕质荨⒈砬?、年齡的變化產(chǎn)生改變。  

  于是,系統(tǒng)根據(jù)這些關(guān)鍵點(diǎn)進(jìn)行統(tǒng)計(jì)學(xué)計(jì)算,建立起數(shù)據(jù)模型,把人的面部解析成由數(shù)字組成的“矩陣”,變成電腦能讀懂的“語(yǔ)言”。這樣一來(lái),人臉經(jīng)計(jì)算機(jī)轉(zhuǎn)換為數(shù)字,一點(diǎn)點(diǎn)計(jì)算出來(lái),最終提取出一組能夠表達(dá)整張人臉的特征數(shù)據(jù)。  

  為奧運(yùn)會(huì)開(kāi)幕式門(mén)禁建立的數(shù)據(jù)庫(kù),包含了所有持票人購(gòu)票前提交的正面免冠照片,并且已完成對(duì)面部特征的逐一提取。當(dāng)系統(tǒng)從攝像頭圖像中提取的持票人特征,與數(shù)據(jù)庫(kù)中已儲(chǔ)存的購(gòu)票人特征重合度達(dá)到80%以上時(shí),便能認(rèn)定“他就是他”。  

  “通常,在我們的系統(tǒng)里。這組數(shù)據(jù)稱(chēng)為‘680維特征’?!闭掳匦艺f(shuō)。