物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊(cè)

3D人臉識(shí)別技術(shù)準(zhǔn)確率提升

作者:本站收錄
來(lái)源:安防知識(shí)網(wǎng)
日期:2018-10-09 09:02:46
摘要:人臉識(shí)別在2018年已成為全球在視頻智能應(yīng)用技術(shù)的主流,不少機(jī)場(chǎng)及車站也大量采用人臉識(shí)別通關(guān)檢查系統(tǒng),讓人臉識(shí)別技術(shù)受到各行業(yè)的高度關(guān)注。據(jù)MarketsandMarkets預(yù)估,人臉識(shí)別全球市場(chǎng)產(chǎn)值將從2017年的40.5億美元,成長(zhǎng)至2020年的77.6億美元,可以預(yù)期市場(chǎng)的快速成長(zhǎng)將帶動(dòng)并加速各種行業(yè)在人臉識(shí)別的應(yīng)用發(fā)展。

  人臉識(shí)別在2018年已成為全球在視頻智能應(yīng)用技術(shù)的主流,不少機(jī)場(chǎng)及車站也大量采用人臉識(shí)別通關(guān)檢查系統(tǒng),讓人臉識(shí)別技術(shù)受到各行業(yè)的高度關(guān)注。據(jù)MarketsandMarkets預(yù)估,人臉識(shí)別全球市場(chǎng)產(chǎn)值將從2017年的40.5億美元,成長(zhǎng)至2020年的77.6億美元,可以預(yù)期市場(chǎng)的快速成長(zhǎng)將帶動(dòng)并加速各種行業(yè)在人臉識(shí)別的應(yīng)用發(fā)展。

  臺(tái)灣人臉識(shí)別技術(shù)的研究始于90年代末期,但直到2005年后期一些安全應(yīng)用的人臉識(shí)別系統(tǒng)才開(kāi)始進(jìn)入市場(chǎng)。人臉識(shí)別核心技術(shù)的發(fā)展對(duì)臺(tái)灣安防產(chǎn)業(yè)來(lái)說(shuō)算是一個(gè)相當(dāng)重要的技術(shù)發(fā)展環(huán)節(jié),雖然現(xiàn)在人臉識(shí)別率已達(dá)到90%以上,但周邊環(huán)境的變化依然是技術(shù)應(yīng)用的最大問(wèn)題。

  3D感測(cè)成主流技術(shù)

  2D人臉識(shí)別技術(shù)已經(jīng)走到瓶頸,這兩年3D人臉識(shí)別技術(shù)開(kāi)始冒出,目前較常見(jiàn)的3D感測(cè)技術(shù)有下列四種:

  1、立體視覺(jué)(Stereo Vision):透過(guò)2個(gè)相機(jī)模塊拍攝影像,進(jìn)行三角測(cè)量法等運(yùn)算取得物體距離,是四者中唯一只需RGB相機(jī)模塊而不用IR(紅外線)模塊的技術(shù)。由于需進(jìn)行影像運(yùn)算,通常需要一個(gè)額外影像運(yùn)算芯片輔助,因此有些芯片廠商會(huì)推動(dòng)這項(xiàng)技術(shù)。

  2、結(jié)構(gòu)光(Structured Light):原理是對(duì)目標(biāo)打出光條紋,再透過(guò)打出去的光紋變化來(lái)計(jì)算形狀和距離,較常見(jiàn)于工業(yè)檢測(cè)和研究用途。隨著IR發(fā)展,Structured Light技術(shù)也能透過(guò)IR發(fā)射光紋,所以基本零組件包括IR發(fā)射器、IR相機(jī)模塊與RGB相機(jī)模塊。

  3、光斑圖案編碼(Light Coding):曾被微軟應(yīng)用在第一代Kinect體感攝影機(jī),其原理是IR雷射發(fā)射后會(huì)經(jīng)過(guò)光柵,將光平均分布在測(cè)量空間中,再透過(guò)IR相機(jī)記錄每個(gè)空間的雷射散斑,設(shè)備上需要IR發(fā)射器、IR相機(jī)模塊與RGB相機(jī)模塊。

  4、飛行時(shí)間測(cè)距(Time of Flight,簡(jiǎn)稱TOF):為微軟并購(gòu)的3DV Systems,也是第二代Kinect采用的技術(shù)。其原理是透過(guò)IR雷射發(fā)射,獲得空間中每一點(diǎn)達(dá)到觀測(cè)點(diǎn)的時(shí)間,進(jìn)而推算出距離,得出3D景深圖。因此需要IR發(fā)射器和接收器,并配合RGB相機(jī)模塊和感光組件或感應(yīng)數(shù)組。

  Stereo Vision和Structured Light都需要圖像分析運(yùn)算,但Stereo Vision的軟件運(yùn)算較繁雜,不適合大量多點(diǎn)感測(cè),且光源和鏡頭間的基線長(zhǎng)度也得拉長(zhǎng),整體而言并不適合用于3D感測(cè)。

  相對(duì)地,TOF可記錄每個(gè)觀測(cè)點(diǎn)的時(shí)間數(shù)據(jù)后再進(jìn)行計(jì)算,Light Coding也只需轉(zhuǎn)換各區(qū)域散斑以計(jì)算距離,復(fù)雜度較低;不過(guò)這兩項(xiàng)技術(shù)均需IR發(fā)射和接收器,也另外需要內(nèi)存甚至操作數(shù)件,故成本較高。此外,兩者的運(yùn)算原理不同,TOF單點(diǎn)IR只需記錄時(shí)間,理論上會(huì)比Light Coding先分析散斑圖形再運(yùn)算來(lái)得簡(jiǎn)易;而Light Coding是將整個(gè)畫(huà)面切割測(cè)距,要得到概略景深圖較容易。整體而言,TOF的反應(yīng)速度和精準(zhǔn)度最佳,而Light Coding在不需要精細(xì)景深圖時(shí)的表現(xiàn)較平均,Stereo Vision的成本則較低。

  雙技術(shù)結(jié)合 各有利弊

  近年許多人臉識(shí)別軟件公司紛紛提出人臉識(shí)別結(jié)合RFID或Beacon、指紋等相關(guān)技術(shù),利用雙重關(guān)卡防止誤判或提升辨識(shí)速度,但卻忽略了使用人臉識(shí)別的主要初衷——原就是不需再攜帶其他身分驗(yàn)證裝置,故各有利弊。以目前手機(jī)App廣泛使用人臉偵測(cè)(Face Detection)及特征擷取(Feature Extraction)這兩類服務(wù)來(lái)說(shuō),最常見(jiàn)的就是修圖軟件或是影片屏蔽的應(yīng)用,許多公司都有提供在線的Web API供大家開(kāi)發(fā),在行動(dòng)裝置上亦提供iOS及Android系統(tǒng)的SDK,算是非常普遍的技術(shù)支持。

人物訪談