物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

人臉識別新銳公司格靈深瞳要做基于AI的智慧腦

作者:本站收錄
來源:商業(yè)電訊
日期:2017-02-20 17:05:53
摘要:格靈深瞳雖然也在軟件方面有車輛識別引擎——威目車輛大數(shù)據(jù)系統(tǒng),以及對視圖進(jìn)行結(jié)構(gòu)化分析、并提取有用信息的威目視圖大數(shù)據(jù)分析平臺,不過,這家出名較早的 AI 公司卻也做了兩款攝像頭硬件——皓目行為分析儀和深瞳人眼攝像機(jī),為什么?
關(guān)鍵詞:AI格靈深瞳人臉識別

  如今,AI 創(chuàng)業(yè)風(fēng)頭正勁,各種 AI 公司如雨后春筍般冒了出來。但同時,由于 AI 還處于一個非常早期的階段,市場需求尚不明顯,大部分圖像識別類的 AI 企業(yè)都在試圖進(jìn)入安防等領(lǐng)域,同質(zhì)化稍顯嚴(yán)重。格靈深瞳雖然也在軟件方面有車輛識別引擎——威目車輛大數(shù)據(jù)系統(tǒng),以及對視圖進(jìn)行結(jié)構(gòu)化分析、并提取有用信息的威目視圖大數(shù)據(jù)分析平臺,不過,這家出名較早的 AI 公司卻也做了兩款攝像頭硬件——皓目行為分析儀和深瞳人眼攝像機(jī),為什么?

  AI 圖像識別在算法上并無大的鴻溝

  AI 在前些年還是一個難度非常大的領(lǐng)域,但最近幾年,由于深度學(xué)習(xí)等技術(shù)的突破,AI 的入門門檻已經(jīng)降低了很多。“現(xiàn)在聰明一點的大學(xué)生聽一些網(wǎng)絡(luò)上的課程,再下一個 Caffe(專門為深度學(xué)習(xí)而開發(fā)的框架),買一個有顯卡的電腦就可以寫一個深度學(xué)習(xí)模型了。AI 并不是一個難度特別高的技術(shù)?!备耢`深瞳創(chuàng)始人趙勇如此表示。

  雖然趙勇認(rèn)為這并不意味著任何創(chuàng)業(yè)者都可以隨便進(jìn)入的行業(yè),因為在工業(yè)界,客戶的要求也已經(jīng)提高了。但市面上已經(jīng)冒出了一大批做圖像識別的 AI 公司卻也是一個不爭的事實。

人臉識別新銳公司格靈深瞳要做基于AI的智慧腦

  動點科技也體驗了格靈深瞳的圖像識別系統(tǒng),我們在格靈深瞳園區(qū)及辦公室走了一圈,以便被各個攝像頭記錄到,之后我們在系統(tǒng)的一個終端通過電腦攝像頭拍攝個人影像,系統(tǒng)能夠?qū)崟r地通過人臉識別搜索出其它攝像頭所拍攝到的這個人的照片,并以百分比的形式標(biāo)明其相似程度。從展示效果來看,其識別準(zhǔn)確率還是非常棒的。官方稱在人臉像素點 100 以上的前提下能夠達(dá)到 98%。

  而這便是格靈深瞳一直強(qiáng)調(diào)的“網(wǎng)絡(luò)”,“在我們的網(wǎng)絡(luò)中,每一個傳感器不僅僅可以識別自己視野里的目標(biāo),還可以和網(wǎng)絡(luò)中聯(lián)通的其他傳感器一起協(xié)同工作,在網(wǎng)絡(luò)規(guī)模下發(fā)揮更大的作用。”趙勇曾在知乎上如此解釋。

  不過,據(jù)動點科技所知,目前市場上一些公司的圖像識別準(zhǔn)確率也已經(jīng)非常高了,如果想要同樣做一個“網(wǎng)絡(luò)”,自然不是什么難事。

  開發(fā)人眼攝像機(jī),解決“看得遠(yuǎn)”與“看得寬”的矛盾

  正如格靈深瞳的相關(guān)負(fù)責(zé)人覃曉飛所言,“人臉識別的算法其實已經(jīng)做得很好了,但是前提是照片足夠清晰,這樣才能有較高的識別準(zhǔn)確率?!睋?jù)了解,目前人臉識別的應(yīng)用有著很大的局限性,基本上大家做人臉識別都是在四五米以內(nèi),而一旦超過這個距離,識別準(zhǔn)確率將急劇下降。當(dāng)然,想要看得遠(yuǎn)也可以,但其必須以犧牲視場角為代價,顯然這并不是行業(yè)愿意看見的。

  我們可以用 單位面積像素=分辨率/視野面積 來解釋“看得遠(yuǎn)”與“看得寬”的矛盾,據(jù)趙勇介紹,目前想要很好地識別人臉,照片人臉部分的像素點至少要達(dá)到 100,“看得寬”則意味著單位面積像素低,而要達(dá)到人臉像素點至少 100 的目的,人臉只能離攝像頭近一點。

  從原理上來看,想要解決這個問題理論上其實可以通過增加分辨率來達(dá)到。不過其效果貌似并不明顯,格靈深瞳介紹 4K 相機(jī)的識別距離只能增加到 10 米左右,而 7K 相機(jī)能增加到 20 米左右,效果都不太明顯。而且,如此高像素對網(wǎng)絡(luò)帶寬及處理器都帶來了極大的壓力。為此,格靈深瞳創(chuàng)造了一款名叫深瞳人眼攝像機(jī)的產(chǎn)品,用現(xiàn)有的元器件來實現(xiàn)遠(yuǎn)距離(50 米)高清人臉抓拍,而且視場角仍能保持在 70 度。 趙勇非常看好深瞳人眼攝像機(jī),并認(rèn)為這是他們目前最大的優(yōu)勢之一 ?!笆忻嫔辖^對還沒有類似的產(chǎn)品。”趙勇表示。

人臉識別新銳公司格靈深瞳要做基于AI的智慧腦

  據(jù)了解,深瞳人眼攝像機(jī)目前所使用的感光元器件就是普通的 CMOS,但格靈深瞳利用一種名叫像素動態(tài)瞬時分配的技術(shù),可以瞬時將局部畫面的有效像素提升百倍以上,整體畫面可以達(dá)到數(shù)億等效像素,從而實現(xiàn)在 50 米內(nèi)可以展現(xiàn)清晰的可識別人臉,100 米內(nèi)看清全身特征。

  至于具體的原理,格靈深瞳曾解釋這是仿照人眼而做的:人眼中像素并不是均勻分布的,而是集中分布在面積極小的黃斑區(qū)域,人眼會受大腦的控制選擇性地先把自己關(guān)注的區(qū)域看清楚。當(dāng)然,格靈深瞳人眼攝像機(jī)所采用的 CMOS 上的像素點是均勻分布的,而如何具體模擬人眼黃斑功能,這便是他們最核心的機(jī)密了。但不管怎么來說,深瞳人眼相機(jī)的確是做到了看得遠(yuǎn)的同時還能看得寬。

  值得一提的是,格靈深瞳早在 2014 年,便通過與硬件廠商合作發(fā)布了一款用于安防的皓目行為分析儀——本質(zhì)上是一款深度攝像頭,格靈深瞳主要為該硬件提供特定的算法與軟件。

人臉識別新銳公司格靈深瞳要做基于AI的智慧腦

  不與巨頭競爭攝像頭市場,格靈深瞳要做的是智慧腦

  說到監(jiān)控攝像頭,那就不得不提到市場上的巨頭海康威視。據(jù)了解,??低曇呀?jīng)實現(xiàn)多年全球視頻監(jiān)控設(shè)備市場份額第一的成績,產(chǎn)品和解決方案應(yīng)用于全球逾 100 多個國家和地區(qū)。僅 2015 年,??低晫崿F(xiàn)營收達(dá) 252.71 億元,實現(xiàn)利潤總額 67.50 億元。顯然,與??低暤染揞^直接競爭并不是一個好的選擇。

  趙勇同樣也認(rèn)識到了這一點,對格靈深瞳而言,其主要是想利用海量視頻大數(shù)據(jù),通過圖像識別等AI 手段,從中提取出有用情報,幫決策者進(jìn)行相關(guān)決策的智慧系統(tǒng)——格靈深瞳將之稱為智慧腦。因此,趙勇表示其與攝像頭巨頭并不是競爭關(guān)系,相反,格靈深瞳也會利用??低暤染揞^企業(yè)的攝像頭產(chǎn)品,只是在需要同時滿足“看得遠(yuǎn)”與“看得廣”的大場景下才會用深瞳人眼攝像機(jī)填補(bǔ)巨頭在產(chǎn)品上的空缺。

  “最開始,PC 剛出來的時候,人們對其中的硬盤型號、處理器型號等都非常關(guān)心;但慢慢地人們開始只關(guān)心品牌;而到現(xiàn)在,隨著硬件的完善,人們只關(guān)心用的 iOS 系統(tǒng)還是 Windows 系統(tǒng)了。”趙勇認(rèn)為視頻監(jiān)控行業(yè)也會像 PC 行業(yè)一樣,未來,只有提供更好服務(wù)的企業(yè)才有更大的價值。

人物訪談