久久九九精品久久_久久生活片_欧美日韩国产三区_九九人人_伊人天天操_www.一区

新聞BANNER

如何解鎖安防行業(yè)人臉識別這個小目標(biāo)

2017-04-04 00:04

    2016年北京安博會上,各家公司人臉識別產(chǎn)品百花齊放,但就是在這個人臉識別的鼎盛時代, 實際上需求最痛的安防行業(yè)還是無法大規(guī)模應(yīng)用。根據(jù)最高人民檢察院和最高人民法院關(guān)于刑事案件數(shù)量的統(tǒng)計,2015年全國人民法院新收刑事一審案件1126748件,同比上升8.29%。(數(shù)據(jù)來源:2001-2016年《中國法律年鑒》)。滿大街的攝像頭,各種智能檢測分析,依舊有很多人肆無忌憚地進(jìn)行著違法犯罪活動。   

    針對此,本文首先回顧了目前人臉識別技術(shù)的發(fā)展?fàn)顩r,然后重點探討了目前安防行業(yè)大規(guī)模應(yīng)用人臉識別還需要解決的問題。   

    人臉識別技術(shù)的發(fā)展?fàn)顩r   

    在深度學(xué)習(xí)技術(shù)出現(xiàn)之前,幾乎所有人臉檢測都是采用滑動窗口式的方法。在識別輸入圖像前,我們會先用一個固定大小的窗口在輸入圖像上進(jìn)行滑動,窗口框定的區(qū)域會被送入到分類器,去判斷是人臉窗口還是非人臉窗口。滑動的窗口其大小是固定的,但是人臉的大小則多種多樣,為了檢測不同大小的人臉,還需要把輸入圖像縮放到不同大小,使得不同大小的人臉能夠在某個尺度上和窗口大小相匹配。這種滑動窗口式的做法有一個很明顯的問題,就是有太多的位置要去檢查,去判斷是人臉還是非人臉。   

    2000年前后出現(xiàn)的Viola-Jones人臉檢測器,使得這種人臉檢測技術(shù)開始成熟起來,并出現(xiàn)了相關(guān)的實際應(yīng)用,例如數(shù)碼相機中的人臉對焦的功能,照相的時候,相機會自動檢測人臉,然后根據(jù)人臉的位置把焦距調(diào)整得更好。   

    就人臉檢測而言,人臉可以大致看成是一種剛體,通常情況下不會有非常大的形變,比方說嘴巴變到鼻子的位置上去。但是對于公安實際應(yīng)用中既關(guān)注人臉也關(guān)注全身來說,人可以把胳膊抬起來,也可以把腿翹上去,這使得人體有非常多的非剛性變化,從而使得檢測的準(zhǔn)確率大大降低。

    2013年底,深度學(xué)習(xí)給人臉檢測任務(wù)點起了一把火,這個火種就是R-CNN,其中R對應(yīng)于“Region(區(qū)域)”,意指CNN以圖像區(qū)域作為輸入,這個工作最終發(fā)展成了一個系列,R-CNN的變革首當(dāng)其沖的是拋棄了滑動窗口范式,取而代之的是一個新的生成候選窗口的環(huán)節(jié);其次不再采用人工設(shè)計的特征,而是用CNN來自動學(xué)習(xí)特征。傳統(tǒng)滑動窗口范式做目標(biāo)檢測時,需要對每一個物體去設(shè)計和和學(xué)習(xí)單獨的檢測器,例如做人臉檢測和車輛檢測,兩個檢測器特征會不一樣,分類器也不一樣,對于每一類物體,需要去嘗試不同的特征和分類器的組合。但是現(xiàn)在,采用深度學(xué)習(xí)的R-CNN在物體類別上沒有任何限制。換句話說,它既可以檢測人臉,也可以同時檢測其他類別的物體,比如說人體形態(tài),這在公安實戰(zhàn)應(yīng)用中是一個非常重要的優(yōu)勢。   

    R-CNN帶來了目標(biāo)檢測精度的一次巨大提升,然而由于所采用的候選窗口生成方法和深度網(wǎng)絡(luò)都具有比較高的計算復(fù)雜度,因而檢測速度非常慢。為了解決R-CNN的速度問題,緊接著出現(xiàn)了Fast R-CNN和Faster R-CNN,速度一個比一個快。與此同時,一部分研究人員把研究視角切換到將傳統(tǒng)的人臉檢測技術(shù)和深度網(wǎng)絡(luò)(如CNN)的結(jié)合,保證檢測速度的情況下進(jìn)一步提升精度,專做人臉檢測的Cascade CNN可以認(rèn)為是傳統(tǒng)技術(shù)和深度網(wǎng)絡(luò)相結(jié)合的一個代表,吸取傳統(tǒng)人臉檢測技術(shù)中的精華,借鑒深度學(xué)習(xí)研究的最新成果,提升某一類目標(biāo)檢測精度和速度,這是一條值得繼續(xù)探索的道路。   

    目前,人臉檢測方法正日趨成熟,在現(xiàn)實場景中也已經(jīng)得到了比較廣泛的應(yīng)用,在特定配合場景下如照片的檢索、門禁考勤等應(yīng)用,目前已基本成熟。但是人臉檢測問題還并沒有被完全解決,復(fù)雜多樣的姿態(tài)變化、千奇百怪的遮擋情況、捉摸不定的光照條件、不同的分辨率、迥異的清晰度、微妙的膚色差,各種內(nèi)外因素的共同作用讓人臉的變化模式變得極其豐富,在非配合場景下的萬級及以上的目標(biāo)檢測如安防監(jiān)控庫的應(yīng)用,依舊任重道遠(yuǎn)。   

    安防行業(yè)應(yīng)用人臉識別   

    具體到安防行業(yè),特定配合場景下如公安系統(tǒng)的大庫比對、身份查重等,人臉識別等應(yīng)用已經(jīng)有很多成功的案例。與簡單的靜態(tài)場景相比,安防市場中應(yīng)用前景更廣闊的一個方向是動態(tài)場景下的人臉識別:基于視頻中的人臉照片進(jìn)行遠(yuǎn)距離、快速、無接觸式的重點人員布控預(yù)警。讓應(yīng)用于車站、機場、地鐵等重點場所和大型商場超市等人群密集的公共場所視頻監(jiān)控系統(tǒng)能夠?qū)σ曨l圖像進(jìn)行采集、自動分析、抓取人臉實時比對,主動在監(jiān)控場景中識別重點關(guān)注人員,實現(xiàn)重點人員的布控和識別。這是一個熱鬧的研究方向,同時也是一個巨大的研究挑戰(zhàn)。   

    算法前移:計算資源與算法精度的平衡問題   

    采用深度學(xué)習(xí)的方法來做人臉識別,需要消耗非常多的計算資源,針對服務(wù)器資源昂貴的市場情況,想要實現(xiàn)智能監(jiān)控系統(tǒng)的大規(guī)模部署,必須要考慮到承擔(dān)的經(jīng)濟(jì)成本。目前不少公司采用了將算法內(nèi)嵌至前端攝像機的經(jīng)濟(jì)做法,比如科達(dá)公司推出的感知型攝像機等,讓前端攝像機具備人臉檢測的功能,后端服務(wù)器再做二次分析,以此減少后端服務(wù)器的計算壓力。   

    顯而易見,如果想在前端攝像機上集成精度高速度快的人臉識別模塊,勢必需要前端硬件性能的匹配。而目前已有的硬件還達(dá)不到這樣的要求,只能在算法上做一些犧牲,如降低算法的復(fù)雜性,但這樣應(yīng)用到實際場景中,則會造成檢測效果的降低,如漏檢、誤檢。   

    大數(shù)據(jù)訓(xùn)練:數(shù)據(jù)從何而來以及如何訓(xùn)練   

    深度學(xué)習(xí)最核心的優(yōu)勢在于深度化,用足夠多的數(shù)據(jù)來訓(xùn)練,訓(xùn)練的越多,算法的魯棒性、泛化能力越強。目前深度學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)普遍都是幾十萬、上百萬級,像一些互聯(lián)網(wǎng)行業(yè)的IT巨頭們,他們的訓(xùn)練數(shù)據(jù)都是上千萬、甚至上億級別。   

    Fei-Fei LI在2015年TED TALK中向公眾介紹人工智能中計算機視覺技術(shù)的最新進(jìn)展時說道,ImageNet中下載了接近十億張照片,在巔峰時期,總共有接近五萬工作者,來自167個國家,幫助他們清理、分類、標(biāo)記,接近十億張候選圖片。“十億張”、“五萬工作者”這些關(guān)鍵詞無不暗示著獲取有標(biāo)注數(shù)據(jù)的時間和金錢成本。   

    首先,安防行業(yè)的“十億張”從何而來?據(jù)了解,盡管視頻監(jiān)控帶來了圖片與視頻資源的激增,一方面出于安全及隱私的考慮,不少公司做大數(shù)據(jù)訓(xùn)練時,樣本采用的是本公司自有建設(shè)的監(jiān)控資源庫,小范圍的區(qū)域監(jiān)控遠(yuǎn)遠(yuǎn)夠不成海量;另一方面,目前安防產(chǎn)品的形態(tài)并沒有給深度學(xué)習(xí)留下一個很好的空間,比如說安防系統(tǒng)的數(shù)據(jù)大多都存儲在一個錄像機、存儲設(shè)備里,他們可以是DVR、NVR、IPSAN或者云存儲里,這樣的構(gòu)成體系不太方便讓一個計算設(shè)備把它的數(shù)據(jù)挖掘出來,然后去處理。如果在未來可以有一個更友好的基礎(chǔ)設(shè)施出現(xiàn):所有的監(jiān)控攝像機都連到一個云上,在云上把深度學(xué)習(xí)的算法加載在上面,讓其接觸并分析所有的數(shù)據(jù),真正實現(xiàn)大數(shù)據(jù)訓(xùn)練。   

    其次,“五萬工作者”的研發(fā)體量可望不可及。每天,安防企業(yè)的研發(fā)者都需要花大量的精力和人力投入到給圖像打標(biāo)簽的工作上,但是大量無監(jiān)督數(shù)據(jù)的獲取成本卻是微乎其微的。   

    回顧深度學(xué)習(xí)的發(fā)展史,有趣的是,2006年Hinton教授等人倡導(dǎo)的卻恰恰是利用無監(jiān)督學(xué)習(xí)來對深層神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練。對無監(jiān)督數(shù)據(jù)的學(xué)習(xí)能力嚴(yán)重不足,以致大量無監(jiān)督數(shù)據(jù)就像富含黃金的沙海,我們卻沒有高效淘金的利器。直接從大量無監(jiān)督數(shù)據(jù)中學(xué)習(xí)模型確實是非常困難的,“無師自通”并非朝夕之功,但“少量有監(jiān)督數(shù)據(jù)+大量無監(jiān)督數(shù)據(jù)”的模式也許值得大力研究。   

    監(jiān)控攝像機:智能是左手,高清是右手   

    從模擬到720p到1080p到4K,更高清甚至超清的監(jiān)控攝像機始終是安防人的首要關(guān)注點,畢竟沒有有效的圖像采集信息,后面一切圍繞圖片或視頻展開的智能應(yīng)用都是紙上談兵。   

    一個很典型的例子便是2013年波士頓馬拉松暴恐案的偵破過程,警方在監(jiān)控畫面中定位到涉案的兩個嫌疑人,盡管嫌疑人距離監(jiān)控攝像機不遠(yuǎn),但他們的面部完全沒有到達(dá)一個清晰可辨的程度,后來警方借助現(xiàn)場媒體、民眾提供的視頻、照片,才鎖定了犯罪嫌疑人。因此,如果數(shù)據(jù)在采集過程中就沒有捕捉到,后期是沒有辦法把它捏造出來的,要根本解決這個問題,需要發(fā)明更好的監(jiān)控攝像機,能夠在大廣角的情況下,仍然可以看清很遠(yuǎn)的距離。時至今日,除了特定場景下的高空瞭望攝像機外,我們依然沒有很好的監(jiān)控攝像機可以遠(yuǎn)距離采集有效的人臉信息。   

    總結(jié)人臉識別的最終訴求莫過于確認(rèn)身份,回答“他是誰?”、“他在干什么?”、“何地?”、“何時?”這四個問題,從而通過決策推理解決“應(yīng)該采取什么措施”的問題。在科研上,人臉識別技術(shù)日新月異,但落地到實際應(yīng)用時,大規(guī)模部署時系統(tǒng)的經(jīng)濟(jì)性、復(fù)雜環(huán)境下系統(tǒng)的魯棒性以及對應(yīng)的硬件支撐都是需要考慮的現(xiàn)實問題,解決了這些,小目標(biāo)的達(dá)成也將觸手可及。

上一條:智慧消防監(jiān)測預(yù)警系統(tǒng)

下一條:客戶至上,誠信服務(wù)

官方微信

手機版

Copyright ? 廣州科締歐電子科技有限公司 All rights reserved |ICP備18040959號

  • 點擊這里給我發(fā)消息 人工智能產(chǎn)品銷售
  • 點擊這里給我發(fā)消息 智能交通產(chǎn)品銷售
  • 點擊這里給我發(fā)消息 產(chǎn)品技術(shù)服務(wù)
主站蜘蛛池模板: 福利社午夜影院 | 免费看h | 欧美精品一区二 | 成av人片在线观看www | 国产欧美精品 | 日韩成人不卡 | 99视频在线看 | 国产无套丰满白嫩对白 | 日本在线网 | 午夜精品一区二区三区四区 | 亚洲国产成人久久综合一区,久久久国产99 | 国产精品久久在线观看 | 欧美一级片毛片免费观看视频 | 欧美成人精品一区二区 | 成视频年人免费看黄网站 | 欧美日韩不卡合集视频 | 黄色毛片在线看 | 午夜精品一区二区三区在线 | 国产精品美女久久久久久久久久久 | 久草在线青青草 | 中文字幕一区二区三区四区 | 久久精品国产精品青草 | av片在线观看网站 | 欧美日韩一区二区三 | 第一色在线 | 日韩精品视频在线观看免费 | 亚洲精品一区二三区 | 久久精品a一级国产免视看成人 | 一区二区三区四区日韩 | 热久久免费视频 | 亚洲成人免费 | 日韩精品视频在线观看免费 | 成人免费xxx在线观看 | 亚洲国产精品久久久 | 999在线观看精品免费不卡网站 | 青青草视频在线免费观看 | 天天舔日日干 | 97夜夜操 | 国产综合视频 | 日韩欧美国产成人一区二区 | 国产目拍亚洲精品99久久精品 |