3月6日,研發(fā)人員戴口罩進行人臉識別檢測。受訪者供圖
3月6日,在中國中鐵科學(xué)研究院門禁口,員工們戴著口罩和安全帽,排隊陸陸續(xù)續(xù)“刷臉打卡”。他們沒有摘下口罩或帽子,僅在屏幕前簡短停留,員工信息及體溫狀況就出現(xiàn)在了屏幕上,工作人員也實現(xiàn)了安全、快速入場。
在人工智能技術(shù)迅猛發(fā)展的當(dāng)下,人臉識別已經(jīng)不是一件新鮮事。但新冠肺炎疫情下,在建筑工地、學(xué)校機關(guān)等需要鑒別入場人員身份信息的場所,人員在佩戴口罩、安全帽后,實現(xiàn)人臉快速識別并同步檢測體溫,成為一項全新的技術(shù)成果。戴口罩進行人臉識別的技術(shù)難點在哪里?現(xiàn)有成果如何提供“一手抓防疫、一手抓生產(chǎn)”的解決方案?未來該技術(shù)還有怎樣的應(yīng)用空間?3月6日,記者采訪了相關(guān)科研人員。
全員口罩 身份識別面臨新挑戰(zhàn)
“滴,體溫數(shù)據(jù)正常!”復(fù)工后,在四川成都青白江區(qū),肩負(fù)成都地鐵隧道管片生產(chǎn)重任的中鐵八局橋梁公司的復(fù)工人員,正在車間門口掃碼企業(yè)自主研發(fā)的“每日疫情統(tǒng)計小程序”,實現(xiàn)人員疫情防控信息實時跟蹤。進入復(fù)工高峰期以來,借助云平臺、大數(shù)據(jù)及物聯(lián)網(wǎng)系統(tǒng)等,施工人員體溫門禁系統(tǒng)、渣土車遠程管理、人員無線定位、視頻監(jiān)控等諸多“黑科技”正有力促進“一手抓防疫、一手抓生產(chǎn)”的有序推進。
“疫情發(fā)生后,復(fù)工現(xiàn)場的管理也出現(xiàn)諸多新的技術(shù)需求,在戴口罩、安全帽的情況下,如何實現(xiàn)入場人員準(zhǔn)確識別,就是復(fù)工管理的一個重點方向。”中國中鐵科研院技術(shù)中心智慧工地聯(lián)合實驗室研發(fā)人員趙陽說,按照安全生產(chǎn)要求,過去施工工地已經(jīng)使用的“智慧工地平臺系統(tǒng)”,其中一個重要功能就是對進入工地人員進行身份識別,“但疫情下,戴上口罩、安全帽,還要測體溫,成為新技術(shù)挑戰(zhàn)。”
這項技術(shù)難點在哪兒?原來的人臉識別算法,是根據(jù)面部特征關(guān)鍵點來進行識別的,算法納入的關(guān)鍵點越多,識別的結(jié)果也就越精確。但佩戴口罩后,可供識別的“關(guān)鍵點”大幅減少。“鼻子以下的面部特征被掩蓋,面部特征關(guān)鍵點減少,機器之前學(xué)習(xí)的特征判別能力隨之降低。”趙陽說,口罩會使原有的人臉識別算法模型失效,使機器無法識別當(dāng)前的人。同時,口罩類型較多且遮擋程度不一,也提升了難度。
“針對人臉識別的新需求,如果對已有的智慧工地平臺進行大范圍硬件更改,一方面增加設(shè)備、提高成本,另一方面改造周期較長,難以滿足復(fù)工復(fù)產(chǎn)要求。”趙陽說,該研發(fā)團隊通過加強軟件算法、升級系統(tǒng)平臺,提出了解決方案。
聚焦眼部 優(yōu)化注意力算法模型
“人臉識別一般分為兩個步驟,一是人臉檢測,二是人臉配對。”趙陽說,識別的流程是,人臉機先從視頻圖像中找出人臉,然后通過人臉上的眼睛、鼻子、嘴巴、眉毛等面部的特征,經(jīng)過一定算法,在人員數(shù)據(jù)庫識別出對應(yīng)的人。
記者在識別后臺管理系統(tǒng)看到,系統(tǒng)的“人員管理”一欄,已經(jīng)錄入了該單位所有工作人員的姓名、部門、工號、電話等基本信息,以及相對應(yīng)的個人高清照片。當(dāng)戴著口罩的員工進入辦公樓刷臉時,系統(tǒng)立刻將檢測出的人臉配對,鑒別出員工身份,同時語音報出測量的體溫,而在硬件方面,該設(shè)備僅在原有人臉識別的平板電腦上,新增了一個測溫頭。
戴口罩后如何提高識別通過率?前提就是盡可能地增加面部特征關(guān)鍵點。“當(dāng)面部幾乎一半被遮擋后,面部特征關(guān)鍵點就主要集中在了眼睛和眉毛兩個部位。”趙陽說。
“我們從算法模型上突圍,采用眼部、眉毛等局部特征與整體人臉特征的融合,并結(jié)合注意力機制增強眼部特征,通過訓(xùn)練眼部關(guān)鍵點的模型,來提升模型在口罩遮擋下的人臉識別率。”趙陽說,在人臉遮擋環(huán)境下,可通過識別眼部關(guān)鍵點作為一種“注意力模型”,快速掃描全局圖像,獲得需要重點關(guān)注的目標(biāo)區(qū)域眼部,并形成注意力焦點。“而后對眼部這一區(qū)域投入更多注意力資源,以獲取更多所需要關(guān)注目標(biāo)的細節(jié)信息,而抑制其他無用信息。”
采用同樣的原理,在算法層面,針對基于人臉全局特征及局部特征相結(jié)合的方法,可優(yōu)化現(xiàn)有人臉識別算法模型,當(dāng)人面部出現(xiàn)其他遮擋時,也同樣能夠精準(zhǔn)鑒別。“如戴安全帽進入施工項目時,人臉識別依然有效,就是這么實現(xiàn)的。”趙陽說,當(dāng)前通過大量訓(xùn)練數(shù)據(jù),戴口罩或戴安全帽人臉識別率可達到99.9%。
除了能夠精準(zhǔn)識別出戴口罩的人,該實驗室人臉識別系統(tǒng)還特別增加了口罩與安全帽檢測和提示功能,以保障工程建設(shè)人員的安全。“這是與同類技術(shù)相比,我們技術(shù)成果的特色所在。”趙陽說,當(dāng)開啟口罩與安全帽檢測功能時,設(shè)備配有沒戴口罩自動語音提示;若沒戴安全帽,采集設(shè)備上則會出現(xiàn)“請佩戴安全帽!”提示。
“主要是升級了后臺的算法,其次是盡可能小地對硬件系統(tǒng)做了改進,最終實現(xiàn)了多項新功能的添加。”趙陽說。
信息增值 挖掘數(shù)據(jù)背后的價值
其實在疫情暴發(fā)前,面部遮擋障礙的人臉識別技術(shù),已有不同程度應(yīng)用。如在安防領(lǐng)域,大多數(shù)犯罪嫌疑人為了躲避“天眼”等監(jiān)控設(shè)備追蹤,往往會戴上帽子或口罩,這時候更精準(zhǔn)化的人臉識別便可以幫助更好地破案。
“針對越來越多的不同識別情況,一些科研人員正從硬件上想辦法,通過添置硬件設(shè)備,增加新的功能。”趙陽說,高精度識別也是對大數(shù)據(jù)的深入挖掘。“在當(dāng)前硬件技術(shù)條件下,對現(xiàn)場采集的數(shù)據(jù)進一步挖掘,可以短時間內(nèi)實現(xiàn)更多功能。”
他提出,高清監(jiān)控攝像機采集的圖片、視頻信息,經(jīng)過后臺分析,在不改變原有設(shè)備情況下,通過技術(shù)的提升,能夠?qū)崿F(xiàn)身份識別、安全帽佩戴檢測、反光衣穿戴識別、車輛信息狀態(tài)展示、危險源管理、安全區(qū)劃分等,真正實現(xiàn)信息增值、硬件降成本。
“這種挖掘能力進步后,舉個簡單例子,在未來我們或許不再看到道路上如小鳥臥枝頭一樣密密麻麻的電子眼,一個監(jiān)控設(shè)備加上高超的識別算法能力,就能解決所有需求。”趙陽說。
為讓新的智慧工地平臺系統(tǒng)持續(xù)適用于更加復(fù)雜的場景應(yīng)用,趙陽團隊還將進一步進行技術(shù)創(chuàng)新。“下一步計劃豐富后臺管理功能,增加工地防反光背心檢測等其他識別功能,同時開發(fā)系統(tǒng)接口,使其可無縫銜接當(dāng)前的人力資源管理系統(tǒng)等,使人員一次打卡、網(wǎng)絡(luò)通用。”趙陽說。