從國內(nèi)疫情爆發(fā)算起,小半年時間過去了,但你的手機還是不能認(rèn)出戴口罩的你。手機的口罩人臉識別技術(shù)遲遲未能落地和手機的隱私及安全性能有
從國內(nèi)疫情爆發(fā)算起,小半年時間過去了,但你的手機還是不能認(rèn)出戴口罩的你。
手機的口罩人臉識別技術(shù)遲遲未能落地和手機的隱私及安全性能有關(guān)。
以蘋果手機為例,是最先進(jìn)的 3Apple 的 Face ID D 面部識別系統(tǒng),它通過在用戶的臉上投影 30,000 多個不可見點來感知用戶的面部特征。還使用其先進(jìn)的反欺騙神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)來防止使用照片或遮罩或任何其他技術(shù)來解鎖 iPhone。
不過這個手機端的難題首先在安防場景中得到了廣泛解決——口罩人臉識別已經(jīng)逐漸常態(tài)化,一種主流的方法就是「注意力機制人臉識別算法」,在人臉遮擋環(huán)境下,可通過識別眼部關(guān)鍵點作為一種「注意力模型」,快速掃描全局圖像,獲得需要重點關(guān)注的目標(biāo)區(qū)域眼部,并形成注意力焦點。
撰文 | 徐丹
編輯 | 四月
疫情之后,全球手機用戶都普遍存在的痛點——戴口罩時 Face ID 太難解鎖。連華為手機產(chǎn)品線副總裁也談道,Mate 20 Pro 曾嘗試戴口罩進(jìn)行人臉識別,但遺憾的是最終沒能實現(xiàn)這一功能。
五一期間,蘋果方面悄悄推出了 IOS 13.5 的最新測試版,試圖在該版本中解決「口罩臉」識別難的問題,但很遺憾,這并不是終極解決方案。
此前,如果用戶戴口罩使用 Face ID,蘋果鎖定指示燈會抖動,并且手機會震動,表明有問題。臉部 ID 超時后,系統(tǒng)會提示用戶向上滑動以進(jìn)入可輸入密碼的屏幕。
由于蘋果并不支持指紋解鎖,所以戴口罩開機流程非常繁瑣,用戶體驗差。
iOS 13.5 測試版跳過了一步。更新過后,系統(tǒng)會自動識別出戴口罩人臉,無需等待識別失敗步驟,直接跳入輸入密碼步驟。
目前,蘋果尚未透露 iOS 13.5 何時定稿并向公眾發(fā)布。
隨著疫情防控的常態(tài)化,如何識別戴口罩人臉已經(jīng)成了一個共性的問題,蘋果率先在智能手機上做到了「識別人臉是否戴口罩」,在「用戴口罩的人臉開機」上還有很長的路要走。
不過在更廣泛的安防領(lǐng)域,真正的口罩人臉識別已經(jīng)逐漸常態(tài)化。
一 人臉識別手機落地難
智能手機遲遲無法實現(xiàn)口罩識別,最重要的問題是隱私和安全性。
目前智能手機上的 3D 人臉識別功能主要有兩大流派,其一就是蘋果主導(dǎo)的結(jié)構(gòu)光(Structured Light)技術(shù),其二則是目前 Android 旗艦常用的 TOF(Time Of Flight,飛行時間)。
前者通過在用戶臉上投影不可見點來感知用戶的面部特征,后者通過記錄雷達(dá)光源到達(dá)臉部時間來感知。
戴口罩會遮住大量面部特征,出于安全性和隱私的考慮,在面部無法完全裸露的情況下手機基本都無法識別人臉,畢竟手機面部識別涉及到支付等問題。
蘋果的「戴口罩人臉識別」也只是可以「識別出人臉戴著口罩」,然后自動跳轉(zhuǎn)至密碼解鎖階段,而非直接用戴著口罩的人臉解鎖。
1 月份,國內(nèi)開始大范圍推廣口罩佩戴要求時,華為手機產(chǎn)品線副總裁李小龍曾在微博上回應(yīng)過戴口罩無法識別人臉的問題。
李小龍談道,此前在發(fā)布華為 Mate 20 Pro 時也曾嘗試戴口罩進(jìn)行人臉識別,但遺憾的是最終沒能實現(xiàn)這一功能,因為戴口罩后,人們幾乎大半張臉都被遮蓋住,而露在外面的眼睛和頭部部分特征點太少,沒能展現(xiàn)出人們的面部特色,無法保證安全性,所以最終化為才舍棄了「戴口罩/圍巾」場景的面部識別解鎖技術(shù)。
蘋果手機更是如此,Apple 的 Face ID 是最先進(jìn)的 3D 面部識別系統(tǒng),它通過在用戶的臉上投影 30,000 多個不可見點來感知用戶的面部特征。還使用其先進(jìn)的反欺騙神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)來防止使用照片或遮罩或任何其他技術(shù)來解鎖 iPhone。
僅當(dāng)用戶的眼睛,鼻子和嘴巴裸露且可掃描時,F(xiàn)ace ID 才起作用。當(dāng)用戶戴著口罩時,出于安全性考慮,該系統(tǒng)不起作用,因為該系統(tǒng)也用于銀行交易和 Apple Pay。
當(dāng)用戶戴上口罩時,這 30,000 個不可見點將被部分覆蓋,這不允許 Face ID 系統(tǒng)測量 3D 深度和面部特征,并且相機無法捕獲和讀取所有生物特征信息。因此,人臉 ID 無法與遮罩配合使用。
二 攻克技術(shù)難點,安防市場成沃土
除手機之外,人臉識別一個巨大的應(yīng)用市場是安防。包括視頻監(jiān)控、門禁等等。
在疫情的影響下,如何在安防市場中識別戴口罩的人臉已經(jīng)成為了一個共性問題。
安防人臉識別是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù),目的是確定人臉圖像的身份,提取輸入人臉圖像的特征,特征是使用一維向量對人臉的五官,諸如眼睛、嘴巴的大小,膚色,臉型的抽象描述。
輸入人臉圖像的特征與底庫人臉圖像的特征進(jìn)行逐一對比,找出與輸入圖像特征相似度最高的底庫圖像,如果相似度大于預(yù)先設(shè)置的相似度閾值,則該底庫圖像與輸入圖像為同一個人,否則無法確定輸入圖像的身份。
目前的技術(shù)難點如下:
首先,帶著口罩往往展現(xiàn)的面部特征較小,在火車站這樣的場景下,每天數(shù)據(jù)量很大,核驗人員身份精度要求比較高,往往很難實現(xiàn)。
其次,口罩等遮擋物的類型較多,且遮擋程度不一,再次給獲取非遮擋區(qū)域的信息帶來難度;
另外,短期內(nèi)無法收集大量戴口罩人臉圖像,算法訓(xùn)練難度大;
最后,人臉識別系統(tǒng)包含檢測、跟蹤、識別等多個模塊,對它們都會造成影響。
但是在安防級市場,戴口罩人臉識別技術(shù)難點是可以克服的。疫情的防控的常態(tài)化正在倒逼廠商更新技術(shù),適應(yīng)市場和用戶的需要。
在這一方面,我國已經(jīng)有了許多突破。早在 2 月下旬,國務(wù)院應(yīng)對新型冠狀病毒感染肺炎疫情聯(lián)防聯(lián)控機制印發(fā)的《企事業(yè)單位復(fù)工復(fù)產(chǎn)疫情防控措施指南》就提出,各單位應(yīng)暫時停用指紋考勤機,改用其他方式對進(jìn)出人員進(jìn)行登記。
目前,騰訊優(yōu)圖、百度、阿里巴巴、商湯、漢王等國內(nèi)互聯(lián)網(wǎng)和科技公司都已開發(fā)出針對口罩的人臉識別技術(shù),并已經(jīng)投入應(yīng)用。
百度視覺團(tuán)隊研發(fā)的技術(shù)可以使戴口罩的人臉檢測準(zhǔn)確率超 99% 以上,在百度園區(qū),員工上班戴著口罩就可以刷臉「入場」。
武漢大學(xué)國家多媒體軟件工程技術(shù)研究中心王中元教授研發(fā)出的口罩遮擋人臉的識別精度達(dá)到 90%;同時構(gòu)建了全球首個公開的真實口罩人臉識別樣本集。
三 「注意力機制人臉識別」突破口罩難關(guān)
口罩人臉識別技術(shù)難題,國內(nèi)泛安防廠商在疫情期間積極攻克。機器之心在「AI 戰(zhàn)疫專題報道」中報道過的小視科技就屬其中之一,他們所采用的技術(shù)的主要方法是「注意力機制人臉識別算法」是比較主流的思路。
據(jù)小視科技技術(shù)人員向機器之心介紹,在人臉遮擋環(huán)境下,可通過識別眼部關(guān)鍵點作為一種「注意力模型」,快速掃描全局圖像,獲得需要重點關(guān)注的目標(biāo)區(qū)域眼部,并形成注意力焦點。而后對眼部這一區(qū)域投入更多注意力資源,以獲取更多所需要關(guān)注目標(biāo)的細(xì)節(jié)信息,而抑制其他無用信息。
簡單來說就是提取人臉中的關(guān)鍵點,通過關(guān)鍵點識別不同人臉。當(dāng)面部幾乎一半被遮擋后,面部特征關(guān)鍵點就主要集中在了眼睛和眉毛兩個部位。
從算法模型上突圍,采用眼部、眉毛等局部特征與整體人臉特征的融合,并結(jié)合注意力機制增強眼部特征,通過訓(xùn)練眼部關(guān)鍵點的模型,便能提升模型在口罩遮擋下的人臉識別率。
采用同樣的原理,在算法層面,針對基于人臉全局特征及局部特征相結(jié)合的方法,可優(yōu)化現(xiàn)有人臉識別算法模型,當(dāng)人面部出現(xiàn)其他遮擋時,比如戴帽子,也同樣能夠精準(zhǔn)鑒別。
不過,注意力技術(shù)識別算法需要用大量的戴口罩人臉數(shù)據(jù)來訓(xùn)練算法。這對對數(shù)據(jù)規(guī)模也有要求,訓(xùn)練數(shù)據(jù)規(guī)模越大,識別準(zhǔn)確率往往越高。通常需要數(shù)十萬到百萬級別的樣本量,投入巨大。
為了盡可能獲得戴口罩人臉數(shù)據(jù),傳統(tǒng)的辦法是就是在現(xiàn)有的人臉圖像上「貼」上口罩。通過收集市面上各種顏色、大小和樣式的口罩圖片,與之前積累的未佩戴口罩人臉圖片進(jìn)行融合,快速合成了各種場景、海量真實的戴口罩訓(xùn)練照片。
合成口罩圖片
除常用的注意力機制外,還有一些人臉識別技術(shù)通過采集著裝、體態(tài)、發(fā)型等人體信息,以提高識別準(zhǔn)確率。還有一些通過圖像重構(gòu)網(wǎng)絡(luò)將佩戴物件如眼鏡、口罩、帽子等的人臉圖像重構(gòu)為未戴配件的人臉圖像,進(jìn)而通過比對實現(xiàn)人臉識別。
也有團(tuán)隊采用技術(shù)難度非常大的方法,比如川大智勝通過采集用戶的三維人像,增加人臉有限區(qū)域的面部信息采集數(shù)量,構(gòu)建精細(xì)的用戶面部立體幾何結(jié)構(gòu)信息,從而實現(xiàn)戴口罩的面部識別。
總之,在戴口罩人臉識別應(yīng)用方面,我國走在了世界前列。其中最重要的因素是擁有成熟的互聯(lián)網(wǎng)環(huán)境和海量的數(shù)據(jù)。
不僅如此,如今業(yè)界普遍認(rèn)為,美國人工智能在基礎(chǔ)科學(xué)和核心技術(shù)上占優(yōu),而我國則側(cè)重應(yīng)用場景,有助于技術(shù)的商業(yè)化落地。
在國內(nèi)互聯(lián)網(wǎng)高速發(fā)展和普及的當(dāng)下,每天都會產(chǎn)生海量的數(shù)據(jù),涉及各行各業(yè),為挖掘數(shù)據(jù)的價值提供了便利,也成為機器學(xué)習(xí)的「訓(xùn)練場」,推動人臉識別技術(shù)的不斷深入和應(yīng)用。
因此,拋開隱私和安全等因素,現(xiàn)在中國已經(jīng)是全球最適合人工智能各類應(yīng)用場景商業(yè)化落地的國家。
關(guān)鍵詞: 蘋果