現(xiàn)在位置:主頁(yè) > 國(guó)內(nèi) > 人工智能:解鎖手機(jī)人臉識(shí)別新進(jìn)展

人工智能:解鎖手機(jī)人臉識(shí)別新進(jìn)展

作者:編輯 ? 時(shí)間:2018-05-07 ? 瀏覽:人次

從工業(yè)革命、電氣革命、數(shù)字革命到智能時(shí)代,我們已經(jīng)步入了人類賦予機(jī)器智慧的新時(shí)代。過(guò)去一年,全面屏、人臉解鎖和屏下指紋已然成為手機(jī)圈中最熱的三大技術(shù),然而當(dāng)差異化越來(lái)越小之時(shí),又驅(qū)動(dòng)著新的創(chuàng)新技術(shù)誕生,而AI正成為各大手機(jī)廠商新的競(jìng)爭(zhēng)點(diǎn),人工智能一躍而起成為手機(jī)圈中的“香餑餑”。

縱觀當(dāng)下,人工智能被廣泛應(yīng)用于機(jī)器人、語(yǔ)音識(shí)別、圖像識(shí)別等領(lǐng)域,移動(dòng)互聯(lián)網(wǎng)時(shí)代信息傳播效率的飛速提升讓人們真正看到了AI技術(shù)改變?nèi)祟愇磥?lái)生活方式的可能性。

在人工智能大賽道中,人臉識(shí)別是其中發(fā)展較為成熟的應(yīng)用領(lǐng)域。同時(shí),人臉識(shí)別是符合國(guó)家政策趨勢(shì)、惠及民生的領(lǐng)域,國(guó)家863計(jì)劃、國(guó)家科技支撐計(jì)劃、自然科學(xué)基金都會(huì)拔出了??钯Y助人臉識(shí)別的相關(guān)研究。在國(guó)家政策的支持和完善下,人臉識(shí)別技術(shù)將會(huì)被推向更廣闊的日常領(lǐng)域。

如今,“刷臉”已經(jīng)成了人們生活中的日常事務(wù),從移動(dòng)支付、解鎖手機(jī)到學(xué)校、公司、小區(qū)門禁等,都運(yùn)用到了人臉識(shí)別技術(shù)。人臉識(shí)別技術(shù)產(chǎn)品已廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療及眾多企事業(yè)單位等領(lǐng)域。

人臉識(shí)別在手機(jī)端行業(yè)中,掀起了人臉識(shí)別解鎖技術(shù)熱潮,各大手機(jī)廠商也蜂擁擠入,其中最有影響力的便是iPhone X的Face ID。面對(duì)日益激烈的行業(yè)競(jìng)爭(zhēng),如何在強(qiáng)敵林立之下找到自身的立足之地,創(chuàng)新、突破技術(shù)顯得尤為重要,在這一點(diǎn)上,曠視科技Face++憑借其核心的人臉識(shí)別技術(shù),成為行業(yè)中的“佼佼者”。

云圖片

峰會(huì)現(xiàn)場(chǎng)

日前,由手機(jī)報(bào)在線舉辦的AI手機(jī)產(chǎn)業(yè)峰會(huì)在深圳圓滿落幕。據(jù)了解,曠視科技Face++副總裁敖翔蒞臨本次峰會(huì),并以“手機(jī)人臉識(shí)別的新進(jìn)展”為主題,深入講述了公司的跨模態(tài)人臉識(shí)別和人像光效兩大技術(shù)。

跨模態(tài)人臉識(shí)別技術(shù)

跨模態(tài)人臉識(shí)別技術(shù)在生活中已得到真實(shí)應(yīng)用,在最近的 vivo X21的發(fā)布會(huì)上,vivo X21為提升人臉解鎖的性能和場(chǎng)景寬度選擇,再度與曠視科技Face++合作,并在原有的人臉識(shí)別解鎖方案上增加了景深技術(shù)和近紅外技術(shù),實(shí)現(xiàn)了2PD全像素雙核單攝紅外人臉解鎖。

vivo X21在攝像頭方面,其前置攝像頭類似紅外發(fā)射器,可做到全天候刷臉,晚上一點(diǎn)光線都沒(méi)有的情況下也可以刷臉。此外,在紅外方面,傳統(tǒng)的紅外方案是一個(gè)紅外發(fā)射器、一個(gè)紅外接收器,還有一個(gè)主攝像頭。據(jù)敖翔介紹,曠視為vivo提供了一個(gè)更大膽、更厲害的方案,即一個(gè)發(fā)射器和一個(gè)主攝像頭,主攝像頭可以感受紅外,基本上是全通的攝像頭。敖翔表示,相比傳統(tǒng)的紅外方案,這項(xiàng)方案具有三個(gè)明顯優(yōu)勢(shì):

1、方案易用,只有一個(gè)發(fā)射器和一個(gè)主攝像頭,模組結(jié)構(gòu)簡(jiǎn)單、利于集成。

2、用戶體驗(yàn)非常好,不受光線影響,任何光線環(huán)境下都可以解鎖,良好的用戶體驗(yàn)也將使vivo X21具有更大的市場(chǎng)優(yōu)勢(shì)。

3、硬件成本優(yōu)勢(shì),體現(xiàn)在傳感器較少,本身有前置攝像頭。但這一點(diǎn)既是優(yōu)勢(shì),然而也存在很大的風(fēng)險(xiǎn)。

而事實(shí)上,這個(gè)方案的實(shí)現(xiàn)非常困難,如何將紅外的人臉識(shí)別和RGB人臉識(shí)別相融合,并且做到無(wú)縫轉(zhuǎn)換和融合,這是難點(diǎn)所在。

云圖片

曠視科技副總裁敖翔(現(xiàn)場(chǎng)圖)

風(fēng)險(xiǎn)點(diǎn)在于IR數(shù)據(jù)存量少。對(duì)Face++來(lái)說(shuō),RGB識(shí)別不是問(wèn)題,其RGB的圖像數(shù)據(jù)很多,里面有幾千萬(wàn)張臉,就算是現(xiàn)場(chǎng)采集人臉也可以采集到幾萬(wàn)、幾十萬(wàn)張。但就IR識(shí)別而言,對(duì)整個(gè)行業(yè)來(lái)說(shuō)存量的IR數(shù)據(jù)很少,且IR每個(gè)鏡頭不一樣,所以用特定模組采,采的IR數(shù)據(jù)就很少。在IR數(shù)據(jù)特別少的情形下,同時(shí)做RGB識(shí)別,又做IR識(shí)別,這是一個(gè)挑戰(zhàn),尤其對(duì)做人臉識(shí)別這種非常精密的識(shí)別來(lái)說(shuō)是非常大的挑戰(zhàn)。

Face++成功地將跨模態(tài)人臉識(shí)別技術(shù)運(yùn)用到vivo X21上,這是在手機(jī)產(chǎn)業(yè)界上非常完美的一次運(yùn)用,曠視科技采用神經(jīng)網(wǎng)絡(luò)里面一種流行的辦法——Domain Transfer Learning域遷移學(xué)習(xí),從而解決了該項(xiàng)技術(shù)上的難題,可以說(shuō)是學(xué)術(shù)界的重大技術(shù)突破。

如何實(shí)現(xiàn)跨模態(tài)人臉識(shí)別技術(shù)

對(duì)于如何實(shí)現(xiàn)跨模態(tài)人臉識(shí)別技術(shù),敖翔做出了深入闡述:“首先需要做的是RGB訓(xùn)練。根據(jù)現(xiàn)有的模型和高精度人臉識(shí)別網(wǎng)絡(luò)結(jié)構(gòu),從中獲取參數(shù);接下來(lái),將網(wǎng)絡(luò)直接平移過(guò)去做新的網(wǎng)絡(luò),所有的參數(shù)保留,這相當(dāng)于給RGB信號(hào)做預(yù)訓(xùn)練,從而得到大量數(shù)值化參數(shù),再用少量紅外數(shù)據(jù)去微調(diào)網(wǎng)絡(luò),經(jīng)過(guò)巧妙的網(wǎng)絡(luò)設(shè)計(jì)和訓(xùn)練技巧,進(jìn)而得到高精度紅外和紅外相對(duì)比的算法。”

據(jù)了解,曠視在手機(jī)解鎖上應(yīng)用的算法有兩種,一個(gè)是RGB識(shí)別算法,一個(gè)是紅外的識(shí)別算法。最重要的是做兩個(gè)融合,由于攝像頭在白天識(shí)別的時(shí)候,光線很好,但是晚上光線比較弱,IR和RGB信號(hào)比重是平滑改變的,這就決定了二者必須揉在一起做。上述兩個(gè)步驟完成之后,通過(guò)將RGB和IR的數(shù)據(jù)進(jìn)行混合訓(xùn)練,對(duì)RGB和IR的信息進(jìn)行融合。所有步驟的完成就叫跨模態(tài)識(shí)別。

跨模態(tài)人臉識(shí)別技不但可以忽略環(huán)境的影響,達(dá)成全天候的人臉識(shí)別,其抗攻擊性能也比傳統(tǒng)紅外方案更好,在RGB識(shí)別算法和紅外識(shí)別算法相結(jié)合的基礎(chǔ)上,最后結(jié)合曠視自研的ShuffleNet模型,進(jìn)一步優(yōu)化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。據(jù)敖翔透露,在今年的論文中將會(huì)就跨模態(tài)人臉識(shí)別技術(shù)作出更全面、系統(tǒng)的闡釋。

人像光效技術(shù)

在去年的iPhone發(fā)布會(huì)上,蘋果推出了一個(gè)新的攝像功能——人像光效。

簡(jiǎn)單來(lái)說(shuō),人像光效技術(shù)就是通過(guò)一系列軟硬件配合的技術(shù),讓我們能夠在拍攝人像或者后期編輯時(shí)利用算法,為照片添加上逼真的光影效果,比如自然光、攝影室燈光、輪廓光等。用蘋果的廣告語(yǔ)是這么說(shuō)的:人像光效,隨身攜帶的燈光師。

據(jù)了解,iPhone X的人像光效技術(shù)主要是用于它自己高端的iPhone上,用在iPhoneX或者雙攝鏡頭上。

曠視Face++讓安卓機(jī)實(shí)現(xiàn)人像光效技術(shù)

任何一項(xiàng)技術(shù)的實(shí)現(xiàn)都不會(huì)是一蹴而就的,人像光效技術(shù)也是如此。曠視為客戶定制的光效技術(shù)由人臉關(guān)鍵點(diǎn)檢測(cè)、面部三維光效渲染、T區(qū)高光提亮、背景保護(hù)等20多項(xiàng)技術(shù)組合而成,“因?yàn)槿四樣刑嗟男畔⑿枰プR(shí)別,識(shí)別越多的信息就約有利于人的面部美化”。敖翔同樣也道出人像光效技術(shù)研發(fā)關(guān)鍵所在:“人像光效的關(guān)鍵在于三維面部重建?!?/p>

據(jù)了解,曠視在人像光效技術(shù)的運(yùn)用上,不強(qiáng)求一定采用3D Camera。對(duì)此,敖翔作出了解釋:“因?yàn)槿说拿娌坑泻軓?qiáng)的鮮艷知識(shí)被識(shí)別的人臉可以在電腦里重構(gòu)出來(lái),并且可以做到一模一樣。雖然3D Camera可以做到更加準(zhǔn)確,但人的知識(shí)自主性決定了整個(gè)3D重建并不一定完全依賴3D Camera。曠視的人像光效技術(shù)可以對(duì)二維的圖像做出3D重建,且重建并不需要花太多時(shí)間,在人臉的程度上,利用結(jié)構(gòu)光捕捉、神經(jīng)網(wǎng)絡(luò)的深度威力去猜人臉部的凹凸系統(tǒng),進(jìn)而生成深度圖?!?/p>

對(duì)比之下,蘋果的人像光效技術(shù)主要是雙攝鏡頭,因此其對(duì)雙攝硬件有更強(qiáng)的依賴,而曠視的人像光效技術(shù)更具有廣泛性,對(duì)攝像頭依賴程度較低能夠支持不同平臺(tái)和機(jī)型,并可同時(shí)滿足前置或后置的單攝/雙攝應(yīng)用需求,更加適合多元化的市場(chǎng)需求。

通過(guò)曠視科技副總裁敖翔的解說(shuō),加深了我們對(duì)跨模態(tài)人臉識(shí)別技術(shù)和人像光效的了解,這兩項(xiàng)技術(shù)也是人工智能領(lǐng)域的歷史性突破,曠視科技用AI為行業(yè)增加了新的動(dòng)力,也賦予了行業(yè)未來(lái)更多可能。而對(duì)于曠視科技Face++來(lái)說(shuō),做到這些只是基礎(chǔ),在未來(lái),他們將會(huì)做得更好、更細(xì)致,會(huì)有更好的成績(jī),我們拭目以待!


轉(zhuǎn)載請(qǐng)保留原文鏈接:http://parkingblocks4less.com/a/guona/20180507/8094.html上一篇:上一篇:優(yōu)酷啟用少兒獨(dú)立品牌,小小優(yōu)酷一鍵切換模式全網(wǎng)領(lǐng)先
下一篇:下一篇:沒(méi)有了