現(xiàn)在位置:主頁 > 國(guó)內(nèi) > 從模型開源、到SDK開放,再到落地應(yīng)用,百度開啟視覺”軟硬結(jié)合“時(shí)代

從模型開源、到SDK開放,再到落地應(yīng)用,百度開啟視覺”軟硬結(jié)合“時(shí)代

作者:編輯 ? 時(shí)間:2020-09-16 ? 瀏覽:人次

?  9月15日,百度世界2020大會(huì)于線上正式召開,作為百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級(jí)別的行業(yè)盛事。本次大會(huì)以“萬物智能”為主題,吸引了眾多行業(yè)專家、技術(shù)大咖、開發(fā)者及科技愛好者的關(guān)注。

  本次大會(huì)中,百度不僅交出了一份份令人滿意的人工智能最新產(chǎn)品、技術(shù)、落地成績(jī)單,發(fā)布了多項(xiàng)AI革命性新品;更是向外界展示了一年來百度各個(gè)業(yè)務(wù)線所取得的巨大成果,例如百度移動(dòng)生態(tài)、百度大腦最新技術(shù)產(chǎn)品獲得巨大突破;百度智能云在城市、能源、工業(yè)制造等領(lǐng)域持續(xù)落地;小度發(fā)布“破圈戰(zhàn)略”智能硬件新品;Apollo自動(dòng)駕駛再取佳績(jī)......

  其中,計(jì)算機(jī)視覺作為AI技術(shù)的重要部分,在此次大會(huì)百度大腦分論壇上,也成為了百度重點(diǎn)分享的內(nèi)容。百度視覺技術(shù)部總監(jiān)丁二銳表示,伴隨著云化概念的深入,硬件的計(jì)算能力從云到移動(dòng)端、到邊緣,算力以三個(gè)數(shù)量級(jí)的比例在下降。所以,百度重點(diǎn)建設(shè)并開源了模型小型化技術(shù),在有限計(jì)算資源的情況下保持算法效果不降。同時(shí),這次還向算法開發(fā)者開源了多個(gè)性能卓越的視覺模型,向應(yīng)用開發(fā)者開放了多種視頻生成SDK。

  為模型“健康瘦身” PaddleSlim助力Slim系列模型發(fā)布

  2019年,百度推出了PaddleSlim,提供量化、蒸餾、剪枝、網(wǎng)絡(luò)結(jié)構(gòu)搜索等壓縮和設(shè)計(jì)策略,同時(shí)多種策略可快速配置組合使用,幫助深度學(xué)習(xí)開發(fā)者解決了設(shè)備上內(nèi)存緊張、功耗限制、算力有限等難題。

  對(duì)于業(yè)務(wù)用戶來說,PaddleSlim提供完整的模型壓縮和設(shè)計(jì)解決方案,目前已用于圖像分類、檢測(cè)、分割等各種類型的視覺場(chǎng)景。而對(duì)于模型壓縮算法研究者或開發(fā)者來說,PaddleSlim提供各種壓縮和設(shè)計(jì)策略的底層輔助接口,方便用戶復(fù)現(xiàn)、調(diào)研和使用最新論文方法。

  在此次分論壇上,丁二銳除了分享了PaddleSlim的強(qiáng)大能力之外,還為用戶及開發(fā)者帶來了一條重磅消息——Slim系列模型開源。目前,Slim系列模型不僅包括分類和檢測(cè)等效果出眾的基礎(chǔ)模型,還包括業(yè)界最小的開源人臉識(shí)別和文字識(shí)別等模型。在人臉識(shí)別方向,Slim系列模型可以在效果不降的情況下,計(jì)算量只有其他開源模型的1/7。在文字識(shí)別上,最新的模型大小僅僅只有3.1M。

  值得特別提及的是,CVPR的低功耗計(jì)算視覺比賽CVPR 2020 LOW-POWER COMPUTER VISION CHALLENGE也剛剛宣布了結(jié)果,百度聯(lián)合清華大學(xué)在競(jìng)爭(zhēng)最激烈的Real-time Image Classification Using Pixel 4 CPU 賽道中擊敗眾多強(qiáng)勁對(duì)手取得冠軍。本次發(fā)布的開源分類模型中就包含了此次比賽的冠軍模型。

  用技術(shù)賦予每個(gè)人獨(dú)特形象 業(yè)界首發(fā)多個(gè)人物生成SDK

  除了在端邊算法上的不斷優(yōu)化及模型壓縮解決方案的不斷完善,本次分論壇上,丁二銳還帶來了百度AI視覺領(lǐng)域的全新產(chǎn)品:業(yè)界首發(fā)終端2D虛擬真人SDK、業(yè)界首發(fā)二次元人像轉(zhuǎn)換SDK和業(yè)界首發(fā)端云一體虛擬形象構(gòu)建及應(yīng)用解決方案。

  終端2D數(shù)字虛擬真人SDK,基于3D人臉建模、唇形預(yù)測(cè)、圖像融合、GAN視頻生成等技術(shù),可實(shí)現(xiàn)基于5分鐘視頻素材的低成本形象建模,支持終端的實(shí)時(shí)對(duì)話視頻生成及表情和肢體動(dòng)作驅(qū)動(dòng)。可以大大降低客戶的購買及部署成本,同時(shí)解決網(wǎng)絡(luò)依賴延遲的性能等問題;二次元人像轉(zhuǎn)換SDK,基于人臉分割、關(guān)鍵點(diǎn)檢測(cè)、GAN視頻生成、模型壓縮等技術(shù),支持膚色自定義調(diào)節(jié)、人像多種風(fēng)格切換;而虛擬卡通人端云一體方案,具備秒級(jí)的形象生成、并可通過視覺和語音驅(qū)動(dòng),可以賦予每個(gè)人獨(dú)特形象。這些人物生成SDK,構(gòu)成了全面的能力生態(tài),可以為虛擬主播、智能化視頻生產(chǎn)提供完善的解決方案。

  端邊硬件+場(chǎng)景算法+PaddleSlim ,生活各個(gè)方面正經(jīng)歷“軟+硬”時(shí)代

  近年來,視覺技術(shù)已經(jīng)廣泛應(yīng)用于各大領(lǐng)域,但要進(jìn)一步普及,在成本控制、算法指標(biāo)、持續(xù)服務(wù)和完整方案上,對(duì)廠商提出了更高的要求,目前軟硬件相結(jié)合的產(chǎn)品服務(wù)成為主流趨勢(shì)。

  作為最早的視覺軟硬一體化解決方案,百度大腦度目硬件將極具優(yōu)勢(shì)的算法模型通過嵌入式開發(fā)技術(shù)移植到端邊產(chǎn)品上,打造了人臉應(yīng)用套件、人臉抓拍機(jī)、AI鏡頭模組、視頻分析盒四款民用軟硬件產(chǎn)品。軟硬結(jié)合一體化,實(shí)現(xiàn)算法與硬件的深度調(diào)優(yōu),配備預(yù)設(shè)應(yīng)用,可直接部署應(yīng)用及輕量級(jí)二次開發(fā)集成。

  目前,度目依靠“端邊硬件+場(chǎng)景算法+PaddleSlim”三位一體的強(qiáng)大能力,已經(jīng)在承德市30家連鎖商超進(jìn)行商業(yè)分析等工作;中山市公安局鎮(zhèn)級(jí)社區(qū)門禁系統(tǒng)也通過度目實(shí)現(xiàn)了智能化升級(jí);包括廣州某出租車營(yíng)運(yùn)系統(tǒng)的駕駛身份、行為識(shí)別。當(dāng)PaddleSlim和其他視覺算法在硬件上結(jié)合時(shí),也賦能了許多其他應(yīng)用場(chǎng)景,小度在家的手勢(shì)控制;好看視頻APP的表情識(shí)別;國(guó)家電網(wǎng)智能巡檢解決方案......從智慧分析、智慧社區(qū),再到駕駛管理、產(chǎn)業(yè)賦能,百度大腦已經(jīng)打造出一個(gè)特有的“軟+硬”視覺時(shí)代,并時(shí)刻守護(hù)生活的每個(gè)角落。

  可以看到,二十年的技術(shù)積淀,近十年的 AI布局,讓百度AI前進(jìn)的步伐越走越穩(wěn),也越來越快速敏捷。除了進(jìn)一步開放AI能力,百度也在通過軟硬一體化等方式,降低視覺各種技術(shù)的落地門檻,讓AI技術(shù)得以延伸到更多行業(yè)場(chǎng)景,無論是安防、金融、交通,還是教育、酒店、零售、醫(yī)院、公寓,助力開發(fā)者繞過算法與硬件的桎梏,將更多精力放在業(yè)務(wù)開發(fā)部署上,這為產(chǎn)業(yè)智能化的進(jìn)程提供了前所未有的加速度。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://parkingblocks4less.com/a/guona/20200916/54405.html上一篇:上一篇:金秋九月,崇禮翠云山森林風(fēng)景區(qū)金秋麓活季邀你探索別樣大森林
下一篇:下一篇:沒有了