現(xiàn)在位置:主頁(yè) > 教育 > 深度學(xué)習(xí)在改變智能手機(jī)!百度飛槳加速OPPO個(gè)性化推薦效率

深度學(xué)習(xí)在改變智能手機(jī)!百度飛槳加速OPPO個(gè)性化推薦效率

作者:編輯 ? 時(shí)間:2020-05-21 ? 瀏覽:人次

隨著技術(shù)的完善與門檻的降低,深度學(xué)習(xí)正在加大往各行業(yè)滲透落地的力度。5月20日,由深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室與百度聯(lián)合主辦的“WAVE SUMMIT”2020深度學(xué)習(xí)開發(fā)者峰會(huì)召開。百度飛槳開源深度學(xué)習(xí)平臺(tái)公布了7項(xiàng)新產(chǎn)品和23項(xiàng)重磅升級(jí),瞄準(zhǔn)工業(yè)大生產(chǎn)持續(xù)發(fā)力,會(huì)上展示的與OPPO的合作,成為飛槳在消費(fèi)類電子領(lǐng)域智能推薦服務(wù)落地的典型案例。

根據(jù)峰會(huì)現(xiàn)場(chǎng)介紹,在飛槳大規(guī)模分布式訓(xùn)練的助力下,OPPO推薦系統(tǒng)業(yè)務(wù)模型訓(xùn)練速度提升了8倍,模型擴(kuò)大了20倍,推薦場(chǎng)景效果提升了4%-5%,并節(jié)省了90%的內(nèi)存,為OPPO在全球3.5億用戶帶來(lái)更精準(zhǔn)快速的移動(dòng)互聯(lián)網(wǎng)服務(wù)。

飛槳與OPPO,是如何結(jié)下這場(chǎng)“不懈之緣”?

緣起:OPPO大舉進(jìn)軍互聯(lián)網(wǎng)業(yè)務(wù),個(gè)性化推薦效率成“硬骨頭”

提起OPPO,人們總是會(huì)想到造型時(shí)尚、性能強(qiáng)大的手機(jī)產(chǎn)品線,經(jīng)過十一年的積累發(fā)展,OPPO已經(jīng)成為中國(guó)智能手機(jī)市場(chǎng)的頭部品牌,根據(jù)IDC數(shù)據(jù)報(bào)告,OPPO穩(wěn)居2020年Q1中國(guó)智能手機(jī)市場(chǎng)出貨量前三。OPPO還在2018年起開始大舉進(jìn)軍互聯(lián)網(wǎng)業(yè)務(wù),創(chuàng)立了信息流、信息流廣告、應(yīng)用商店、游戲中心、商業(yè)中心等諸多業(yè)務(wù)線。

伴隨業(yè)務(wù)規(guī)模擴(kuò)張而來(lái)的,是指數(shù)級(jí)增長(zhǎng)的用戶和數(shù)據(jù),這大大增加了單機(jī)終端進(jìn)行模型訓(xùn)練的壓力?!盀榱吮WC效率,舊式的深度學(xué)習(xí)解決方案是對(duì)訓(xùn)練樣本做負(fù)采樣,或者干脆直接減少訓(xùn)練數(shù)據(jù)集的規(guī)模,這樣速度是快了,但會(huì)影響模型效果,用戶可能就覺得個(gè)性化推薦給自己的內(nèi)容不是那么精準(zhǔn)。”O(jiān)PPO的算法工程師表示。

在當(dāng)時(shí),深度學(xué)習(xí)已經(jīng)被大量用于應(yīng)用商店、內(nèi)容推薦、負(fù)一屏、廣告等推薦場(chǎng)景,但是已有的框架進(jìn)行單機(jī)訓(xùn)練會(huì)受限于單機(jī)算力和內(nèi)存等資源,這影響了模型上線的效率,會(huì)拖累產(chǎn)品優(yōu)化的速度。對(duì)OPPO的算法工程師而言,能否尋找到一套更好的深度學(xué)習(xí)框架,實(shí)現(xiàn)高效處理海量數(shù)據(jù)集、提供高頻率迭代模型,成為推薦系統(tǒng)是否成功的核心關(guān)鍵。

OPPO算法工程師使用了包括Tensorflow在內(nèi)的深度學(xué)習(xí)框架,在速度上或者效果上都有一些不能令人滿意。直到2019年4月,百度飛槳正式對(duì)外開源了基于自身多年產(chǎn)業(yè)實(shí)踐的大規(guī)模分布式深度學(xué)習(xí)系統(tǒng),這引起了OPPO方面的注意。

實(shí)際上,飛槳這套系統(tǒng)早已用于百度搜索推薦等相關(guān)場(chǎng)景,是百度搜索領(lǐng)先業(yè)界的技術(shù)護(hù)城河之一,非常契合OPPO互聯(lián)網(wǎng)推薦系統(tǒng)的需求。經(jīng)過多年業(yè)務(wù)實(shí)踐,該系統(tǒng)已經(jīng)達(dá)到相當(dāng)完善的地步,百度也決定將其開源分享,尤其配合易用的FleetAPI,讓這一系統(tǒng)可以方便快速地為外部企業(yè)所部署應(yīng)用。于是,OPPO向百度飛槳的團(tuán)隊(duì)拋出了合作意愿。

攻關(guān):飛槳深度學(xué)習(xí)平臺(tái)如何改造移動(dòng)互聯(lián)網(wǎng)服務(wù)?

百度飛槳團(tuán)隊(duì)對(duì)于OPPO這個(gè)來(lái)自于消費(fèi)類電子領(lǐng)域的頭部用戶相當(dāng)重視,進(jìn)行初步接觸之后,了解到OPPO旗下需要應(yīng)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)的產(chǎn)品和業(yè)務(wù)主要在于商店、信息流、信息流廣告、游戲中心、商業(yè)廣告,它們后端都需要結(jié)合用戶行為等數(shù)據(jù)進(jìn)行訓(xùn)練以及預(yù)測(cè),并推送符合用戶需求的內(nèi)容。

一開始,OPPO從自身業(yè)務(wù)出發(fā)對(duì)飛槳提出了四點(diǎn)述求:能夠支持先進(jìn)的訓(xùn)練模型,以及推薦系統(tǒng)領(lǐng)域內(nèi)的新模型新方法;能夠支持分布式大規(guī)模深度學(xué)習(xí)訓(xùn)練能力,包括增量訓(xùn)練等多種訓(xùn)練機(jī)制和億級(jí)別以上的稀疏參數(shù)訓(xùn)練;性能速度要超越同業(yè)競(jìng)品,在指定時(shí)間內(nèi)訓(xùn)練完成全部所需的數(shù)據(jù);有完善的訓(xùn)練和預(yù)測(cè)的能力,支持分布式訓(xùn)練到高性能模型部署。

其實(shí),這些同樣也是深度學(xué)習(xí)技術(shù)要在產(chǎn)業(yè)實(shí)現(xiàn)落地的前提。

接觸之后,百度飛槳團(tuán)隊(duì)很快根據(jù)內(nèi)部使用經(jīng)驗(yàn)和對(duì)OPPO業(yè)務(wù)場(chǎng)景的了解,給出了大量應(yīng)用建議,包括在數(shù)據(jù)讀取方面使用高性能數(shù)據(jù)讀取接口Dataset、在分布式訓(xùn)練方面采用基于全異步大規(guī)模稀疏參數(shù)服務(wù)器的訓(xùn)練方式、在預(yù)測(cè)方面采用飛槳的預(yù)測(cè)庫(kù)自行構(gòu)建預(yù)測(cè)服務(wù)等。

經(jīng)過驗(yàn)證,OPPO發(fā)現(xiàn)相比其他框架,飛槳的參數(shù)服務(wù)器訓(xùn)練方法有非常高的性價(jià)比,采用十臺(tái)以內(nèi)CPU服務(wù)器就可以有效地解決超大規(guī)模推薦系統(tǒng)、超大規(guī)模數(shù)據(jù)、自膨脹的海量特征及高頻率模型迭代的問題,并擁有超大吞吐量及高效率。這非常貼合OPPO的實(shí)際需求。目前,OPPO已經(jīng)構(gòu)建了數(shù)百臺(tái)服務(wù)器的集群用于訓(xùn)練飛槳的分布式任務(wù),為產(chǎn)品線的策略調(diào)研提供了很大的便利。

OPPO的研發(fā)人員發(fā)現(xiàn),飛槳可以在大幅度降低內(nèi)存使用的情況下,將訓(xùn)練速度大幅提升,是原有訓(xùn)練工具速度的8倍。此外,飛槳能夠支撐的稀疏參數(shù)規(guī)模也讓OPPO策略研發(fā)人員將模型的參數(shù)數(shù)量提升了20倍。飛槳提供的全局分布式數(shù)據(jù)打亂、多通道數(shù)據(jù)數(shù)據(jù)預(yù)處理等功能也極大的提高了訓(xùn)練的吞吐效率和易用性。

雙方一拍即合,立刻開始著手將飛槳應(yīng)用落地到OPPO的具體業(yè)務(wù)場(chǎng)景中,但要先從哪一塊“硬骨頭”啃起?OPPO與飛槳的研發(fā)人員將目光放在了應(yīng)用商店,這是OPPO互聯(lián)網(wǎng)服務(wù)中最重要、流量非常大的業(yè)務(wù),其中有三個(gè)需要訓(xùn)練的板塊:商店首頁(yè)、應(yīng)用商店業(yè)和應(yīng)用商店熱搜。

最終,OPPO和飛槳研發(fā)人員決定采用Wide&Deep模型進(jìn)行訓(xùn)練,同時(shí)增加DNN網(wǎng)絡(luò)作為深度部分參與訓(xùn)練,以提高模型的泛化能力,并基于Kubernetes集群,快速完成了飛槳分布式訓(xùn)練集群的適配工作。同時(shí),飛槳還提供了基于C++語(yǔ)言的服務(wù)器端部署功能,幫助OPPO研發(fā)人員快速實(shí)現(xiàn)線上業(yè)務(wù)預(yù)測(cè)。

“我們和飛槳團(tuán)隊(duì)的同學(xué)進(jìn)行了長(zhǎng)期的接觸合作,并且對(duì)方一直在及時(shí)響應(yīng)和支持我們?cè)趹?yīng)用部署中遇到的各類問題?!監(jiān)PPO的算法工程師回憶:“從去年開始,雙方每周都會(huì)組織溝通會(huì)議,高效同步進(jìn)展和問題,訓(xùn)練效率的提升最終為OPPO的線上業(yè)務(wù)帶來(lái)了實(shí)打?qū)嵉氖找?。?/p>

成果:OPPO業(yè)務(wù)線的AI應(yīng)用場(chǎng)景訓(xùn)練更“快”,收益更“多”

“飛槳的分布式推薦系統(tǒng)在應(yīng)用商店業(yè)務(wù)取得收益后,OPPO先后在信息流、信息流廣告、商業(yè)廣告、游戲中心等諸多部門進(jìn)行運(yùn)用,效果非常顯著,其中信息流部門收益提升了5%,其他業(yè)務(wù)線也取得了2%-5%不等的提升?!監(jiān)PPO研發(fā)人員肯定了百度飛槳對(duì)OPPO互聯(lián)網(wǎng)業(yè)務(wù)帶來(lái)的巨大價(jià)值。

而在這次合作中獲得突破的并非只有OPPO一方,百度飛槳團(tuán)隊(duì)也表示,OPPO提供了大量的外部企業(yè)的需求,飛槳以此為契機(jī),也完成了一系列升級(jí),例如優(yōu)化大規(guī)模分布式異步訓(xùn)練的速度、支持超大規(guī)模稀疏參數(shù)等,將自身打造成更符合企業(yè)實(shí)際應(yīng)用的框架,能夠更好地滿足產(chǎn)業(yè)智能化轉(zhuǎn)型的需求。

OPPO研發(fā)人員還認(rèn)為,這次合作也進(jìn)一步驗(yàn)證了飛槳作為工業(yè)級(jí)深度學(xué)習(xí)平臺(tái)的成熟度,后續(xù)雙方還將在在線學(xué)習(xí)、多目標(biāo)等場(chǎng)景展開深度合作,將互聯(lián)網(wǎng)服務(wù)所能提供的用戶體驗(yàn)推進(jìn)到新的高度,形成合作共贏的良性發(fā)展。

(百度CTO王海峰在“WAVE SUMMIT”2020深度學(xué)習(xí)開發(fā)者峰會(huì))

從百度飛槳與OPPO的合作中,更多企業(yè)也認(rèn)識(shí)到,要實(shí)現(xiàn)產(chǎn)業(yè)智能化轉(zhuǎn)型,AI能力和開發(fā)工具需要滿足效率、易用性、性價(jià)比和實(shí)現(xiàn)效果等硬性指標(biāo)。百度CTO王海峰在峰會(huì)上表示:“深度學(xué)習(xí)框架和平臺(tái)在高速發(fā)展,易用性不斷提升,模型庫(kù)日益豐富,工具組件愈發(fā)完備,部署更加便捷。進(jìn)而,圍繞深度學(xué)習(xí)平臺(tái)的技術(shù)和產(chǎn)業(yè)生態(tài)日漸繁榮,推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)階段,加速各行各業(yè)智能化升級(jí),并不斷催生新的應(yīng)用、新的產(chǎn)業(yè)?!?/p>

目前,飛槳累計(jì)開發(fā)者數(shù)量超過190萬(wàn),服務(wù)企業(yè)數(shù)量達(dá)到8萬(wàn)4千家,發(fā)布模型數(shù)量超過23萬(wàn)個(gè),是國(guó)內(nèi)最領(lǐng)先、服務(wù)開發(fā)者規(guī)模最大、功能最完備的開源開放深度學(xué)習(xí)平臺(tái),正在為各大產(chǎn)業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型提供獨(dú)有的“中國(guó)速度”。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://www.parkingblocks4less.com/a/jiaoyu/20200521/46791.html上一篇:上一篇:愛名師:定制化教學(xué)詮釋新時(shí)代在線教育,新課上線助力“教資取證”
下一篇:下一篇:沒有了