現(xiàn)在位置:主頁(yè) > 教育 > 人工智能潮起,巨頭紛紛搶灘,薩摩耶?dāng)?shù)科會(huì)用遷移學(xué)習(xí)激起怎樣的浪花?

人工智能潮起,巨頭紛紛搶灘,薩摩耶?dāng)?shù)科會(huì)用遷移學(xué)習(xí)激起怎樣的浪花?

作者:編輯 ? 時(shí)間:2021-06-22 ? 瀏覽:人次

曾幾何時(shí),讓·鮑德里亞說(shuō)“人工智能的可悲之處在于它不夠巧妙,因而不夠智能?!比缃?,用這句話描述人工智能已越來(lái)越不恰當(dāng)。

蘋果、特斯拉、滴滴、百度等國(guó)內(nèi)外巨頭在無(wú)人駕駛上的頻頻加碼,讓無(wú)人駕駛技術(shù)進(jìn)入了發(fā)展的快車道。但自動(dòng)駕駛,只是人工智能的一個(gè)細(xì)分領(lǐng)域。

“人工智能是我們?nèi)祟愓趶氖碌淖顬樯羁痰难芯糠较蛑?,甚至要比火與電還更加深刻?!?桑德?tīng)枴てげ略赋觥?/p>

近期,一項(xiàng)名為“遷移學(xué)習(xí)”的技術(shù)被谷歌、阿里云、薩摩耶?dāng)?shù)科等知名企業(yè)頻頻提及,這項(xiàng)技術(shù)雖然不如智能駕駛那么“接地氣”,但在商業(yè)應(yīng)用上的價(jià)值卻毫不遜色。

無(wú)處不在的遷移學(xué)習(xí)

究竟什么是遷移學(xué)習(xí)?“你永遠(yuǎn)不能理解一種語(yǔ)言——除非你至少理解兩種語(yǔ)言?!庇?guó)作家杰弗里·威廉斯的這句話有助于我們理解什么是遷移學(xué)習(xí)。

不必討論它冗長(zhǎng)的概念,只需要思考一些生活中的細(xì)節(jié)。在幼兒園學(xué)習(xí)拼音的時(shí)候,老師教我們“a 、o、 e、 i 、u、 ”,教我們聲母、韻母如何搭配組合;而在我們學(xué)習(xí)英語(yǔ)的時(shí)候,常常自然而然地將一些拼音中的規(guī)律帶到音標(biāo)中,這就是遷移學(xué)習(xí)一個(gè)常見(jiàn)的應(yīng)用。

學(xué)習(xí)一類外語(yǔ)時(shí),人們常常將在學(xué)習(xí)母語(yǔ)過(guò)程中的經(jīng)驗(yàn)、技巧、習(xí)慣、方式不自覺(jué)的遷移運(yùn)用于新語(yǔ)種的學(xué)習(xí)當(dāng)中。如果是可借鑒的經(jīng)驗(yàn)與方法,我們會(huì)獲取并且加深這種學(xué)習(xí)方式,如果是不適用的方法,我們則會(huì)放棄,換一種學(xué)習(xí)方式。

遷移學(xué)習(xí)的原理與人類學(xué)習(xí)語(yǔ)言的過(guò)程十分相似,在從源領(lǐng)域比如漢語(yǔ)中拼音學(xué)習(xí)的過(guò)程中,根據(jù)目標(biāo)領(lǐng)域比如英語(yǔ)中的音標(biāo)的數(shù)據(jù)特性,來(lái)決定是否需要將知識(shí)從源領(lǐng)域遷移到目標(biāo)領(lǐng)域。

數(shù)據(jù)是人工智能的底層基礎(chǔ),也是人工智能時(shí)代最核心的競(jìng)爭(zhēng)力之一,必然“洛陽(yáng)紙貴”。

如果源數(shù)據(jù)是“1”,那遷移學(xué)習(xí)的價(jià)值在于,它可以在源數(shù)據(jù)在源領(lǐng)域?qū)崿F(xiàn)自身“1”的價(jià)值的同時(shí),在諸多目標(biāo)領(lǐng)域?qū)崿F(xiàn)0.5、0.6乃至0.9的價(jià)值;使用遷移學(xué)習(xí)的新模型在開(kāi)發(fā)過(guò)程中,也不用經(jīng)歷“從0到1”的過(guò)程,而是從0.5、0.6乃至0.9起步。

在薩摩耶?dāng)?shù)科看來(lái),遷移學(xué)習(xí)就是“借力打力”,酷似諸葛孔明草船借箭,通過(guò)“借力”它將自己學(xué)習(xí)的框架放大,找到更多更有“能力”的樣本,并且充分利用他們的能力。

如今遷移學(xué)習(xí)已成為機(jī)器學(xué)習(xí)的基礎(chǔ)研究領(lǐng)域之一,在計(jì)算機(jī)視覺(jué)、文本分類、醫(yī)療健康領(lǐng)域有著廣闊的應(yīng)用場(chǎng)景,當(dāng)然也包括金融領(lǐng)域。

“與廣告推薦等領(lǐng)域相比,金融領(lǐng)域獲取的無(wú)偏樣本不僅僅需要獲客成本、營(yíng)銷推廣費(fèi)用,更需要付出昂貴的客戶逾期成本。而使用遷移學(xué)習(xí)的時(shí)候,就可以直接采用大量的業(yè)務(wù)樣本,這種近乎于零成本的樣本獲取方式的優(yōu)勢(shì)正是建模樣本所或缺的,能夠解決有標(biāo)注的樣本的昂貴的產(chǎn)生代價(jià)問(wèn)題?!?薩摩耶?dāng)?shù)科人工智能部負(fù)責(zé)人指出。

薩摩耶?dāng)?shù)科是一家以AI為驅(qū)動(dòng)的金融數(shù)字科技公司,現(xiàn)有團(tuán)隊(duì)規(guī)模超450人,其中風(fēng)控及研發(fā)技術(shù)人員占比80以上,依托人工智能和云計(jì)算等技術(shù),為金融機(jī)構(gòu)提供全方位、專業(yè)的數(shù)字金融科技服務(wù)。截至2021年一季度,薩摩耶?dāng)?shù)科已與包括商業(yè)銀行、消費(fèi)金融公司在內(nèi)的超100家機(jī)構(gòu)達(dá)成合作,累計(jì)注冊(cè)用戶超7130萬(wàn)。

而遷移學(xué)習(xí)就是薩摩耶?dāng)?shù)科在人工智能領(lǐng)域廣泛應(yīng)用的技術(shù)之一。

薩摩耶?dāng)?shù)科與遷移學(xué)習(xí)

薩摩耶?dāng)?shù)科是國(guó)內(nèi)較早將遷移學(xué)習(xí)應(yīng)用于金融科技領(lǐng)域的企業(yè)之一。通過(guò)結(jié)合薩摩耶?dāng)?shù)科內(nèi)部常用的自動(dòng)建模平臺(tái)AUTOMAN,薩摩耶?dāng)?shù)科開(kāi)發(fā)了一套合適自身特點(diǎn)和需求的遷移學(xué)習(xí)工具。

例如在通過(guò)AUTOMAN自動(dòng)建模過(guò)程中,在存在兩份建模數(shù)據(jù)集目標(biāo)數(shù)據(jù)集、輔助數(shù)據(jù)集的前提下,通過(guò)遷移學(xué)習(xí)的方式,來(lái)調(diào)整兩份樣本中每個(gè)樣本實(shí)例的權(quán)重,通過(guò)每一輪的迭代,使得目標(biāo)數(shù)據(jù)集中的錯(cuò)分樣本權(quán)重提高,同時(shí)使得輔助數(shù)據(jù)集中的錯(cuò)分樣本權(quán)重降低;如此,使得輔助數(shù)據(jù)集中有用的樣本可以為建模集所用,而無(wú)用的樣本從建模集中剔除,來(lái)實(shí)現(xiàn)建模數(shù)據(jù)樣本的調(diào)整。

該工具是否真的能通過(guò)遷移學(xué)習(xí)的方法改善建模效果?薩摩耶?dāng)?shù)科舉了一個(gè)項(xiàng)目實(shí)例:

此項(xiàng)目模擬了兩個(gè)數(shù)據(jù)集用遷移學(xué)習(xí)方式改善建模效果的實(shí)例,實(shí)際的樣本構(gòu)成如下表所示:

最終建模效果如下圖所示,在相同的跨時(shí)間建模樣本上驗(yàn)證模型效果,KS從0.328提升到0.406,效果有了非常顯著的提升。盡管兩份數(shù)據(jù)集的正樣本比例有著巨大的差距圖1所示,但遷移學(xué)習(xí)可以在迭代的過(guò)程中消除這種差異,將可用數(shù)據(jù)為建模數(shù)據(jù)集所用。

從此項(xiàng)目實(shí)例可以看出,遷移學(xué)習(xí)在金融領(lǐng)域大有可為,而薩摩耶?dāng)?shù)科就是這項(xiàng)技術(shù)的先行者之一。

經(jīng)過(guò)了十余年的發(fā)展,金融科技已經(jīng)走過(guò)了一個(gè)完整的周期,大浪淘沙之下,穿越周期的企業(yè)很少,其中就有薩摩耶?dāng)?shù)科的身影?!按┰街芷谛枰K局思維”薩摩耶?dāng)?shù)科董事長(zhǎng)林建明曾如此說(shuō)。

薩摩耶?dāng)?shù)科的終局思維體現(xiàn)在哪里?就在諸如遷移學(xué)習(xí)等人工智能技術(shù)上。截止2021年Q1季度,薩摩耶?dāng)?shù)科知識(shí)產(chǎn)權(quán)申請(qǐng)專利、商標(biāo)、著作權(quán)418個(gè),行業(yè)獲獎(jiǎng)超50項(xiàng)。

6月初,智源研究院理事長(zhǎng)張宏江一次活動(dòng)上指出:在智能化時(shí)代,AI已經(jīng)像電力一樣變成無(wú)所不在的能力,數(shù)據(jù)已經(jīng)像燃料一樣變得隨處都需要。

誠(chéng)然,人工智能早已不再是局限于圍棋上的阿爾法狗,它與我們的生活聯(lián)系越來(lái)越緊密,若說(shuō)AI是“電力”,數(shù)據(jù)是“燃料”,那遷移學(xué)習(xí)這類技術(shù)是什么呢?在薩摩耶?dāng)?shù)科看來(lái),它是人類在提升“燃料”使用效率的探索,就像人類對(duì)內(nèi)燃機(jī)的改進(jìn)和研究。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://www.parkingblocks4less.com/a/jiaoyu/20210622/67231.html上一篇:上一篇:喜馬拉雅打造“紅色學(xué)習(xí)站”,購(gòu)吖零售助力城市公共文化服務(wù)數(shù)字化建設(shè)
下一篇:下一篇:沒(méi)有了