現(xiàn)在位置:主頁 > 國內(nèi) > 知識(shí)圖譜賦能金融科技,看這一篇就夠了

知識(shí)圖譜賦能金融科技,看這一篇就夠了

作者:編輯 ? 時(shí)間:2018-10-23 ? 瀏覽:人次

數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時(shí)代的新型生產(chǎn)資料。

基于數(shù)據(jù)的生產(chǎn)變革和業(yè)務(wù)模式創(chuàng)新正驅(qū)動(dòng)著全球范圍內(nèi)經(jīng)濟(jì)社會(huì)各個(gè)領(lǐng)域的數(shù)字化、智能化轉(zhuǎn)型。金融行業(yè)因與數(shù)據(jù)的高度相關(guān)性,成為人工智能最先應(yīng)用的行業(yè)之一,而知識(shí)圖譜作為人工智能技術(shù)的重要研究方向與組成部分,正在快速滲透到金融業(yè)務(wù)應(yīng)用層面,并日益成為金融科技的“底層支撐”。

“金融知識(shí)圖譜”是金融行業(yè)語義理解和知識(shí)搜索的基礎(chǔ)技術(shù),可以為風(fēng)險(xiǎn)評估、預(yù)測、反欺詐、精準(zhǔn)營銷、智能搜索等提供技術(shù)支撐。越來越多的金融機(jī)構(gòu)及企業(yè)在探索構(gòu)建金融領(lǐng)域的知識(shí)圖譜研究,將海量非結(jié)構(gòu)化信息自動(dòng)化利用起來,為金融領(lǐng)域應(yīng)用決策提供更精準(zhǔn)、更可靠的依據(jù)。

什么是知識(shí)圖譜?

知識(shí)圖譜本質(zhì)上是一種大規(guī)模語義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(diǎn)和邊組成。在知識(shí)圖譜里,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界中存在的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”。通俗地講,知識(shí)圖譜就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò)。知識(shí)圖譜提供了從“關(guān)系”的角度去分析問題的能力,是關(guān)系表示最有效的方式之一。

相對于傳統(tǒng)的描述方式,知識(shí)圖譜有三大特點(diǎn):

(1)多維度,需要從大量的信息源中抽取多維度的特征信息,為后續(xù)算法拓展深度關(guān)聯(lián)關(guān)系提供必要的素材。

(2)深加工,在信息素材的基礎(chǔ)上,通過智能推理實(shí)現(xiàn)從數(shù)據(jù)到智慧的深加工。

(3)可視化,深加工的結(jié)果以可視化的方式展現(xiàn)給用戶,并與用戶交互,直觀易懂。

知識(shí)圖譜技術(shù)溯源

知識(shí)圖譜的發(fā)展歷程可以追溯到20世紀(jì)70年代誕生的專家系統(tǒng),專家系統(tǒng)一般由知識(shí)庫與推理引擎兩部分組成,它積累了大量的某個(gè)領(lǐng)域?qū)<宜降闹R(shí)與經(jīng)驗(yàn),根據(jù)知識(shí)和經(jīng)驗(yàn),模擬人類專家的決策。1984年由Douglas Lenat設(shè)立的Cyc是這一期間較為出色的本體知識(shí)庫。

1989年萬維網(wǎng)的出現(xiàn),為知識(shí)的獲取提供了極大的方便,1998年,萬維網(wǎng)之父蒂姆·伯納斯·李再次提出語義網(wǎng),語義網(wǎng)直接向機(jī)器提供可直接用于程序處理的知識(shí)表示,它也是NLP(自然語言處理)的前身。

2001年維基百科誕生使得全球用戶可以通過協(xié)作完成數(shù)上百萬詞條的知識(shí),推動(dòng)了很多基于維基百科的結(jié)構(gòu)化知識(shí)的知識(shí)庫的構(gòu)建,DBpedia、Yago等屬于這一類知識(shí)庫代表項(xiàng)目。

2006年,伯納斯·李提出鏈接數(shù)據(jù)(Linked Data)的概念,希望數(shù)據(jù)不僅僅發(fā)布于語義網(wǎng)中,而要建立起數(shù)據(jù)之間的鏈接從而形成一張巨大的鏈接數(shù)據(jù)網(wǎng)。隨后,2007年DBpedia項(xiàng)目開始運(yùn)行,它是目前已知的第一個(gè)大規(guī)模開放域鏈接數(shù)據(jù)。

2012年5月16日,Google發(fā)布了名為“知識(shí)圖譜(Knowledge Graph)”的“智能”搜索功能,在Google傳統(tǒng)搜索列表右側(cè),添加了與搜索關(guān)鍵詞相關(guān)的人物、地點(diǎn)和事物相關(guān)的事實(shí),相比傳統(tǒng)搜索結(jié)果頁,這種搜索模式提供與詞匯所描述的“實(shí)體”或概念匹配的頁面,這也標(biāo)志性著知識(shí)圖譜正式誕生。

知識(shí)圖譜的構(gòu)建與分類

知識(shí)圖譜的歷史使命是作為一個(gè)巨大的背景知識(shí)庫讓機(jī)器具備語言認(rèn)知能力。有了知識(shí)圖譜,機(jī)器看到的不再僅僅是字符串,而是可以把這些字符串映射到各種各樣的實(shí)體、概念,從而建立機(jī)器自己的認(rèn)知世界。建立一個(gè)完整精細(xì)化的知識(shí)圖譜所依賴的背景知識(shí)庫必須滿足三個(gè)條件:

第一個(gè)是知識(shí)庫有規(guī)模要足夠大,必須涵蓋足夠多的實(shí)體和概念。

第二個(gè)是知識(shí)庫語義關(guān)系要足夠豐富,描述現(xiàn)實(shí)世界的語義關(guān)系是豐富多樣的,知識(shí)庫要涵蓋常見的語義關(guān)系。

第三個(gè)就是知識(shí)庫表示結(jié)構(gòu)要十分友好。文本是一個(gè)巨大的載體,但是文本是一個(gè)非結(jié)構(gòu)化數(shù)據(jù)表現(xiàn)形式,機(jī)器很難處理,而知識(shí)圖譜往往表達(dá)為RDF結(jié)構(gòu),是一種結(jié)構(gòu)友好的表達(dá)形式,是能夠被計(jì)算機(jī)有效處理的。

從技術(shù)的角度來看,知識(shí)圖譜構(gòu)建流程包含信息抽取、知識(shí)表示、知識(shí)融合、知識(shí)推理四個(gè)階段。從最原始的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)出發(fā),采用一系列自動(dòng)或者半自動(dòng)的技術(shù)手段,從原始數(shù)據(jù)庫和第三方數(shù)據(jù)庫中提取知識(shí)事實(shí),并將其存入知識(shí)庫的數(shù)據(jù)層和模式層。

根據(jù)覆蓋范圍而言,知識(shí)圖譜也可分為開放域通用知識(shí)圖譜垂直行業(yè)知識(shí)圖譜。開放通用知識(shí)圖譜注重廣度,強(qiáng)調(diào)融合更多的實(shí)體,主要應(yīng)用于知識(shí)獲取的場景,要求知識(shí)全面,如搜索引擎,知識(shí)問答;比較著名的知識(shí)圖譜庫有Freebase、Wikidata、Yago、DBPedia、Wolfram Alpha等。

行業(yè)知識(shí)圖譜通常需要依靠特定行業(yè)如金融、電信、教育等行業(yè)的數(shù)據(jù)來構(gòu)建,主要應(yīng)用于行業(yè)智能商業(yè)和智能服務(wù)的場景,要求精準(zhǔn),如投資決策、智能客服等。行業(yè)知識(shí)圖譜中,實(shí)體的屬性與數(shù)據(jù)模式往往比較豐富,規(guī)?;瘮U(kuò)展要求更迅速、知識(shí)結(jié)構(gòu)更加復(fù)雜、知識(shí)質(zhì)量要求更高、知識(shí)的應(yīng)用形式也更加廣泛。

知識(shí)圖譜的玩家有哪些?

凡是有關(guān)系的地方都可以用到知識(shí)圖譜,目前知識(shí)圖譜在多個(gè)不同的領(lǐng)域得到了廣泛應(yīng)用,知識(shí)圖譜產(chǎn)品的客戶行業(yè)分類主要集中在:社交網(wǎng)絡(luò)、人力資源與招聘、金融、保險(xiǎn)、零售、廣告、物流、通信、IT、制造業(yè)、傳媒、醫(yī)療、電子商務(wù)和物流等領(lǐng)域。

主要的玩家大致可以分為兩類,一類是互聯(lián)網(wǎng)巨頭,如阿里商品知識(shí)圖譜、騰訊云“星圖”、百度“知心”、搜狗“知立方“等;另一類是創(chuàng)業(yè)公司,如脈脈、天眼查、企查查、中誠信征信、知因智慧、文因互聯(lián)、明略數(shù)據(jù)、達(dá)觀數(shù)據(jù)、智言科技、海知智能、淵亭科技、海智星圖、海致大數(shù)據(jù)等企業(yè)。

創(chuàng)業(yè)公司又可以細(xì)分為兩類:一是專注于單一的金融領(lǐng)域,如知因智慧、文因互聯(lián)、智言科技;另一類則是選擇社交、企服、金融、法律、公安、航空、醫(yī)療等多個(gè)垂直領(lǐng)域同時(shí)推進(jìn),如明略數(shù)據(jù)主打公安、金融、工業(yè);擅長長文本分析的達(dá)觀數(shù)據(jù)則主攻金融、制造業(yè)、法律;海知智能主攻智能家居、醫(yī)療、金融;淵亭科技則在航空、醫(yī)療、軍工、通信、教育等多個(gè)領(lǐng)域均有涉足。

金融知識(shí)圖譜可以做什么?

1、風(fēng)險(xiǎn)評估與反欺詐

如今數(shù)字金融欺詐形式不斷更新、紛繁復(fù)雜,欺詐手段逐漸表現(xiàn)出專業(yè)化、產(chǎn)業(yè)化、隱蔽化、場景化的特征。

傳統(tǒng)反欺詐技術(shù)的維度單一、效率低下、范圍受限的劣勢越來越明顯。在反欺詐場景中,知識(shí)圖譜可以聚合與借款人相關(guān)的各類數(shù)據(jù)源,包括借款人的基本信息、日常生活中的消費(fèi)記錄、行為記錄、關(guān)系信息、網(wǎng)上瀏覽記錄等,然后抽取該借款人的特征標(biāo)簽,從而將相關(guān)的信息整合成進(jìn)結(jié)構(gòu)化的知識(shí)圖譜中,在此基礎(chǔ)上,對該借款人的風(fēng)險(xiǎn)進(jìn)行全方位的分析和評估。

除了申請階段的反欺詐,通過構(gòu)建已知欺詐要素如手機(jī)、設(shè)備、賬號(hào)、地域等的關(guān)系圖譜,全方位了解客戶海量風(fēng)險(xiǎn)數(shù)據(jù)的離線統(tǒng)計(jì)分析,按主題要素收集風(fēng)險(xiǎn)運(yùn)營的結(jié)果反饋,建立客戶風(fēng)險(xiǎn)特征信息庫,優(yōu)化風(fēng)險(xiǎn)模型和規(guī)則,還能做到交易階段的反欺詐。

2、風(fēng)險(xiǎn)預(yù)測

風(fēng)險(xiǎn)預(yù)測包括對潛在風(fēng)險(xiǎn)行業(yè)預(yù)測和潛在風(fēng)險(xiǎn)客戶預(yù)測。

在潛在風(fēng)險(xiǎn)行業(yè)預(yù)測上,基于多維度數(shù)據(jù)對行業(yè)進(jìn)行細(xì)分,根據(jù)行業(yè)信息建立關(guān)系挖掘模型,展示每個(gè)行業(yè)之間的關(guān)聯(lián)度,如果某一行業(yè)發(fā)生了行業(yè)風(fēng)險(xiǎn)或高風(fēng)險(xiǎn)事件,可以及時(shí)預(yù)測未來有潛在風(fēng)險(xiǎn)的關(guān)聯(lián)行業(yè),金融機(jī)構(gòu)從而可對相關(guān)行業(yè)的風(fēng)險(xiǎn)做出預(yù)判,盡早地發(fā)現(xiàn)并規(guī)避風(fēng)險(xiǎn)。

在潛在風(fēng)險(xiǎn)客戶預(yù)測上,通過知識(shí)圖譜整合和關(guān)聯(lián)企業(yè)內(nèi)部結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及互聯(lián)網(wǎng)采集數(shù)據(jù)、第三方合作數(shù)據(jù),發(fā)現(xiàn)和建立企業(yè)與企業(yè)之間的集團(tuán)關(guān)系、投資關(guān)系、上下游關(guān)系、擔(dān)保關(guān)系,企業(yè)與個(gè)人之間的任職、實(shí)際控制、一致行動(dòng)關(guān)系,及時(shí)預(yù)測未來有潛在風(fēng)險(xiǎn)的關(guān)聯(lián)企業(yè)。

3、精準(zhǔn)營銷

針對個(gè)人客戶,知識(shí)圖譜可以通過鏈接的多個(gè)數(shù)據(jù)源,形成對用戶或用戶群體的完整知識(shí)體系描述,挖掘已有客戶的潛在需求,針對性地推送相關(guān)產(chǎn)品,為客戶提供營銷服務(wù)。

例如,金融公司的市場經(jīng)理用知識(shí)圖譜去分析待銷售用戶群體之間的關(guān)系,去發(fā)現(xiàn)他們的共同愛好,從而更有針對性地對這類用戶人群制定營銷策略。如果對知識(shí)圖譜擴(kuò)展(如個(gè)人愛好、電商交易數(shù)據(jù)、社交數(shù)據(jù)等),還可以更加精準(zhǔn)地分析客戶行為,進(jìn)行精準(zhǔn)推送。

針對企業(yè)級客戶,通過分析包括企業(yè)基礎(chǔ)數(shù)據(jù)、投資關(guān)系、任職關(guān)系、專利數(shù)據(jù)、招投標(biāo)數(shù)據(jù)、招聘數(shù)據(jù)、訴訟數(shù)據(jù)、失信數(shù)據(jù)、新聞咨詢等企業(yè)數(shù)據(jù)勾畫出企業(yè)客戶的資金關(guān)系、法人關(guān)系、上下游投資關(guān)系、相似企業(yè)業(yè)務(wù)關(guān)系等構(gòu)建起企業(yè)知識(shí)圖譜,為企業(yè)推薦合適產(chǎn)品、服務(wù)。

4、智能搜索和數(shù)據(jù)可視化

智能搜索的功能指的是,知識(shí)圖譜能夠在語義上擴(kuò)展用戶的搜索關(guān)鍵詞,從而返回更豐富、更全面的信息。

比如,搜索某個(gè)人的身份證號(hào),可以返 回與這個(gè)人相關(guān)的所有歷史借款記錄、聯(lián)系人關(guān)系和其他相關(guān)的標(biāo)簽(如黑名單等)。這些結(jié)果可以用圖形網(wǎng)絡(luò)的方式展示,從而把復(fù)雜的信息以直觀明了的圖像呈現(xiàn)出來,讓使用者對隱藏信息的來龍去脈一目了然。

結(jié)語

互聯(lián)網(wǎng)促成了大數(shù)據(jù)的集聚,大數(shù)據(jù)促進(jìn)了人工智能算法的進(jìn)步。

新數(shù)據(jù)和新算法為規(guī)模化知識(shí)圖譜構(gòu)建提供了新的技術(shù)基礎(chǔ)和發(fā)展條件,使得知識(shí)圖譜構(gòu)建的來源、方法和技術(shù)手段都發(fā)生極大的變化。知識(shí)圖譜作為知識(shí)的一種形式,已經(jīng)在語義搜索、智能問答、數(shù)據(jù)分析、自然語言理解、視覺理解、物聯(lián)網(wǎng)設(shè)備互聯(lián)等多個(gè)方面發(fā)揮出越來越大的價(jià)值。

尤其在金融領(lǐng)域,從數(shù)據(jù)可視化、風(fēng)險(xiǎn)評估與反欺詐、風(fēng)險(xiǎn)預(yù)測到用戶洞察,知識(shí)圖譜的底層性支撐作用越來越顯著。

AI浪潮愈演愈烈,知識(shí)圖譜賽道也從鮮有問津到緩慢升溫,隨著更多入局者的出現(xiàn),未來這條賽道將會(huì)越來越擁擠。

轉(zhuǎn)載請保留原文鏈接:http://parkingblocks4less.com/a/guona/20181023/15600.html上一篇:上一篇:康恩貝9.60億元設(shè)立全資子公司,意在助推嘉和生物境外上市
下一篇:下一篇:沒有了