少妇脱了内裤让我添,久久久久亚洲精品无码网址蜜桃,性色av免费观看,久久人妻av无码中文专区

分享

業(yè)務(wù)實戰(zhàn)-如何搭建知識圖譜?

 湖經(jīng)松哥 2024-08-19 發(fā)布于湖北

原文作者:白白的一團團

原文鏈接 :https://blog.csdn.net/baidu_39413110/article/details/123142066

目  錄

一、如何構(gòu)建知識圖譜

    1、搭建知識圖譜需要哪些數(shù)據(jù)

    2、如何設(shè)計知識圖譜結(jié)構(gòu)

        2.1 隱性申請節(jié)點結(jié)構(gòu)

        2.2 顯性申請節(jié)點結(jié)構(gòu)

        2.3 兩種知識圖譜結(jié)構(gòu)的特點對比

二、知識圖譜的優(yōu)勢

    1、提高聚集變量計算效率

    2、實現(xiàn)異常團簇的敏捷識別

    3、為關(guān)聯(lián)關(guān)系的深度挖掘提供平臺

三、知識圖譜如何應(yīng)用及常見問題

    1、圖譜應(yīng)用方式

    2、知識圖譜回溯問題

    3、知識圖譜防范團伙欺詐的及時性問題

脫胎于搜索引擎優(yōu)化的知識圖譜技術(shù),本質(zhì)上是一種揭示實體關(guān)系的信息網(wǎng)絡(luò),如今已廣泛應(yīng)用于各個領(lǐng)域。在信貸領(lǐng)域,知識圖譜也經(jīng)常被各家機構(gòu)標榜為一種先進的大數(shù)據(jù)應(yīng)用技術(shù)。在流量紅利時代成為過去式后,信貸領(lǐng)域會越來越強調(diào)對客戶的精細化運營,即對客戶要做到千人千面的定制化服務(wù)和策略,這就要求信貸機構(gòu)對客戶要有360度全景式的把握,不僅要掌握客戶的基本信息、行為偏好、金融特征,更要掌握客戶間的關(guān)聯(lián)關(guān)系和信貸申請行為的聚集性特征,而知識圖譜在識別客戶關(guān)系和聚集性特征方面就有著不可替代的優(yōu)勢。

所以今天我們就簡單聊一聊關(guān)于知識圖譜的幾個問題,一,如何構(gòu)建一個契合信貸業(yè)務(wù)的知識圖譜;二,知識圖譜在信貸業(yè)務(wù)中的應(yīng)用優(yōu)勢有哪些;三,如何應(yīng)用這項技術(shù)去賦能信貸業(yè)務(wù);以及四,知識圖譜應(yīng)用中需要注意的一些問題。如果想深入的挖掘,可以參考下我的課程:萬物皆網(wǎng)絡(luò)-風(fēng)控中的網(wǎng)絡(luò)挖掘方法

一、如何構(gòu)建知識圖譜?

1、搭建知識圖譜需要哪些數(shù)據(jù)

搭建知識圖譜的目的之一在于完全挖掘出客戶間各種錯綜復(fù)雜的關(guān)聯(lián)關(guān)系,所以原則上就需要把各種有關(guān)聯(lián)可能的數(shù)據(jù)都納入進來。另一方面,我們同樣需要把客戶的身份標識數(shù)據(jù)、重要屬性特征也納入進來,便于后續(xù)我們對客戶關(guān)系的分析、回溯及關(guān)聯(lián)變量的加工。所以我們從關(guān)聯(lián)數(shù)據(jù)、重要屬性兩個維度展開來講。

關(guān)聯(lián)數(shù)據(jù)主要包括這幾個維度:

手機號碼:包括客戶的注冊手機號、用款手機號、緊急聯(lián)系人手機號、配偶手機號、親屬手機號、公司電話、家庭電話、人行報告中近期曾使用電話,以及現(xiàn)在變得異常敏感的通訊錄手機號、通話記錄手機號等等。這些號碼類數(shù)據(jù)放入知識圖譜中便能將客戶之間的親屬關(guān)系、同單位情況、平時聯(lián)系緊密度情況反映出來。這些數(shù)據(jù)放入知識圖譜前就要注意號碼格式的對齊和臟數(shù)據(jù)的清洗。

銀行卡數(shù)據(jù):現(xiàn)在信貸業(yè)務(wù)都會進行n要素驗證,一般銀行卡都是本人使用,不會出現(xiàn)多人共用一張銀行卡的情況,那為什么還要放銀行卡數(shù)據(jù)呢?這要看怎么放,我們在以往的業(yè)務(wù)中發(fā)現(xiàn)了以這樣一個團伙欺詐案例,團伙中的幾人同時在同一銀行各自新辦了銀行卡用于貸款發(fā)放,這就導(dǎo)致這幾人申請時的銀行卡號是連號的。如果我們將銀行卡末幾位去掉之后再放到知識圖譜里,這種異常銀行卡聚集特征就能顯現(xiàn)在圖譜中了。

設(shè)備數(shù)據(jù):主要包括注冊申請設(shè)備和用款設(shè)備兩類,當然也可以進一步細化到申請每個環(huán)節(jié),包括注冊首頁設(shè)備、人臉識別設(shè)備、提交申請頁設(shè)備等等。申請人共用設(shè)備是團伙欺詐的一種典型特征,所以是防范欺詐要關(guān)注的十分重要的一個維度。

單位數(shù)據(jù):包括申請時填寫單位、配偶單位、公積金繳納單位、人行報告中近期曾任職的單位等等,單位類數(shù)據(jù)雖然包含重要的關(guān)聯(lián)信息,但綜合考量也可以不放,主要是這樣兩個原因,一是內(nèi)容多為手寫,格式混亂,對齊難度很大;二是申請客戶在單位上聚集很多不是異常,比如客戶經(jīng)理到一個大企業(yè)展業(yè),一段時間搞定十幾、幾十個客戶也很正常。

位置數(shù)據(jù):包括申請時的GPS打點位置、用款時的打點位置、單位地址位置、家庭地址位置等等。一般我們會將各種位置轉(zhuǎn)化為同一坐標系下的經(jīng)緯度,并使用geohash算法將經(jīng)緯度轉(zhuǎn)化為地理網(wǎng)格后在放入圖譜,一般的網(wǎng)格大小為百米乘以百米量級,當然也要根據(jù)數(shù)據(jù)精度和業(yè)務(wù)需要來確定。

WIFI數(shù)據(jù):包括申請、用款或各個環(huán)節(jié)埋點取到的WIFI信息,可以將WIFI的bssid做主鍵放入圖譜。

IP類數(shù)據(jù):IP數(shù)據(jù)是否可用仍需調(diào)研,一是地址可以自由配置,二是用流量和用WIFI會發(fā)生IP變動也不能說明什么,三是之前調(diào)研過一些共IP的客戶案例,發(fā)現(xiàn)并沒有實際關(guān)聯(lián)。所以IP可用與否有待考量。

其它數(shù)據(jù):包括郵箱地址數(shù)據(jù)等。

重要屬性數(shù)據(jù)主要包括:

身份信息及主鍵:包括身份證號、姓名、客戶申請?zhí)?、用款號等等。用于我們定位、查詢每個客戶。

時間信息:非常重要?。≈饕ㄉ暾垥r間、用款時間。后期需要對圖譜及關(guān)聯(lián)變量進行回溯就是要依賴這些時間信息。

特征偏好信息:比如年齡、性別、職業(yè)、收入、愛好等各種畫像標簽等等??捎糜诳坍嬚麄€團簇的屬性特征,比如一個團簇聚集的幾個人都有午夜活躍、網(wǎng)絡(luò)游戲的特征,那是不是值得我們特別關(guān)注一下呢。

逾期類信息:包括逾期天數(shù)、逾期筆數(shù)、當前是否逾期等等。是我們定性聚集團簇性質(zhì)的重要維度。

申請狀態(tài)及原因:包括通過、放棄、拒絕等狀態(tài)以及拒絕原因,比如欺詐拒絕、多頭拒絕、信用評分拒絕等等,也是刻畫團簇性質(zhì)的重要維度。

黑、灰名單信息:包括信用黑名單、營銷黑名單、欺詐黑名單等等,維度包括手機號、身份證、設(shè)備,甚至WIFI、位置都可以。后期也可以根據(jù)知識圖譜發(fā)現(xiàn)異常團簇去更新黑名單信息。

2、如何設(shè)計知識圖譜結(jié)構(gòu)

2.1 隱性申請節(jié)點結(jié)構(gòu)

圖譜三要素包括:節(jié)點、邊和屬性,所以設(shè)計知識圖譜結(jié)構(gòu)就是確定三個問題:哪些數(shù)據(jù)做節(jié)點、設(shè)計哪些關(guān)聯(lián)邊、哪些數(shù)據(jù)做屬性放到哪些位置上。基本可以遵循這樣一個原則:會產(chǎn)生關(guān)聯(lián)關(guān)系的基本實體做節(jié)點,發(fā)生的動作作為關(guān)聯(lián)邊,補充信息做屬性。

比如張三用133445的手機號在3月12日提交了一筆申請,李四用188888的手機在3月15日進行了申請,填寫的親屬手機號為133445。問題一,節(jié)點設(shè)置:這里張三、李四、申請手機號、親屬手機號都是基本實體,可以設(shè)計為節(jié)點;問題二,邊設(shè)置:使用某某手機號申請,填寫親屬手機號為某某是兩個動作,可以設(shè)計為邊,問題三,屬性設(shè)置:申請時間是補充信息,可以作為屬性,屬性放到哪里呢,這里建議放到申請手機號的邊上面,因為如果放到客戶節(jié)點上,假如這個客戶多次用不同手機號申請就容易產(chǎn)生混淆,由此我們就可以得到下圖左邊這樣一個簡單的圖譜結(jié)構(gòu)。依照這樣的邏輯,代入所有數(shù)據(jù),我們就能得到基本結(jié)構(gòu)如下圖右邊所示的知識圖譜。

圖片

這種結(jié)構(gòu)的圖譜更強調(diào)的是客戶——關(guān)聯(lián)節(jié)點——客戶這種關(guān)聯(lián)關(guān)系的簡潔呈現(xiàn)。對于客戶的各種申請動作都通過增加邊關(guān)系來表達,如果客戶多次申請,就會如圖中所示,使得每個節(jié)點對之間的關(guān)聯(lián)邊變得紛繁復(fù)雜,而且條關(guān)聯(lián)邊上面都應(yīng)該帶著時間屬性,以對多次申請進行區(qū)分。

圖片

2.2 顯性申請節(jié)點結(jié)構(gòu)

想要不把節(jié)點對之間的關(guān)聯(lián)邊搞得這么復(fù)雜,而且期望將客戶的申請動作表現(xiàn)得更清楚,我們還有第二種結(jié)構(gòu)設(shè)計方案,即把客戶的每次申請都用一個顯性的節(jié)點表示出來,這種結(jié)構(gòu)可以稱為顯性申請節(jié)點結(jié)構(gòu)。按照這種結(jié)構(gòu)將上面的知識圖譜重構(gòu)就得到了如下圖所示的結(jié)構(gòu)。這種結(jié)構(gòu)下,節(jié)點對的邊關(guān)系就簡化了很多,像是申請時間、逾期狀況等屬性我們就都可以附加在申請節(jié)點上面,能更清晰地看到客戶兩次申請之間的差異。

2.3 兩種知識圖譜結(jié)構(gòu)的特點對比

兩種圖譜結(jié)構(gòu)各有優(yōu)勢,我們通過以下兩個方面對比一下他們各自的特性:

一是契合不同的業(yè)務(wù)場景。有些信貸業(yè)務(wù)模式較為簡單,沒有循環(huán)額度,單次授信,單次用款,授信申請、用款申請不做明顯區(qū)分。這樣的業(yè)務(wù)場景就更適合于隱性申請結(jié)構(gòu)的構(gòu)建;而有些業(yè)務(wù)模式稍微復(fù)雜一些,設(shè)置循環(huán)額度,一次授信,后續(xù)可多次申請用款,這就導(dǎo)致客戶的申請較為復(fù)雜,要區(qū)分授信申請和用款申請,如果再加之多渠道,多產(chǎn)品申請,客戶的申請行為的復(fù)雜度就更甚,這個時候,用顯性申請節(jié)點結(jié)構(gòu)來構(gòu)建知識圖譜就能較為清楚地表現(xiàn)出客戶的多次申請行為;其次,有了申請節(jié)點,就可以將很多屬性只歸納到申請節(jié)點上,比如申請時間,從而將邊上屬性大大簡化,最后,申請節(jié)點可以更具體地呈現(xiàn)每一次申請的不同屬性狀態(tài),比如每次申請的逾期狀態(tài)、用款筆數(shù)等等。

二是計算關(guān)聯(lián)度數(shù)復(fù)雜程度不同。對于隱性申請節(jié)點結(jié)構(gòu),從一個客戶關(guān)聯(lián)到另一個客戶最短只需要兩度,即客戶——關(guān)聯(lián)節(jié)點——客戶;而對于顯性申請節(jié)點結(jié)構(gòu),從一個客戶關(guān)聯(lián)到另一個客戶最少需要四度,即客戶——申請——關(guān)聯(lián)節(jié)點——申請——客戶,這就導(dǎo)致在做圖計算的時候兩種結(jié)構(gòu)有所差異。比如計算一個客戶直接關(guān)聯(lián)客戶數(shù)、間接關(guān)聯(lián)客戶數(shù),在隱性申請節(jié)點結(jié)構(gòu)中只需要執(zhí)行3度和5度的計算;而在顯性申請節(jié)點結(jié)構(gòu)中,則增加到4度和8度的計算,這也會直接導(dǎo)致計算資源和計算時間的差異。

最后,我們以顯性申請節(jié)點結(jié)構(gòu)為例,把一個較為完整的圖譜架構(gòu)總結(jié)如下:

圖片

最后,圖譜放哪些數(shù)據(jù),如何架構(gòu)也要從更高的層面考慮。放眼整個數(shù)據(jù)產(chǎn)品體系,圖譜也僅僅是其中的一環(huán),所以很多業(yè)務(wù)信息有沒有必要都放到圖譜中值得商榷,圖譜設(shè)計得大而全,就會一定程度上拖累其運算和使用速度。圖譜的特點和優(yōu)勢在于聚集關(guān)系的發(fā)現(xiàn)和欺詐風(fēng)險的防控,其它業(yè)務(wù)問題完全可以放到其它產(chǎn)品體系中去解決。最終的目的也是想要讓圖譜和整個數(shù)據(jù)體系中的其它產(chǎn)品形成良性互補,而非相互冗余。

二、知識圖譜的優(yōu)勢

知識圖譜可以被看做是一種數(shù)據(jù)存儲方式,如果僅從數(shù)據(jù)存儲的角度來看待它,那相較于傳統(tǒng)的數(shù)據(jù)庫,它并沒有帶來任何新的信息,只是將原有的信息換了一種更側(cè)重關(guān)系的方式進行存儲。正是基于這樣的原因,我們在啟動知識圖譜項目的時候,往往會被質(zhì)問,搭建知識圖譜的必要性在哪里,業(yè)務(wù)中究竟遇到了什么樣的困境,是傳統(tǒng)數(shù)據(jù)庫無法解決而一定要用到知識圖譜的呢?我們就以一個實際的業(yè)務(wù)案例,對這個問題進行一個簡單闡述。

圖片

上圖展示的是我們在真實信貸業(yè)務(wù)中遇到的一個可疑團伙案例。18個客戶之間通過用款設(shè)備、注冊電話、公司電話、親屬電話、配偶電話等關(guān)系有著錯綜復(fù)雜的連接,形成一個關(guān)系緊密的小團體。18個客戶之中有13個客戶借款后發(fā)生了逾期,整個小團體的客戶逾期率達到了72.2%。業(yè)務(wù)中,及時、全面地發(fā)現(xiàn)這樣性質(zhì)異常的團簇對于降低整個信貸業(yè)務(wù)欺詐率、保障資產(chǎn)質(zhì)量都有著重要的意義。那僅使用傳統(tǒng)數(shù)據(jù)庫,能不能及時、有效地發(fā)現(xiàn)并阻攔這樣的團簇呢?

1、提高聚集變量計算效率

首先,僅使用傳統(tǒng)數(shù)據(jù)庫,我們可以用一種更簡化的方式來發(fā)現(xiàn)客戶異常聚集行為,即開發(fā)聚集性變量,比如同設(shè)備不同申請客戶數(shù),同手機號不同申請客戶數(shù)等等。對于這樣關(guān)系確定且關(guān)聯(lián)深度僅為一度的聚集性變量,使用傳統(tǒng)數(shù)據(jù)庫開發(fā)難度不大,很容易實現(xiàn)。但如果我們想要獲得更深度的關(guān)聯(lián)關(guān)系,那傳統(tǒng)數(shù)據(jù)庫實現(xiàn)起來就有些麻煩了,比如我們以上圖中的O客戶為例,想要獲取從O的注冊手機號出發(fā),二度關(guān)聯(lián)的逾期客戶數(shù),那使用傳統(tǒng)數(shù)據(jù)庫來計算,過程就如下圖所示:

圖片

首先,從客戶O出發(fā),我們需要和全量申請信息表進行六次關(guān)聯(lián)匹配運算,每次分別使用申請表中的注冊手機號、親屬手機號、配偶手機號、緊急聯(lián)系人手機號、公司電話、直系親屬電話和客戶O的注冊手機號進行匹配。在完成6次全量掃描匹配后,我們才能窮盡客戶O申請手機號的共用關(guān)系,才能發(fā)掘出所有在手機號關(guān)系上和O有關(guān)聯(lián)的客戶(在此案例中即客戶G),至此,我們完成了從客戶O出發(fā)的一度關(guān)聯(lián)關(guān)系的挖掘,第二步,二度關(guān)系挖掘,我們需要從客戶G出發(fā),遍歷所有關(guān)聯(lián)關(guān)系,找到與客戶G一度關(guān)聯(lián)的客戶,為此,我們需要用客戶G的注冊電話和申請表的注冊、親屬、配偶、緊急聯(lián)系人…電話進行關(guān)聯(lián)匹配,再用G的親屬手機號和申請表的注冊、親屬、配偶、緊急聯(lián)系人…電話進行關(guān)聯(lián)匹配,以此類推,再用客戶G的配偶手機號、緊急聯(lián)系人手機號、公司…電話分別進行遍歷,在完成36次遍歷匹配后,客戶G手機關(guān)系則就窮盡完了。但還沒有結(jié)束,接下來,我們還需要對客戶G的注冊單位、公積金單位、配偶單位、各種地址、郵箱等關(guān)系進行遍歷關(guān)聯(lián)匹配,然后到埋點信息表中,對客戶G的注冊、登錄、用款等設(shè)備,WIFI、IP、GPS等關(guān)系進行遍歷匹配,當這些關(guān)系都遍歷完成后,我們才完全窮盡了從客戶G出發(fā)的一度關(guān)聯(lián)關(guān)系,也就完成了從客戶O注冊手機號出發(fā)的二度關(guān)聯(lián)關(guān)系,至此,我們也就找到了客戶A、B、C、D、E、F,然后判斷這些客戶中有多少是逾期客戶,也就實現(xiàn)了“通過注冊手機號二度關(guān)聯(lián)的逾期客戶數(shù)”這樣一個變量的運算。

由此,我們也就可見一斑,在進行這樣二度關(guān)聯(lián)關(guān)系變量運算時,使用傳統(tǒng)數(shù)據(jù)庫是多么的冗長和繁復(fù),對計算資源和時間是多么大的浪費。如果我們搭建了知識圖譜這樣一種基于關(guān)系的數(shù)據(jù)存儲庫,計算這樣的二度關(guān)聯(lián)變量就會非常簡單省力,簡單來說,計算時如圖中所示,客戶O伸展出來多少關(guān)聯(lián)邊,在運算中就只需要進行多少次基礎(chǔ)運算,相對傳統(tǒng)數(shù)據(jù)庫來講,效率可謂是革命性的提升。

2、實現(xiàn)異常團簇的敏捷識別

誠如刑偵破案一樣,當我們鎖定一個嫌疑人之后,我們希望通過這個嫌疑人及關(guān)聯(lián)線索,能夠把其背后的整個犯罪團伙全部揪出來。同樣在信貸業(yè)務(wù)中,我們也希望能夠看到每一個異常申請客戶背后緊密關(guān)聯(lián)的群體,及整個群體的特征性質(zhì)。以此案為例,如果我們希望找到和客戶I相關(guān)聯(lián)的整個客戶群,使用傳統(tǒng)數(shù)據(jù)庫要如何實現(xiàn)呢?

圖片

如圖中所示,首先要從客戶I出發(fā),找到與之一度關(guān)聯(lián)的所有客戶,這就需要如前所述將整個申請表和埋點表用所有相關(guān)關(guān)系進行遍歷,才能窮盡找到(此例中的H、J、K、L、E客戶),然后再對每一個一度關(guān)聯(lián)的客戶,同樣進行所有相關(guān)關(guān)系的遍歷匹配,才能發(fā)現(xiàn)與客戶I二度關(guān)聯(lián)的所有申請客戶(此例中的A、B、C、D、F、G),如此循環(huán)往復(fù)下去,直到所有客戶都被找到。但在傳統(tǒng)數(shù)據(jù)庫中,如何確定這樣的邊界條件呢?即我們怎么知道要進行幾次遍歷匹配才能把和I相關(guān)的客戶都找出來呢?這在傳統(tǒng)數(shù)據(jù)庫中是很難確定或很難實現(xiàn)的。而在知識圖譜數(shù)據(jù)庫中,基于關(guān)系找到緊密連接的團簇是很簡單的事情,不僅運算量小,實現(xiàn)也極為方便,一些開源平臺如neo4j直接提供了完整封裝的圖算法來實現(xiàn),發(fā)現(xiàn)這樣一個團簇,運算時間只有秒級。

3、為關(guān)聯(lián)關(guān)系的深度挖掘提供平臺

社區(qū)發(fā)現(xiàn):有時,基于所有關(guān)聯(lián)關(guān)系挖掘出的團簇對我們而言有些冗余,一些我們看來關(guān)系并不緊密的連接也被連帶在里面。那除了業(yè)務(wù)上自定義緊密關(guān)系外,有沒有一種技術(shù)手段,通過科學(xué)計算找到真正緊密連接的團簇呢?這種技術(shù)手段就是社區(qū)發(fā)現(xiàn)算法,比如louvain算法、label propagation算法等等,這些算法考慮邊的權(quán)重,通過循環(huán)迭代能夠找到真正緊密聚集的團簇。

中心度業(yè)務(wù)中往往有通過中介進行團伙欺詐的案例,在一個維度全面的知識圖譜中,中介在一個欺詐團伙中的核心關(guān)聯(lián)位置就很容易凸顯出現(xiàn),那有沒有一種算法能幫我們批量地,快速地找到所有管理核心節(jié)點,以便我們發(fā)現(xiàn)團伙中介呢?就可以使用中心度算法來實現(xiàn),比如pagerank、article rank算法等等。

最短路徑:業(yè)務(wù)中如果我們發(fā)現(xiàn)兩個可疑客戶,想要迅速定位出這兩個可疑客戶間有沒有關(guān)聯(lián)關(guān)系,如果有多種關(guān)聯(lián)方式,那其中最緊密的關(guān)系,即兩個節(jié)點間的最短關(guān)聯(lián)路徑是什么樣的?這樣的需求就可以使用最短路徑算法來實現(xiàn)。

以上種種對客戶關(guān)聯(lián)關(guān)系的深度挖掘算法都需要首先基于知識圖譜這樣一個平臺才能實現(xiàn)。而一旦有了這樣一個知識圖譜平臺,這些算法都可以輕易實現(xiàn),比如我們常用的開源平臺neo4j就提供了整合這些圖計算的算法包graph-data-science包,以上所有算法都高度封裝,基本一句語句解決問題,這里放上算法包的開源網(wǎng)址供學(xué)習(xí)查閱:https:///docs/graph-data-science/current/

三、知識圖譜如何應(yīng)用及常見問題

1、圖譜應(yīng)用方

知識圖譜在信貸風(fēng)控業(yè)務(wù)中的應(yīng)用大體可以分為兩種方式,如下圖所示:

圖片

其中應(yīng)用方式一對圖譜的實時性要求不高,即便圖譜按T+1時效更新,也不影響這種的應(yīng)用方式,只是當天申請的團案客戶沒法防范。

應(yīng)用方式二可以說是知識圖譜的高階用法,防范團案欺詐及時性高,但要求圖譜要能做到實時更新和變量的實時計算和反饋。這就要求知識圖譜、決策引擎、關(guān)系數(shù)據(jù)庫三者之間能夠?qū)崟r互動,快速反饋,這對技術(shù)架構(gòu)的能力要求還是不低的,很多機構(gòu)對知識圖譜的應(yīng)用都難以達到這種程度。

2、知識圖譜回溯問題

想要將圖譜中計算出的團簇變量放入到貸前風(fēng)控模型中進行實時決策,就要先訓(xùn)練一個帶有圖譜變量的風(fēng)控模型,這就要求我們能夠?qū)D譜類變量進行回溯,即每個客戶的圖譜類變量應(yīng)該是根據(jù)其申請時點的圖譜狀態(tài)計算出來的,而不是根據(jù)當前圖譜狀態(tài)去計算,我們舉例來看:

圖片

比如3月15日,A客戶和B客戶通過手機號關(guān)聯(lián)起來,形成一個小團簇,而D客戶和E客戶通過設(shè)備關(guān)聯(lián)起來,形成另外一個團簇,兩個團簇之間并沒有任何關(guān)聯(lián)。此時,如果我們要計算客戶A在申請時刻所在團簇的客戶數(shù),我們只需要以客戶A為起點,執(zhí)行社區(qū)發(fā)現(xiàn)算法,找到所有與A關(guān)聯(lián)的客戶,再剔除這些關(guān)聯(lián)客戶中申請時間在A之后的客戶即可,這時候很容易計算出A在申請時刻所在團簇的客戶數(shù)為1(不含自身)。

但當?shù)搅?月16號,另外一個新申請客戶C的出現(xiàn)將之前兩個不相關(guān)的團簇聯(lián)系起來了,讓A、B、C、D、E客戶聚集成了一個大團簇。此時,我們再想要回溯客戶A在申請時刻所在團簇的客戶數(shù),那簡單應(yīng)用上述方法就有問題了:首先從A出發(fā)執(zhí)行社區(qū)發(fā)現(xiàn)算法找打所有關(guān)聯(lián)客戶B、C、D、E,再剔除申請時間在A之后的客戶C,得到變量值變?yōu)榱?。明顯這個方法得到的變量值3是錯誤的,因為在A申請時,他和客戶D、E之間還沒有聯(lián)系。所以想要精準回溯客戶A申請時刻的圖譜狀態(tài)及變量值,理論上需要從客戶A出發(fā),逐層掃描,掃描到申請時間在A之前客戶,才繼續(xù)向下一層掃描,掃描到申請時間在A之后的客戶則需要切斷該客戶往外延伸的所有支路,依此方法窮盡找到所有關(guān)聯(lián)節(jié)點,才能保證回溯的準確性,但這在技術(shù)實現(xiàn)上就要難一些。

另外一個難點是逾期狀態(tài)的回溯,假如我們想要計算客戶C申請時“所在團簇逾期30+人數(shù)占比”這樣的變量,就需要對客戶A、B、D、E在客戶C申請前一天的逾期狀態(tài)進行回滾,然后判斷是否逾期30+。當然,如果我們有每個用款客戶每日的逾期狀態(tài)切片數(shù)據(jù),那這個問題就可以解決,就是稍微麻煩些。

3、知識圖譜防范團伙欺詐的及時性問題

雖然說知識圖譜是防范團伙欺詐的一個利器,但也做不到將團伙欺詐消滅在搖籃里。比如假設(shè)我們分析找到一個非常有效的規(guī)則策略:團簇在5小時內(nèi)成長到4人以上,則欺詐的概率超過50%,即便我們在風(fēng)控中實時應(yīng)用了這條策略,也不能將欺詐團伙中的前3個來申請的人防控下來,因為前3個客戶來申請時還不足以觸發(fā)這條策略。所以,知識圖譜也具有普遍的局限性,需要和其它數(shù)字化風(fēng)控產(chǎn)品相配合,形成一個完整、良性的風(fēng)控閉環(huán),才能盡量將風(fēng)控反欺詐做到盡善盡美。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    主站蜘蛛池模板: 精品成人乱色一区二区| 性xxxx欧美老妇胖老太性多毛| 无码喷水一区二区浪潮av| 久久久久亚洲精品天堂| 国产无遮挡无码视频免费软件| 亚洲国产精品久久精品成人网站| 人人爽人人爽人人片av免费| 98国产精品综合一区二区三区| 日本动漫瀑乳h动漫啪啪免费| 久久97超碰色中文字幕总站| 2021国产精品午夜久久| 国产精品福利一区二区久久| 欧美亚洲人成网站在线观看| 国产真人性做爰久久网站| 超碰cao已满18进入离开官网| 国偷精品无码久久久久蜜桃软件| 国产曰批免费视频播放免费| 中文字幕日韩精品无码内射| 午夜欧美精品久久久久久久| 午夜热门精品一区二区三区| 日产精品99久久久久久| 又爆又大又粗又硬又黄的a片| 天天射寡妇射| 色8激情欧美成人久久综合电影| 欧美日韩久久久精品a片| 久久强奷乱码老熟女网站| 国产国产久热这里只有精品| 国产精品激情| 69sex久久精品国产麻豆| 天堂国产一区二区三区| 各处沟厕大尺度偷拍女厕嘘嘘| 首页 动漫 亚洲 欧美 日韩| 国产成人精品微拍视频网址| 狠狠色噜噜狠狠狠8888米奇| 中文字幕一区二区三区精华液| 日韩av无码免费播放| 国产精品尹人在线观看| 特级做a爰片毛片免费看| 四川丰满妇女毛片四川话| 无码乱码av天堂一区二区| 久久久国产99久久国产久|