您的位置:首頁»財經»正文

BAJ已經掌握了哪些頂尖的風控金鑰?

整理 | 近音 棘輪

2018年, 風控將成為金融行業的核心競爭力。

而行業的一大趨勢, 是融會貫通。

“產品、客群和風險是三位一體的關係。 ”在“風控·命門” 一本財經金融科技峰會上, 百度副總裁黃爽精准概括。

在資料和技術能力之外, 運營能力也將成為風控能力的一大指標。

面對一個更加廣闊的世界, 行業從業者應如何更新觀念, 自我反覆運算, 與時俱進?

黃爽:風控、產品、客群, 如何相互作用形成“鐵三角”

百度副總裁黃爽

01信貸群體販賣的是狹隘焦慮

過去一年左右的時間裡, 整個個人信貸行業是過山車似的發展態勢。

在這個過程中, 有很多言論聽起來挺是那麼回事的, 它們有個共同的特點, 就是“販賣焦慮”。

有人說:“現金貸的業務核心是流量, 最大的成本是獲客成本, 根本輪不到風控。 ”有人說:“只要把利率抬得足夠高, 不需要風控優勢, 照樣能夠盈利。 ”

出了一些監管的措施後, 另外一種言論出現了:“借款人群體已經被收割殆盡了, 所以可能剩下的開發空間也不足了。 ”也有人說:“絕大多數的客戶都在多頭貸, 連螞蟻和微利貸都被污染了。 ”最後的結果是沒有流量, 你會焦慮;利率不能高了, 你會焦慮;你是螞蟻, 你還得焦慮, 因為你會被污染。 現在不焦慮, 根本上不了頭條。

但我們說為什麼這些言論不足可信呢?

因為所有這些說法都脫離了產品、客群和風險的三角關係,

在就其中一件事情做文章。 有的時候, 這些言論是局部成立的——在某些相對初級的環境裡, 當監管力度不足、技術能力有限時, 你可能只能針對一小撮人, 去做一個利率特別高的產品。 這可以滿足一時之快, 但是在一個自律和他律的環境裡面, 這件事情就不容易做。

02客群、風險、產品三位一體

但如果你理解產品、客群和風險三位一體的關係, 消費金融這件事情還是大有可為的。

首先說宏觀。 美國的金融科技這麼牛, 為什麼仍有美國人覺得中國的金融科技比他們還要牛?因為中國市場有一點特質是美國市場不能比擬的, 也是金融科技最大的基礎:中國市場的消費增長態勢仍然非常強勁。

人民的生活水準在提高, 人民的收入在增加, 人民的人均消費額還有一個非常大的增長空間。

其次, 我們的信貸滲透率大概是23%左右, 日本的這個資料大概是60%左右, 從個人信貸滲透率來說, 仍然還有一個非常好的發展空間。

最後從參與主體來講, 除了銀行以外, 越來越多的非銀行機構加入到這個行業裡來, 在不同的人群中進行探索。 這也是一個非常大的增長空間。

03技術與三位一體的嫁接

大資料疊加AI能力, 是挖潛市場的前提。

中國有得天獨厚的條件:智慧化生活, 不僅僅把大資料沉澱下來了, 還把大資料沉澱在設備上了, 所以有條件把設備和人串起來, 把資訊和人串起來, 把資訊和設備串起來, 這給人工智慧提供了基礎。

人工智慧是什麼?是演算法+算力+產品化能力。

在人工智慧的基礎上, 科技公司加入這個行列, 能夠把人工智慧的東西工程化、產品化, 讓更多人可以去利用, 讓更多供給方能夠參與到這個行業裡來。

有了資料、演算法和算力, 對客群的理解就會比較立體。 客群不僅僅是這個人有多少風險分、違約概率大概是多少, 而是有什麼東西會影響到這些因素。

一個真實的需求, 它本身蘊含的風險遠遠低於一個虛假的需求。 如下圖這個回應模型, 是對一個人的需求進行畫像。

如果把信用分580-620的客戶分成五等分, 它的缺錢程度在最上面的20%, 裡面是最下面20%的90倍, 也就是說, 很多時候, 我們其實是不理解我們是需要對上面的這20%或者最上面的40%-60%,

去供給一個產品的。

說他需要錢就意味著他風險高?也不是。 一個真實的需求是救急不救窮的。 所以在我們高響應人群的風險分佈裡面, 低風險的人群也是能夠占到一半以上。

04解構風險、產品和客群的關係

百度交易資料不是特別多, 但是相對比較即時和多維, 從風險角度看, 它有幾個特徵。

1.沒有央行征信的人, 百度數據是可以獨立進行區分的, 違約概率也能夠進行有效的降低。

2.一旦這個資料和央行征信組合在一起的時候, 可以跟更大的人群進行疊加, 進一步提高違約的捕捉率。

3.在上述論述之上可以指導差異化定價, 能夠讓客群的利率得到的更準確。

風險在實際中最好的應用是反欺詐。 講個實際例子, 反欺詐日益擴展到線上線下,是一個巨大的高科技產業。

如果有個線下的學校,它有很多的申請。正常的學校學員之間是沒有關係的。一個正常的申請管道,人和人之間的關聯度分佈是非常均勻的。我們把這個叫做健康的學校。

但一個有騙貸發生的學校,人和人之間的關聯度就會發生質變,很多人之間的關聯都會變得非常明顯,所以把這個叫做“癌症細胞”。當你把這些騙貸機構和以前歷史上的騙貸機構都疊加起來的時候,這個癌細胞就長得非常快、非常大。如果這是一個可以即時停止和機構進行業務的交互,也能夠非常有效地防範線上和線下的風險。

最後說產品。

對每一種人都能用合理的定價提供一個合理的產品,這個產品的形態至少應該包括利率、額度、產品形態、典型使用者、交互管道甚至於溝通方式,這些在今天都可以用模型的反覆運算實現最大程度的多樣化。

如果我們把兩兩的關係進行一個論述,我認為客群和產品決定風險的平均值。

如果是你做的打引號的“現金貸”的客群,不管你怎麼做,你給他的只能是非常小的小額產品。你的風險平均值可能就只是20%,這是你的客群和產品決定的,但是這不是唯一可以做的客群,我們想要做的客群應該是多種多樣、最普惠的客群。針對同樣的客群,如果你對客群的認知更好、風險管理水準更高,你的產品就會比較有競爭力。

其實即使是現金貸和現金貸比,產品的經歷也是不一樣的。也有做現金貸的機構將來會蛻變,走出更有競爭力的一條全新的道路。

最終是風險和產品決定你的客群邊界。

有些客群今天做不了,但是當你的風險管理水準提升的時候,當你有更多元化的產品接觸到他、打動他的時候,你的客群邊界就自然而然地擴大了。

最終其實這些都不是兩兩關係,最終都是三位一體的關係。

餘泉:大資料風控不是黑盒子,與傳統風控有一樣的嚴謹性和體系性

螞蟻金服微貸風險管理部總經理余泉

01服務線下商戶

線下商戶是什麼?大家可能都比較熟悉:去吃飯、美容遇到的經營線下實體店的商戶。他們就像整個商業血管最末端的細胞。服務好他們,實際上就是服務好整個實體經濟裡以前沒有被服務好的客群。

這些線下商戶很難得到金融服務,就算得到金融服務,要麼需要抵押,要麼需要收很高的利率。實際上,螞蟻金服從去年開始,就配合支付寶做線下商戶收錢碼的活動,探索怎樣能用更方便、更普惠的方式服務這個客群。

我們設計了一個隨時可以申請、隨時可以使用的多收多貸產品,額度越用越高。有些商戶甚至可以獲取用花唄收款的資格。

我們專門針對商戶設計了一款產品“餘利寶”,即收取的零錢隨時存入一個隨進隨取的帳戶,幫商戶賺取更多利息。

而從消費者角度,用戶可以選擇支付寶和花唄等多種支付方式付款。

說到多收多貸,舉一個具體實例。一個杭州商戶,是30歲左右的年輕人,開了一個外賣店,五六個雇員都是父母、親戚。在決定賣什麼的時候,他經常去查看美團和大眾點評上熱搜的是什麼,然後根據熱搜調整產品。他的業務做得特別好,於是就需要擴張。

就在這時,螞蟻金服模型資料發現了他,給他推送了產品。他順勢就用我們的五六萬貸款買了一些廚房設備和冰箱。第二個月,他的業務就擴大了很多倍,也還清了貸款。

這些線下小店的現金流是類似的。一旦遇到擴張,比如開門店、買設備的時候,沒有足夠現金,是非常需要貸款服務雪中送炭的。

02大資料風控不是黑匣子

回到風控上來,談一談螞蟻金服是如何服務這些線下商戶的。

我們尊崇惠普,要給他們更好更及時的產品、更低的利率。具體到風險管理環節,就是要降低風險成本。把風險成本控得非常低,才能給客戶提供最低的利率、最優質的貸款服務。

從大模式上講,我們主要從幾個角度來識別商戶:他是不是經營者?他是做哪個行業的?他的經營能力在哪個等級 ?通過這些資訊來全面瞭解商戶。

此外,一方面,我們要做大資料風控;另一方面,我們也要做一些線下反欺詐的事情。網上不乏對大數據風控的誤解。大資料風控經常舉的一個例子是,如果某人半夜2點借錢,那麼他一定是壞人。也就是說,在一些人的邏輯中,使用者在頁面上怎樣了,他就是什麼樣的人。大家覺得大資料風控就是一個黑盒子。

但我覺得,最核心的大資料風控,跟傳統風控其實有一點非常一致的地方:做風險管理的框架設計,是需要一模一樣的嚴謹性和體系性的。它做傳統風控沒有任何區別。

評價一個人,不管是商戶還是個人,一定要進行全面的評價:他的負債是多少?他的負債表現是什麼形式?他的收入是多少?收入能表現什麼形式?在設計任何風險管理體系的時候,一定要從這兒出發。如果沒有這個體系性,只是碎片化地用一些資料做風控,風險是非常大的。

說點具體的例子。一些小商戶之所以沒有被服務,是因為他們沒有在任何正式的商業名錄、工商企業名單之中,有些人甚至從來沒有銀行流水、未必是個真正的註冊商戶。在這種情況下首先要做的,就是怎麼識別他是一個經營者,而非一個個人。

我們使用支付寶獲取他們的現金流交易資料,看到的是幾千萬、幾億現金之間的交互。我們的任務,是從資金交互網路裡判斷誰是經營者、誰是個體。

個體的支付寶的關係網長得像毛線團,沒有集中給某個人打錢的動作,而是你轉給我、我轉給你這麼一個比較均勻的網路。商戶關係網絡看起來是有個中心點的,這個圖長得像蒲公英,有很多個點是陌生人向一個人轉帳的。通過各種演算法和調優,我們最後用這種方式識別誰是個體、誰是個人經營者。

03建立行業詞庫

形象的比喻可能讓大家感覺這是很簡單的事,但行業內的人都知道,客群分析並沒有那麼簡單。

第一,大家想一下,如果是幾千萬人之間每天有資金交易的話,是需要很大的存儲能力和計算能力來做這個事情的。

第二,找到這些節點沒有那麼容易。因為商戶用支付寶也不光是收款,他也會跟親朋好友轉一下錢,要判斷是私人轉帳還是收益,在各種考慮之後多方疊加,最後才能比較確定誰是商戶。

判斷誰是商戶,還帶給我們另外一個啟發。如果有些模型被用在其他場合的次數比較多,這些模型在風控場合也是可以借鑒的。通過剛才的方式,我們想,商戶有沒有可能通過資金流的方式判斷經營者?不是所有人都用支付寶支付的,他們支付寶上的現金流不明顯,那怎樣找到跟這個商戶行為類似的商戶?

對此,我們借鑒了搜索行業推薦行業常見的M2M演算法。大家知道,在淘寶上買商品,經常被推薦一些“你可能喜歡這個”。它背後的演算法是判斷你跟其他消費者的相似程度,推薦相似程度的產品。我們用類似的辦法也進行了買家分群,利用已有的經營者的種子,發現跟他行為比較相似的人,來拓展商戶的積累。

第三,還有一個行業判斷,沒有國家發佈的關於行業的判斷,但是從風險管理、客群上,仍需要打一下標:到底是餐飲行業,還是別的什麼行業。這根據現有的碎片化資料並不是特別好完成,因為商戶的填寫資訊標準不一。

舉個例子,有些人說我是做麻辣燙的,有些人說是家常菜,有些人說是小吃,有些是烤肉,這就需要去判斷他到底是不是在做餐飲,是哪個行當的。我們就要通過這些詞去連結他的行業。

通過去年幾個月的積累,我們建立了一個行業詞庫,裡面大概有220多個行業、幾千個關鍵字。所有新商戶填的資訊,在最後標準的時候,我們都會映射到詞庫裡,判斷他的行業,對行業進行分類。

這個頁面是反映多收多貸客戶得到了什麼。作為經營者,你使用支付寶收款,因為我們對你的瞭解更多,你可以貸的款就更多。商戶每天都會算算自己這一天賺了多少錢,他需要一些微小及時的鼓勵,所以在提額的設計上,如果他滿足要求的話,我們每10天就會給他提一次額,相當於給他獎勵。

我特別同意黃爽的觀點,我想的跟她說的客群、風險、產品的“鐵三角”關係很像。這個東西如果轉起來,會產生特別不一樣的化學反應。一旦你的產品打出品牌,有更多人用,那你風險管理的效果是不一樣的。

中國小微企業貸款粗估是在7千萬到1億這個量級,這個藍海非常浩瀚。我們想做的不是自己去自營,而是希望通過我們的能力,通過平臺化的方式,跟體系外的銀行和其他金融企業合作,一起來服務小微企業。

春:金融核心是控,控核心是資料能力

京東金融風險管理部總經理沈曉春

01風控能力的三個方向:資料、技術、運營

做金融的人都知道,風控是金融的核心,也是能量的來源。

風控幫助我們更好地長足發展。對風控的重視程度、投入的資源多寡,也體現了一個企業是否有決心把業務做長遠,做到真正良性發展。

而風控能力的三個方向,則是資料能力、技術能力(AI能力)與運營能力。

首先,資料能力是做風控的真正核心基礎,這是毋庸置疑的。京東金融在服務合作夥伴與個人使用者的過程中,積累了大量資料。每天新增的資料量,超過200TB。這些資料可以在風控層面上,做各種模型、策略、定制化的場景等。

在技術能力上,演算法的最終能力取決於底層的算力,也取決於這些算力資源如何實現優化。例如,在最底層的基礎層,如何做資料的標注,可以讓資料的計算高效地支撐中間的演算法層?如何通過一些分散式機器學習的方式、資源的調配,來更好地利用所有的算力?

在中間的演算法層,圖像、語音辨識的演算法,如何整合基礎層上的資料?如何把資料量化到技術模組當中?如何讓資料最終在真正的產品層,實現欺詐檢測、智慧投顧、客服運營?這些都是底層技術在具體場景中的實際落地。

最後,是運營能力。資料、技術在風控過程中的重要性,大家都很容易理解,但今天,我為什麼還要強調運營能力呢?

運營來自於多樣的場景、多樣的產品和多樣客群的交織。在這樣的過程中,運營能力實際上驅動了產品和實際場景的複雜度,從而給風控提出了更高的要求、更多的挑戰。

在問題的解決過程中,運營能力與風控能力互相驅動。運營能力不斷地深化,可以迫使風控能力在一個特殊場景、在一個特殊客群上能夠更好地理解客戶,從多維、動態的角度瞭解客戶的需求,瞭解客戶的風險點,從而在這個過程中,把產品推向體驗的極致,最終達到使用者體驗與系統風控的平衡。

02科技讓風控更安全

風控有幾大方面,無論是運營對風控的推動,還是資料對風控的支撐,技術都是非常重要的部分。

以線上環境為例。線上環境對於帳戶的安全體系要求極高,技術如何在保證用戶體驗的前提下,幫助風控實現真正安全的帳戶體系?

使用者在登錄帳號時,風控系統會把帳戶登陸的安全場景分為兩層。一層是純技術的,包括設備的識別、人機識別、生物識別的特徵,都有相應的技術模組,生成標籤、預警。

這些資訊會傳遞到第二層:日常登陸模型和帳戶安全模型。第二層模型會對資訊進行處理,識別是否是用戶本人在使用帳戶,是否有可疑行為發生。這樣可以在不打擾使用者情況下,保護使用者資訊、資產安全。

上圖我們在反欺詐過程中用到的一個演算法:通過路徑學習的方式,識別整個登陸過程、客戶交易過程中可能出現的風險點。

我們經常說“道不同不相為謀”,這更多是從他的行為特徵來看。簡單舉例,如何在一個行銷活動中,確定客戶是本人登陸帳戶呢?

前端有帳戶登陸的模型,會排除一些可能性。在這個過程中,一個正常客戶的路徑,會看到領優惠券,流覽一些不同優惠券覆蓋的優惠商品,並在這個過程中進行比價、放購物車,然後再進行支付。

這是常規的路徑。我們可以挑選一個反例:客戶幾次修改密碼,直接查看餘額,嘗試轉帳,最後把易變現品放入購物車。這樣的行為存在很多疑點,這些疑點在整個路徑學習過程中,可以通過時間回溯與既往歷史比較,判定是否存在安全問題。在整個欺詐、反欺詐的領域中,這一演算法也應用得非常廣泛。

設備群體挖掘技術,基於圖形演算法開發,被譽為風控體系防火牆,是目前比較常見的模型演算法之一。黑產的隱蔽性非常高,我們利用已經發現的問題,就可以借此進行排查。

這是一種關聯性的演算法,也是一個節點,可以判斷出一度關聯、二度關聯到三度關聯中,每個節點關聯到有問題客群或仲介的概率是多少。這一演算法可以排查集散點與可疑點。

對帳戶登錄的各個環節,進行交易反欺詐、信貸申請反欺詐、反洗錢與行銷風控排查,是非常重要的。風控體系防火牆的應用十分廣泛,也解決了很多問題。

03技術推動新監管

技術可以推動業務的發展,也可以幫助我們更好地配合監管。反洗錢就是一個典型的例子,反洗錢包括對所有商戶的KYB、普通商戶的KYC,之後到交易、到監控、到資訊審核的閉環。

實際的反洗錢體系,也基於強大的計算平臺,每筆資金交易都會接入反洗錢體系,通過歷史交易、靜態資訊、對手交易評級等特徵值進行判斷,是否出現涉及反洗錢等可疑行為,並上報監管。

包括黑名單挖掘技術在內的整個體系,也會在實際應用場景中進行落地,並實現90%以上環節的自動化監控和排查。

在京東金融自有業務上,京東金融與銀聯推出了風險資訊共用機制,在區塊鏈技術的加持下,可以實現更加完善安全的風險共用體系。在這個體系中,所有成員都有准入標準,獲准進入的成員可以將資訊記錄在區塊鏈中,共同維護資料安全。

風控講究的是全流程、全方位、多維度的判斷和防控。我們自營業務本身就有這樣的需求,用戶的註冊、登陸、參加行銷活動、支付訂單、理財等行為,其實都在風控系統的保護範圍內。

反欺詐日益擴展到線上線下,是一個巨大的高科技產業。

如果有個線下的學校,它有很多的申請。正常的學校學員之間是沒有關係的。一個正常的申請管道,人和人之間的關聯度分佈是非常均勻的。我們把這個叫做健康的學校。

但一個有騙貸發生的學校,人和人之間的關聯度就會發生質變,很多人之間的關聯都會變得非常明顯,所以把這個叫做“癌症細胞”。當你把這些騙貸機構和以前歷史上的騙貸機構都疊加起來的時候,這個癌細胞就長得非常快、非常大。如果這是一個可以即時停止和機構進行業務的交互,也能夠非常有效地防範線上和線下的風險。

最後說產品。

對每一種人都能用合理的定價提供一個合理的產品,這個產品的形態至少應該包括利率、額度、產品形態、典型使用者、交互管道甚至於溝通方式,這些在今天都可以用模型的反覆運算實現最大程度的多樣化。

如果我們把兩兩的關係進行一個論述,我認為客群和產品決定風險的平均值。

如果是你做的打引號的“現金貸”的客群,不管你怎麼做,你給他的只能是非常小的小額產品。你的風險平均值可能就只是20%,這是你的客群和產品決定的,但是這不是唯一可以做的客群,我們想要做的客群應該是多種多樣、最普惠的客群。針對同樣的客群,如果你對客群的認知更好、風險管理水準更高,你的產品就會比較有競爭力。

其實即使是現金貸和現金貸比,產品的經歷也是不一樣的。也有做現金貸的機構將來會蛻變,走出更有競爭力的一條全新的道路。

最終是風險和產品決定你的客群邊界。

有些客群今天做不了,但是當你的風險管理水準提升的時候,當你有更多元化的產品接觸到他、打動他的時候,你的客群邊界就自然而然地擴大了。

最終其實這些都不是兩兩關係,最終都是三位一體的關係。

餘泉:大資料風控不是黑盒子,與傳統風控有一樣的嚴謹性和體系性

螞蟻金服微貸風險管理部總經理余泉

01服務線下商戶

線下商戶是什麼?大家可能都比較熟悉:去吃飯、美容遇到的經營線下實體店的商戶。他們就像整個商業血管最末端的細胞。服務好他們,實際上就是服務好整個實體經濟裡以前沒有被服務好的客群。

這些線下商戶很難得到金融服務,就算得到金融服務,要麼需要抵押,要麼需要收很高的利率。實際上,螞蟻金服從去年開始,就配合支付寶做線下商戶收錢碼的活動,探索怎樣能用更方便、更普惠的方式服務這個客群。

我們設計了一個隨時可以申請、隨時可以使用的多收多貸產品,額度越用越高。有些商戶甚至可以獲取用花唄收款的資格。

我們專門針對商戶設計了一款產品“餘利寶”,即收取的零錢隨時存入一個隨進隨取的帳戶,幫商戶賺取更多利息。

而從消費者角度,用戶可以選擇支付寶和花唄等多種支付方式付款。

說到多收多貸,舉一個具體實例。一個杭州商戶,是30歲左右的年輕人,開了一個外賣店,五六個雇員都是父母、親戚。在決定賣什麼的時候,他經常去查看美團和大眾點評上熱搜的是什麼,然後根據熱搜調整產品。他的業務做得特別好,於是就需要擴張。

就在這時,螞蟻金服模型資料發現了他,給他推送了產品。他順勢就用我們的五六萬貸款買了一些廚房設備和冰箱。第二個月,他的業務就擴大了很多倍,也還清了貸款。

這些線下小店的現金流是類似的。一旦遇到擴張,比如開門店、買設備的時候,沒有足夠現金,是非常需要貸款服務雪中送炭的。

02大資料風控不是黑匣子

回到風控上來,談一談螞蟻金服是如何服務這些線下商戶的。

我們尊崇惠普,要給他們更好更及時的產品、更低的利率。具體到風險管理環節,就是要降低風險成本。把風險成本控得非常低,才能給客戶提供最低的利率、最優質的貸款服務。

從大模式上講,我們主要從幾個角度來識別商戶:他是不是經營者?他是做哪個行業的?他的經營能力在哪個等級 ?通過這些資訊來全面瞭解商戶。

此外,一方面,我們要做大資料風控;另一方面,我們也要做一些線下反欺詐的事情。網上不乏對大數據風控的誤解。大資料風控經常舉的一個例子是,如果某人半夜2點借錢,那麼他一定是壞人。也就是說,在一些人的邏輯中,使用者在頁面上怎樣了,他就是什麼樣的人。大家覺得大資料風控就是一個黑盒子。

但我覺得,最核心的大資料風控,跟傳統風控其實有一點非常一致的地方:做風險管理的框架設計,是需要一模一樣的嚴謹性和體系性的。它做傳統風控沒有任何區別。

評價一個人,不管是商戶還是個人,一定要進行全面的評價:他的負債是多少?他的負債表現是什麼形式?他的收入是多少?收入能表現什麼形式?在設計任何風險管理體系的時候,一定要從這兒出發。如果沒有這個體系性,只是碎片化地用一些資料做風控,風險是非常大的。

說點具體的例子。一些小商戶之所以沒有被服務,是因為他們沒有在任何正式的商業名錄、工商企業名單之中,有些人甚至從來沒有銀行流水、未必是個真正的註冊商戶。在這種情況下首先要做的,就是怎麼識別他是一個經營者,而非一個個人。

我們使用支付寶獲取他們的現金流交易資料,看到的是幾千萬、幾億現金之間的交互。我們的任務,是從資金交互網路裡判斷誰是經營者、誰是個體。

個體的支付寶的關係網長得像毛線團,沒有集中給某個人打錢的動作,而是你轉給我、我轉給你這麼一個比較均勻的網路。商戶關係網絡看起來是有個中心點的,這個圖長得像蒲公英,有很多個點是陌生人向一個人轉帳的。通過各種演算法和調優,我們最後用這種方式識別誰是個體、誰是個人經營者。

03建立行業詞庫

形象的比喻可能讓大家感覺這是很簡單的事,但行業內的人都知道,客群分析並沒有那麼簡單。

第一,大家想一下,如果是幾千萬人之間每天有資金交易的話,是需要很大的存儲能力和計算能力來做這個事情的。

第二,找到這些節點沒有那麼容易。因為商戶用支付寶也不光是收款,他也會跟親朋好友轉一下錢,要判斷是私人轉帳還是收益,在各種考慮之後多方疊加,最後才能比較確定誰是商戶。

判斷誰是商戶,還帶給我們另外一個啟發。如果有些模型被用在其他場合的次數比較多,這些模型在風控場合也是可以借鑒的。通過剛才的方式,我們想,商戶有沒有可能通過資金流的方式判斷經營者?不是所有人都用支付寶支付的,他們支付寶上的現金流不明顯,那怎樣找到跟這個商戶行為類似的商戶?

對此,我們借鑒了搜索行業推薦行業常見的M2M演算法。大家知道,在淘寶上買商品,經常被推薦一些“你可能喜歡這個”。它背後的演算法是判斷你跟其他消費者的相似程度,推薦相似程度的產品。我們用類似的辦法也進行了買家分群,利用已有的經營者的種子,發現跟他行為比較相似的人,來拓展商戶的積累。

第三,還有一個行業判斷,沒有國家發佈的關於行業的判斷,但是從風險管理、客群上,仍需要打一下標:到底是餐飲行業,還是別的什麼行業。這根據現有的碎片化資料並不是特別好完成,因為商戶的填寫資訊標準不一。

舉個例子,有些人說我是做麻辣燙的,有些人說是家常菜,有些人說是小吃,有些是烤肉,這就需要去判斷他到底是不是在做餐飲,是哪個行當的。我們就要通過這些詞去連結他的行業。

通過去年幾個月的積累,我們建立了一個行業詞庫,裡面大概有220多個行業、幾千個關鍵字。所有新商戶填的資訊,在最後標準的時候,我們都會映射到詞庫裡,判斷他的行業,對行業進行分類。

這個頁面是反映多收多貸客戶得到了什麼。作為經營者,你使用支付寶收款,因為我們對你的瞭解更多,你可以貸的款就更多。商戶每天都會算算自己這一天賺了多少錢,他需要一些微小及時的鼓勵,所以在提額的設計上,如果他滿足要求的話,我們每10天就會給他提一次額,相當於給他獎勵。

我特別同意黃爽的觀點,我想的跟她說的客群、風險、產品的“鐵三角”關係很像。這個東西如果轉起來,會產生特別不一樣的化學反應。一旦你的產品打出品牌,有更多人用,那你風險管理的效果是不一樣的。

中國小微企業貸款粗估是在7千萬到1億這個量級,這個藍海非常浩瀚。我們想做的不是自己去自營,而是希望通過我們的能力,通過平臺化的方式,跟體系外的銀行和其他金融企業合作,一起來服務小微企業。

春:金融核心是控,控核心是資料能力

京東金融風險管理部總經理沈曉春

01風控能力的三個方向:資料、技術、運營

做金融的人都知道,風控是金融的核心,也是能量的來源。

風控幫助我們更好地長足發展。對風控的重視程度、投入的資源多寡,也體現了一個企業是否有決心把業務做長遠,做到真正良性發展。

而風控能力的三個方向,則是資料能力、技術能力(AI能力)與運營能力。

首先,資料能力是做風控的真正核心基礎,這是毋庸置疑的。京東金融在服務合作夥伴與個人使用者的過程中,積累了大量資料。每天新增的資料量,超過200TB。這些資料可以在風控層面上,做各種模型、策略、定制化的場景等。

在技術能力上,演算法的最終能力取決於底層的算力,也取決於這些算力資源如何實現優化。例如,在最底層的基礎層,如何做資料的標注,可以讓資料的計算高效地支撐中間的演算法層?如何通過一些分散式機器學習的方式、資源的調配,來更好地利用所有的算力?

在中間的演算法層,圖像、語音辨識的演算法,如何整合基礎層上的資料?如何把資料量化到技術模組當中?如何讓資料最終在真正的產品層,實現欺詐檢測、智慧投顧、客服運營?這些都是底層技術在具體場景中的實際落地。

最後,是運營能力。資料、技術在風控過程中的重要性,大家都很容易理解,但今天,我為什麼還要強調運營能力呢?

運營來自於多樣的場景、多樣的產品和多樣客群的交織。在這樣的過程中,運營能力實際上驅動了產品和實際場景的複雜度,從而給風控提出了更高的要求、更多的挑戰。

在問題的解決過程中,運營能力與風控能力互相驅動。運營能力不斷地深化,可以迫使風控能力在一個特殊場景、在一個特殊客群上能夠更好地理解客戶,從多維、動態的角度瞭解客戶的需求,瞭解客戶的風險點,從而在這個過程中,把產品推向體驗的極致,最終達到使用者體驗與系統風控的平衡。

02科技讓風控更安全

風控有幾大方面,無論是運營對風控的推動,還是資料對風控的支撐,技術都是非常重要的部分。

以線上環境為例。線上環境對於帳戶的安全體系要求極高,技術如何在保證用戶體驗的前提下,幫助風控實現真正安全的帳戶體系?

使用者在登錄帳號時,風控系統會把帳戶登陸的安全場景分為兩層。一層是純技術的,包括設備的識別、人機識別、生物識別的特徵,都有相應的技術模組,生成標籤、預警。

這些資訊會傳遞到第二層:日常登陸模型和帳戶安全模型。第二層模型會對資訊進行處理,識別是否是用戶本人在使用帳戶,是否有可疑行為發生。這樣可以在不打擾使用者情況下,保護使用者資訊、資產安全。

上圖我們在反欺詐過程中用到的一個演算法:通過路徑學習的方式,識別整個登陸過程、客戶交易過程中可能出現的風險點。

我們經常說“道不同不相為謀”,這更多是從他的行為特徵來看。簡單舉例,如何在一個行銷活動中,確定客戶是本人登陸帳戶呢?

前端有帳戶登陸的模型,會排除一些可能性。在這個過程中,一個正常客戶的路徑,會看到領優惠券,流覽一些不同優惠券覆蓋的優惠商品,並在這個過程中進行比價、放購物車,然後再進行支付。

這是常規的路徑。我們可以挑選一個反例:客戶幾次修改密碼,直接查看餘額,嘗試轉帳,最後把易變現品放入購物車。這樣的行為存在很多疑點,這些疑點在整個路徑學習過程中,可以通過時間回溯與既往歷史比較,判定是否存在安全問題。在整個欺詐、反欺詐的領域中,這一演算法也應用得非常廣泛。

設備群體挖掘技術,基於圖形演算法開發,被譽為風控體系防火牆,是目前比較常見的模型演算法之一。黑產的隱蔽性非常高,我們利用已經發現的問題,就可以借此進行排查。

這是一種關聯性的演算法,也是一個節點,可以判斷出一度關聯、二度關聯到三度關聯中,每個節點關聯到有問題客群或仲介的概率是多少。這一演算法可以排查集散點與可疑點。

對帳戶登錄的各個環節,進行交易反欺詐、信貸申請反欺詐、反洗錢與行銷風控排查,是非常重要的。風控體系防火牆的應用十分廣泛,也解決了很多問題。

03技術推動新監管

技術可以推動業務的發展,也可以幫助我們更好地配合監管。反洗錢就是一個典型的例子,反洗錢包括對所有商戶的KYB、普通商戶的KYC,之後到交易、到監控、到資訊審核的閉環。

實際的反洗錢體系,也基於強大的計算平臺,每筆資金交易都會接入反洗錢體系,通過歷史交易、靜態資訊、對手交易評級等特徵值進行判斷,是否出現涉及反洗錢等可疑行為,並上報監管。

包括黑名單挖掘技術在內的整個體系,也會在實際應用場景中進行落地,並實現90%以上環節的自動化監控和排查。

在京東金融自有業務上,京東金融與銀聯推出了風險資訊共用機制,在區塊鏈技術的加持下,可以實現更加完善安全的風險共用體系。在這個體系中,所有成員都有准入標準,獲准進入的成員可以將資訊記錄在區塊鏈中,共同維護資料安全。

風控講究的是全流程、全方位、多維度的判斷和防控。我們自營業務本身就有這樣的需求,用戶的註冊、登陸、參加行銷活動、支付訂單、理財等行為,其實都在風控系統的保護範圍內。

Next Article
喜欢就按个赞吧!!!
点击关闭提示