<風控必備>如何從零開始構建用戶畫像?

2019年12月06日08:45:19 科技 1530

消費金融風控聯盟知識星球資料匯總(更新中)-20191120

消費金融風控聯盟介紹&商務合作

學習資料免費領取深入解析風控8大場景中的應用

一、什麼是用戶畫像

用戶畫像,即數據信息標籤化,是通過收集與分析用戶的社會屬性、生活習慣、消費行為等主要信息數據,抽象出的標籤化的目標用戶模型。

用戶畫像是建立在對真實用戶深刻理解及高精準相關數據的概括之上的目標用戶模型,是真實用戶在抽象世界的虛擬任務形象。通常是根據用戶人口學特徵、網路瀏覽內容、網路社交活動和消費行為等信息而抽象出的一個標籤化的用戶模型。

二、用戶畫像包含什麼?

標籤是高度精鍊的用戶描述用戶屬性的特徵標識,如年齡、性別、地域、用戶偏好等,通過綜合用戶的所有標籤信息可勾勒出該用戶的立體「畫像」。現在通常的用戶畫像數據主要有:人口屬性,社會屬性,行為習慣等等。

舉個例子

1、人口屬性:包含年齡,性別,身高,地域,學歷,收入和教育
2、社會屬性:包括社會職務,婚姻狀況,住房車輛,社交關係等等
3、行為習慣:包括運動,休閑旅遊,酒店住宿,飲食起居等偏好

三、如何構建用戶畫像?

1、明確目的
不同信貸業務的目標群體是不同的,所以相應的用戶畫像也是不同的。因此首先需要明確用戶畫像的意義、建設目標和效果預期,進而有針對性的開展實施工作。

2、數據採集

根據用戶畫像構建目的,挖掘及搜集所需的用戶數據。

只有建立在客觀真實的數據基礎上,生成的畫像才有效。在採集數據時,需要考慮多種維度,比如行業數據、用戶屬性數據、用戶行為數據、用戶負債數據、用戶還款數據等等。

3、數據清洗

做過數據建模的同學應該都知道,採集挖掘來的原始數據可能存在非目標數據、無效數據及虛假數據,因而需要過濾原始數據。

4、數據建模(標籤化)

根據業務情況,將用戶的多種特徵組合到一起。標籤的選擇直接影響最終畫像的豐富度與準確度。在風險建模中,很多時候數據源是龐大的,我們需要用到大數據的分析手段,另外在建模構建用戶畫像的過程中,數據精準是非常重要的,壞樣本的定義和範圍是需要嚴格定義的,這對後期通過規則做查准查全率會有極大影響。所以用戶畫像的驗證階段需要對通過分析打上標籤的結果數據進行驗證,對於有事實依據的(真實壞樣本)和無事實依據的(疑似惡意樣本)需要有一整套完成的驗證機制。

5、生成畫像

到這一步我們需要開始構建用戶畫像,將一個唯一標誌性KEY(一般為用戶ID)作為「用戶」標識,來對其打上各類標籤。這邊列舉下風控領域的用戶畫像標籤:如是否曾經被盜、常用設備、常用地、消費偏好、所屬企業畫像、是否有危險夥伴往來、手機畫像、IP畫像、社工賬號等。在上述標籤中,不難發現像手機畫像,IP畫像可能並不是直接從數據收集中獲取,這類信息很多時候我們是通過另外的技術手段進行的收集工作,如手機是否為貓池號,是否為小號空號,如IP是否為VPN、代理、是否屬於爬蟲等。數據在模型中運行後,最終生成的畫像可以用下圖等可視化的形式展現。但是用戶畫像並非是一成不變的,因而模型需要具有一定靈活性,可根據用戶的動態行為修正與調整畫像。

備註:部分定義圖片來源於網路,如有侵權請私信管理

每周五晚八點免費線上公開課

2019-12-06 20:00-20:30 <風控講堂>風控模型優化與建議,報名請私信

公眾號:消費金融風控聯盟


&lt;風控必備&gt;如何從零開始構建用戶畫像? - 天天要聞

科技分類資訊推薦

雲深處科技完成近 5 億元新融資,加速具身智能產業化布局 - 天天要聞

雲深處科技完成近 5 億元新融資,加速具身智能產業化布局

IT之家 7 月 8 日消息,雲深處科技官方公眾號今日發文宣布,完成近 5 億元新融資。本輪融資由達晨財智、國新基金等聯合領投,北京機器人產業發展投資基金、前海母基金、央視融媒體基金、富浙基金、華映資本、物產中大投資等機構跟投,鈞山資本、方廣資本及愛施德智城基金等老股東繼續加持。▲ 圖源:雲深處科技官網據介紹,...
華為下半年新品陣容亮相:Mate XTs三摺疊與Mate 80系列領銜,鴻蒙6.0系統將至 - 天天要聞

華為下半年新品陣容亮相:Mate XTs三摺疊與Mate 80系列領銜,鴻蒙6.0系統將至

【TechWeb】隨著華為Pura 80系列的發布,消費者對華為下半年的旗艦產品充滿期待。知名博主「超維界」最新曝光了華為下半年的新品發布計劃,揭示了即將到來的產品陣容。據透露,華為將在9月份發布備受矚目的Mate XTs三摺疊手機,同時推出WATCH GT6系列智能手錶、FreeClip耳夾耳機二代、Free Buds 7i真無線耳機以及MatePad 1
全球媒體見證上合示範區7年蝶變 :「四個中心」 樹國際經貿合作新標杆 - 天天要聞

全球媒體見證上合示範區7年蝶變 :「四個中心」 樹國際經貿合作新標杆

海報新聞記者 沈童 青島報道歷時三天的「絲路相連 上合共贏」全球媒體山東行圓滿收官。多國媒體深入上合示範區「四個中心」建設一線,見證這個國家級開放平台如何以制度創新與科技賦能重塑國際經貿規則,其發展成果正是對國家戰略深入踐行的生動註腳。自2018年6月,宣布建設中國-上海合作組織地方經貿合作示範區這一國家級...
鴻蒙版微信讀書優化閱讀體驗 新版本適配更多排版樣式 - 天天要聞

鴻蒙版微信讀書優化閱讀體驗 新版本適配更多排版樣式

封面新聞記者 付文超當前,鴻蒙生態正加速邁入全新發展階段,越來越多應用參與到鴻蒙系統級創新體驗的聯合打造中。7月8日,記者獲悉,鴻蒙版微信讀書加快了更新步伐,最新版本新增了書城模塊、支持更多字體及閱讀器背景,並適配了更多排版樣式。目前該版本
有關TikTok的這些傳言,位元組跳動出面澄清了 - 天天要聞

有關TikTok的這些傳言,位元組跳動出面澄清了

據新華社7月8日報道,中國社交軟體TikTok母公司位元組跳動澄清,其「同意將TikTok美國業務出售給由甲骨文牽頭的美國財團」的信息不實。據環球網7日援引《紐約時報》等美媒報道,一方面,美國總統特朗普4日晚稱,美國「基本上已達成協議」,將由一家美企收購TikTok的美國業務;美方將於7日或8日開始與中方就可能的收購進行對話...
發布不到2個月,小米玄戒,已拿下安卓手機晶元0.6%的份額 - 天天要聞

發布不到2個月,小米玄戒,已拿下安卓手機晶元0.6%的份額

前段時間,小米發布了玄戒O1晶元,這也是中國大陸首款3nm的手機晶元。雖然這顆晶元被人黑的不要不要的,但說真的,它的表現還是相當不錯的,據大家的評測,他的性能是比高通驍龍8Gen3還要強的,只是沒有基帶晶元,需要外掛基帶才行。