返回介绍

15.5 大数据风控

发布于 2024-10-11 22:28:33 字数 3093 浏览 0 评论 0 收藏 0

15.5.1 基础知识

在大数据这个概念火热之前,传统信贷审批行业就有自己的一套风控系统,一般以人行数据和学信网数据、结合用户消费行为给用户综合授信,通过面审的方式对用户进行判断。随着互联网+的流行,各互联网金融公司将业务放到了网上,用户通过填写一定的申请信息来对用户进行贷款审批。效率的提高同时带来一个直观的问题—网络背后是优质的信贷客户还是欺诈客户?

很多企业建设风控系统主要目标就是反欺诈。反欺诈主要是针对两种欺诈行为,第一种为没有还款意愿或者还款能力的客户进行借贷的操作称为欺诈行为;第二种为有预谋、有组织的团体专门进行的诈骗行为。

除了贷款,还有很多场景需要风控系统介入,比如支付场景。以某宝的风控为例,每笔交易发生时,某宝风控大脑都会从账户、设备、位置、行为、关系、偏好这 6 个维度去判断是否是本人,按官方宣称安全大脑对一万个习惯特征进行识别,将风控发生率控制在百万分之一。

15.5.2 风控介绍

下面以一个风控系统为例,说明风控系统的架构、原理、运行机制等。Nebula 是国内安全公司威胁猎人团队开源的一款风控系统,重点解决恶意注册、账号被盗、内容欺诈三方面的业务安全问题,其系统架构如图 15-18 所示。

图 15-18 Nebula 风控系统架构图

从图 15-18 可以看出,Nebula 由业务层、运营管控层、数据输出层、数据计算层和数据源层组成。而其工作流如图 15-19 所示。

下面我们结合实际企业场景,对数据源层、数据计算层、数据输出层、运营管控层、业务层分别进行介绍。

图 15-19 Nebula 风控系统工作流程图

1.数据源层

大数据风控的基础在于数据,全面、高质量的数据可以帮助我们准确地进行风险控制。除了来自业务系统的日志外,还可以有更多的外部输入数据,比如以下几个方面:

·用户基本信息,除了我们所熟知的姓名、身份证、银行卡、手机号外,还有学历信息、收入情况,甚至包含当前设备、当前位置等。

·用户的征信数据,除了人行征信系统外,还有一些其他网贷平台上的逾期或黑名单信息,比如某网贷平台的黑名单数据,如图 15-20 所示。

·历史交易信息,包括历史交易额、历史交易笔数、历史行为等。

·运营商数据,比如入网时长、入网状态、每月消费情况、通话记录、短信情况等,通过运营商数据可以判断用户的设备是否有异常。

·用户行为数据,包括用户的搜索记录、购买记录、社交数据等,通过这些数据可以判断识别该用户是一个什么样的人、有多强的消费能力、社会关系如何,等等。

图 15-20 某网贷平台黑名单图

2.数据计算与数据输出层

数据计算层与数据输出层,对应到很多企业自建的风控系统里,就是规则层,通过风险规则引擎对数据源进行计算,得到相应的风险等级或分数。以贷款为例,这里的规则一般包括准入规则、反欺诈规则等。

准入规则可以理解为一些政策上的要求,比如 18 岁以下的人不能放贷,大学生不能放贷等;或者一些业务上的要求,例如偏远地区放了贷款,万一不还则催收成本高,因此建议不放贷款等。还有一些场景,比如系统在前期测试时只允许特定的人群参与等。

反欺诈规则的主要目的是,识别用户是否有骗贷风险,以及有多大的骗贷风险。规则制定的时候可以基于用户画像,目的在于通过打标签的方法识别不同的用户群体的风险程度。其标签可以按照用户还款行为、用户申请轨迹、用户基本信息等方面进行考虑。

3.运营管控层

这一层的功能主要服务于风控规则的快速迭代和系统的个性化配置,比如对规则内容的调整、规则的启停等进行管理。规则内容的调整可以理解为某个规则参数从 3 变成 5 这样的调整,规则的启停可以理解为发现某个规则异常后将其下线。

图 15-21 为 Nebula 风控系统的组件图。

通过这一层对风险情报进行展示,对风险决策进行配置,对决策效果进行回溯分析,以便业务层进行相关的动作。

图 15-21 Nebula 风控系统组件图

4.业务层

这一层就不需要过多介绍了,基本都涉及具体的业务场景,比如快捷支付、直付通、转账交易等。图 15-22 为某信用卡论坛上的某宝风控效果图。

图 15-22 某宝风控效果图

关于开源风控系统 Nebula 的更多内容,请访问:

https://github.com/threathunterX/nebula

15.5.3 企业落地

在金融机构中,由于历史或业务原因可能存在着很多风控系统,比如信用卡系统有信用卡的风控,网银系统有网银的风控等,这样会导致反欺诈风险防范措施分散,覆盖不全存在漏洞,基础数据也缺乏统一规则、建设不够全面。有的企业开始着手建立新一代的风控系统,同时对接外部专业风控厂商,图 15-23 为某行风控系统逻辑结构图。

在一些场景上需要针对性的风控,比如客户更换手机、手机位置与交易发起端位置对比、线上线下地址对比、最近交易记忆策略、常用收款方策略、手机操作习惯等,就不一一展开了。最终在用户端的体现就是各种互动方式,比如常用的密码、动态验证码、指纹验证、人脸自动识别、人脸人工识别、账户自动冻结等。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文