大数据风控竞争格局分析.docx

上传人:b****8 文档编号:9958754 上传时间:2023-02-07 格式:DOCX 页数:21 大小:638.10KB
下载 相关 举报
大数据风控竞争格局分析.docx_第1页
第1页 / 共21页
大数据风控竞争格局分析.docx_第2页
第2页 / 共21页
大数据风控竞争格局分析.docx_第3页
第3页 / 共21页
大数据风控竞争格局分析.docx_第4页
第4页 / 共21页
大数据风控竞争格局分析.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

大数据风控竞争格局分析.docx

《大数据风控竞争格局分析.docx》由会员分享,可在线阅读,更多相关《大数据风控竞争格局分析.docx(21页珍藏版)》请在冰豆网上搜索。

大数据风控竞争格局分析.docx

大数据风控竞争格局分析

BAT、网易、京东等如何做大数据风控的?

大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷、消费金融的创业公司,都在通过大数据风控技术来控制贷款规模扩张中的风险。

大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷、消费金融的创业公司,都在通过大数据风控技术来控制贷款规模扩张中的风险。

现在提到互联网金融、Fintech,首先想到的就是大数据风控。

随着网易北斗大数据风控平台的上线,业内包括BAT、网易在内的主要国内互联网巨头都开始在大数据和金融衍生应用领域进入了金融科技化阶段,和互联网金融第一阶段相比,目前产生了以大数据金融、风控、智能投顾、个性化产品等为代表的新阶段,伴随着监管的深入和全国性互联网金融政治风暴的规范化推进,1.0时代的互联网渠道和通道金融将逐步被融合了大数据、人工智能和机器深度学习的金融科技所替代。

大家都在做,对行业格局有什么影响,未来的市场格局会是什么样子?

模型、资金、场景,互联网与金融机构各取所需

在大数据风控领域,核心的三个要素是风控模型、场景和资金。

传统商业银行往往拥有低成本资金优势,在线下场景也具有长期客户积累,但是在线上大数据和数以千、万计的风控因子方面却稍显吃力;而BAT、网易在内的互联网IT巨头,则在海量的数据、金融云、线上场景和用户精准分析方面优势领先,但是需要一定的资金对接和金融牌照服务资质。

于是乎,在目前金融监管收紧,而双方都有迫切需求的情况下,通过互联网IT巨头的技术、数据、模型对接线下传统金融的资金,成为了一个标准化的产业链合作模式。

近期互金公司在大数据风控领域布局愈加频繁

进入12月份不到半个月,大数据风控领域不断有新动作:

12月6日,360金融借助大数据征信和风控,推出消费金融产品360借条,推出闪电放款随借随还机制。

12月8日,网易金融发布了网易北斗智能风控系统,基于网易的数据积累和外部数据,通过网易的建模及计算能力,以及神经网络/机器学习/支持向量机等技术能力,形成大数据风控体系,构建“新赋能”金融科技商业模式,开放数据与技术能力,与商业伙伴共建信用生态。

12月13日,宜信旗下的致诚信用正式发布“致诚阿福共享平台”,推出阿福数据共享、致诚通用评分、阿福反欺诈决策引擎、授权数据抓取、阿福信用速查等产品和服务,向行业输出数据产品及金融科技服务,为商业伙伴提供大数据风控能力。

此外,一直以做大额融资标的著称的红岭创投面临转型压力,其董事长周世平最近也表示,随着网贷监管办法的出台,限额让网贷的生存空间受限制,今后将重点关注智能投顾,金融IT等金融科技,金融大数据解决方案等。

由此可见,现在互金行业一个重要的趋势是,有向普惠金融、小额信贷服务转型需要的公司,与拥有数据资源的公司,都在努力向大数据风控领域布局。

对于前者而言,大数据风控是做小额融资标的的必备工具;对于后者而言,大数据风控可以提供将数据和技术进行变现的途径。

另外,可以看到,大数据风控系统的开放也已经成为趋势。

大公司与互金创业企业都在做大数据风控,但商业策略有所不同以上大数据领域的新动作是互金公司发力大数据风控的缩影。

近年以来,互金公司对大数据风控的布局热情满满,从大公司到创业企业,都在大数据风控上下功夫。

大公司纷纷做大数据风控技术输出

在大公司方面,一个共同特征是,都在开发自己的数据体系,利用技术打造风控能力,且将这种能力开放给业界。

蚂蚁金服旗下芝麻信用称,利用梯度提升决策树、随机森林、神经网络、分群调整技术、增量学习技术等在内的机器学习算法,可以为缺少信贷记录的人群做出客观的信用评价。

芝麻信用已通过商家自助服务平台全面开放消费金融风控能力,帮助行业提升风控水平;京东金融形成了由多种大数据机器学习模型构成的弱分类组合预测模型,借助随机森林、lasso回归等算法,参考数千个预测变量,借此评估用户的还款意愿和还款能力。

京东称,正在构建开放生态,开放技术、产品能力,为传统金融机构赋能,帮助其降低成本提高效率。

腾讯旗下的微众银行陆续建立了客户分群授信、社交评分、信用评分、商户授信管理、欺诈侦测等系列模型。

微众银行也在做技术输出,推进同业合作,帮助合作伙伴构建移动互联网金融服务能力;XX金融将自己定位为科技金融公司,以大数据技术为发力点,通过人工智能、用户画像、精准建模等技术,扩大征信范围,并对外开放技术能力;

刚刚推出大数据风控系统的网易金融也主打开放性,为金融机构面向中小微企业和个人的融资服务提供获客、征信、授信、管理和催收等服务,并输出营销、客服等解决方案。

可以看到,大公司基本都选择将自己的数据和技术产品化,开放给合作伙伴。

近年来除了BAT等大公司掌握了强大的风控技术之外,各个互联网金融新兴企业也有了自己的科研成果,推出了很多格局特色的大数据风控系统。

凡普金科:

基于”PH云图“的模型,通过机器学习,自然语言处理等技术链接内外部数据源,形成用于风控的知识体系。

拍拍贷:

墨镜评级系统,采集多达2000个维度数据,形成专业反欺诈团队融360:

天机大数据风控系统,根据身份验证、还款意愿、还款能力三大维度进行信用评分。

马甲袋金融:

Z算法&六边形矩阵风控审核体系。

91条筛选标准,800风控细则,凝聚10年行业经验研发。

好贷网:

以FICO信用评分决策引擎为核心,从6大数据风控类别、21个风控识别领域、1100个识别维度,提供风控服务。

未来行业会演绎怎样的格局?

目前做大数据风控的公司可以分为两派,一派是在数据或技术方面有优势的大型企业,一派是近些年在竞争中兴起的互金创业公司。

大家都在做比较类似的事情,未来行业会有怎样的格局?

可以从数据资源、技术能力、商业模式构建等方面做一个比较。

数据在数据方面,大型企业有数据方面的巨大积累,量级是创业企业所不能比的,数据类型丰富,判断用户的维度也比较广泛。

不同企业之间的数据类型业不尽相同。

阿里和京东在电商数据方面有优势,阿里这些年通过大量收购,也积累了用户在娱乐、搜索、地理位置、生活服务等方面的数据;

XX在搜索数据方面有优势,同时通过旗下多种应用也积累了用户在贴吧、地图、外卖等方面形成的数据;

腾讯较大优势在于社交领域,拥有海量社交数据,同时在新闻、娱乐等内容的分发方面也有不少数据积累,在各类工具应用(应用商店、信息安全应用等)上也有大量用户数据;

网易数据类型也比较丰富,有社交网络数据,即用户的评论信息,有网易严选、考拉海购方面的电商数据,有用户在游戏方式的消费数据,有用户在邮箱、词典等工具上的使用数据;

以上都是互联网企业。

相比之下,也在开放金融技术的宜信的数据主要集中在金融领域,官方资料显示,其信用共享平台加入了线上线下1200万条借贷数据,以及40万个风险名单,并结合了共享机构的借贷数据。

不过,对于大企业而言,大量庞杂的数据,其开发的难度也会比较大,对数据的整合过程是一个比较庞大的系统工程,另外很多数据类型与信用状况相关度较弱,这就会考验数据挖掘能力。

创业企业需要自己在业务拓展中逐步去积累自己的数据体系,并通过引入大量第三方数据来增加数据维度,过程相对来说更艰辛,不过在放贷过程中形成的数据体系,与信用强相关,对于模型的优化帮助比较大,随着创业公司业务数据越来越大,数据基础会逐渐扎实。

在数据上,创业企业优势不及大企业,但并非没有机会。

技术技术实力方面很难量化,也没有很公允的标准来评判各家公司在技术上孰优孰劣。

相对来说,大企业财力更雄厚,可以招募到比较优秀的技术人员,技术体系也会比较系统、全面;创业公司则可以靠股权、期权、发展前景等来吸引优秀的技术人员,且创业公司普遍战斗力强,技术开发往往更聚焦、更迅速。

商业模式构建。

在大数据风控的商业模式构建方面,创业公司生存压力大,相对来说在资产端的开拓上更为进取,目前网贷交易规模超过300亿元的创业公司已经逾10家,创业企业更偏向于将自身资产端拓展与大数据技术相结合,在模式上表现为直接贷款为主,少量助贷业务;

大企业在数据和技术上有优势,在资产端的拓展上更注重安全,目前大公司的金融服务,除了有消费场景的蚂蚁金服和京东金融,其他企业交易规模普遍不大。

大企业更倾向于依托技术和数据来开放能力,打造生态。

很多大企业都是直接放贷与助贷并重的模式。

行业或会形成若干个比较大的大数据风控生态圈

未来一段时间这样的格局或会继续延续,即大企业在做资产端的同时,也将自己的大数据风控体系开放出来,帮助互金创业企业、传统金融机构等来提升风控能力,自己也可以扩大收入来源,壮大生态圈;创业企业在形成自己的大数据风控体系的同时,也接入大企业的风控体系,助力资产端的拓展。

大企业一个不容忽视的优势是,在技术输出的过程中,不仅获得一定收入,也会获得商业伙伴的部分数据,包括信贷、借款人等方面的信息,使自己的数据规模越来越大,优势越来越明显。

未来的普惠金融圈子,或许会形成若干个比较大的、以少数大企业为中心的大数据风控生态圈,大企业掌握比较多的数据资源,将数据与技术开放,帮助生态圈内接入的金融机构、互金企业打造风控体系,发展资产端。

一、大数据风控是什么?

大数据风控按照通俗的概念解析:

通过运用大数据构建模型的方法对借款人进行风险控制和风险提示。

这句话涵盖大数据风控必要的4个要素:

1.原材料:

大数据

2.实现方式:

技术模型

3.目标人群:

场景中的群体。

由于本文主要指个人借贷场景,则目标人群是借款人。

还有其他场景,例如信用卡场景对于信用卡申请人、购物场景针对分期用户、租房场景针对租金分期用户、投保场景针对投保人、投资理财针对投资人等。

4.目的:

风险控制和风险提示。

一般机构主要有2个目的:

∙目的1:

针对降低损失,需要对好坏用户进行识别

∙目的2:

针对获取最大化利润,需要对用户资质分层。

潜在的特点是可以大批量实时实现风险控制和风险提示。

二、传统风控与大数据风控的区别

大数据风控的叫法其实就是为了与传统风控做区分。

传统风控在2016年之前相对比较普遍,其特点是线下风控场景为主,需要用户填写一大堆个人信息及提供工作证明、流水证明、住址证明等,审核时间一般为1-3天,银行体系会更长3-7天左右。

正常情况,一份用户资料表需要填写包括以下这些信息:

姓名、性别、年龄、身份证号、家庭地址、学历、家庭人数、婚姻状态、单位名称、单位电话、工作职务、单位性质、收入来源、收入水平、配偶详情、经营企业详情、其他资质等信息。

除了这些信息,还需要提供纸质的身份证复印件、工作收入证明(盖章)、半年银行流水、水电费或房屋租赁合同等。

另外,银行等持牌机构还会查询用户在央行的征信报告,用于辅助风控。

这些数据潜在的意义可以这样解读:

除了年龄代表准入门槛,一般的借贷产品要求借款人需要有22岁以上才可以申请,现金贷产品会把年龄门槛放到18-20岁及以上。

部分产品要求学历是高中及以上,或者要求非在校生。

其他的分组后分别代表借款用户的还款能力,负债情况及信用情况(这里不细分还款意愿)。

直接体现或者间接体现还款能力的:

1.家庭人数。

家里人多,你还不起,催收后有人可以帮你还;

2.2.婚姻状态,大部分家庭,结婚的比未婚的家庭收入或经济稳定更好;

3.3.单位名称、单位电话、工作职务、单位性质、收入来源、收入水平,直接体现收入水平及收入稳定性情况;

4.4.经营企业详情、其他资质等信息。

体现负债情况和信用情况的:

央行征信报告

拿到这些信息及材料后,由风控专员凭借经验及按照标准化流程审核材料真实性。

例如工作收入证明通过拨打公司电话核查有无本人及职位情况、其他资质材料看印章判断真实性,流水会打银行电话抽查真实性等。

传统风控的模式及节奏是不符合互联网金融高速发展的节奏的,互联网金融时代都是按秒级几百上千用户群同时发起贷款申请,如果按照人工审核,从进件到批核整个流程可能要1个月时间都没法完成。

传统风控向大数据风控的升级,即是行业发展的需要,也受益于各类用户数据被标准化对外,也就是API的形式对外输出,金融机构可以直接接入各种必须的数据接口,用于获取用户的数据。

整个流程从用户填写将近所有的信息,变成只要提供姓名、身份证、银行卡号、手机号这个4个要素就可以获得全部或大部分风控必需的用户信息。

大数据风控的快捷得益于各种标准化的数据接口,但由于代表用户的各种数据是分别存在与不同的机构中,这些数据原则上需要用户授权才能对外,而且数据输出需要进行合规脱敏的处理。

所以,大数据风控需要获取到与传统风控要求用户填写的所有信息、或者直接或间接证明用户还款能力、还款意愿、负债情况及信用情况必须的数据,每个类型需要接入几个数据来源,缺失的类型还需要找到能够替代的数据接口。

大数据风控需要的数据类型,在后面章节再详解。

三、哪些行业及场景需要大数据风控

除了借贷场景,还有哪些场景需要用到大数据风控?

这里,猎人简单举几个例子:

金融行业最常见就是投融资板块,投资板块,需要对非法集资、洗钱、资金盗刷等风险进行防控。

借贷板块,需要进行贷前进行反欺诈及用户风险识别、授信风险评估、贷中风险评估及贷后风险预警。

电商行业需要在用户注册环节进行防薅羊毛、对已注册充值用户需要防止其资金被盗刷、账户被盗及发生交易后对经常拒付的情况需要识别。

保险行业特别是寿险产品,需要对投保人身份进行核实,防止有不良行为投保用户过审发生骗保。

除了这些常见的行业场景,其实各行各业只要涉及到个人信息及资金交易的,都会用到大数据风控,唯一的区别就是针对不同场景的需要的数据及策略是不一样的。

四、大数据风控行业有哪些机构参与

传统风控基本都是由金融机构内部的风险部门及门店经理组成,大数据风控更多是由第三方机构提供。

大数据风控行业主要有以下7大类型机构参与:

1.监管部门旗下或牵头的机构:

百行征信、互金协会及小贷协会等;

2.非银放贷机构旗下金融科技公司:

持牌小贷公司、P2P机构等,例如玖富及宜信;

3.电商旗下金融科技公司:

京东金融、蚂蚁金服等;

4.互联网巨头旗下金融科技公司:

度小满金融、腾讯云等;

5.银行系金融科技公司:

银联智策、建行金科等;

6.企业服务类:

系统服务商、技术提供商、数据中介商等,例如同盾及百融;

7.支付机构旗下金融科技公司:

天翼征信:

新颜征信等。

这些机构拥有场景、资金、放贷业务三者全部或者其中一块要素,这些要素决定了其在大数据风控的竞争壁垒。

场景代表有源源不断的数据,及精准的客群画像,可以无成本或低成本用于风控业务;

资金代表了可以随意切进任一借贷场景,获取数据及影响产品形态;

放贷业务表示在特定场景有一定的用户借贷表现的数据及基础的风控能力,部分机构的成熟风控能力还可以直接对外输出变现,切入到体系外的场景获取更多的数据。

因此,数据量级、数据成本、风控经验、资金风险承受能力综合决定了一家机构在大数据风控是否有足够的竞争力。

五、大数据风控机构存在的意义

个人借贷金融板块的大数据风控行业的前景,主要可以看2方面:

一个是不含房贷的国内消费金融市场规模及渗透情况。

只要消费金融市场的存量客户,有复贷需求,且增量客群还有转化空间,代表着借贷业务是持续发生的,则这里对风控的需求是持续不断的。

我国个人消费金融的市场规模从2013年的12亿到2018年的将近38亿,翻了3倍有多;而不含房贷的规模到2018年则到了8亿,渗透率为22.36%。

如果到2020年渗透率可以提升2.5%,则市场规模有个3.5万亿的提升。

这个空间足够众多公司在此竞争。

大数据风控机构其中的一个收入来源就是数据接口的调用次数计费,这个调用次数息息相关的是借贷用户数量。

而央行内收录的大部分信贷记录用户都是属于银行等相对高质量用户群体,这些群体都有可能下沉到非银系的互联网金融中发生贷款行为,同时不在央行体系的信贷用户,都是互联网消费金融机构的潜在客户。

通过央行查询量,可以侧面知道在银行体系信贷需求的用户数量,这部分用户80%以上是无法获取银行体系的贷款的,因此理论上是可以成为消费金融机构的潜在客群。

2015年的6.3亿次查询到2018的17.6亿次查询,说明需要信贷的用户非常多,但这么大的查询量,有信贷记录人数才增加了1亿,说明大部分用户都无法获得贷款或者非常需要贷款,会同时在多个机构申请贷款,才会每人产生近10次的查询次数。

六、处于消费金融产业链什么位置

已知大数据风控机构在消费金融场景中是非常有前景的,我们了解下其在消费金融产业链中的角色及功能,消费金融产业链的角色包括:

1.监管机构:

银保监会、中国人民银行等;

2.消费金融服务提供商:

商业银行、电商平台、持牌公司、分期平台、非持牌机构;

3.资金提供方:

自有资金、信托、ABS、银行借贷、同业拆及P2P;

4.第三方支付机构:

负责提供支付通道,给予消金机构放款或者代扣还款;

5.催收或不良资产机构:

负责贷后逾期不还及失联客户;

6.消费者:

不同场景的消费需要的资金需求是不一样的;

7.风控及征信机构:

负责提供大数据风控服务,包括数据、技术服务、模型策略等。

除了消费者外,产业链中的各个角色都有附加风控及征信机构角色的可能,对外输出大数据风控能力。

七、个贷风控场景及解决方案

猎人将消费金融大数据风控场景分为5个环节6个应用场景:

5个环节包括反欺诈、身份核验、贷前审核、贷中监控及贷后催收;6个应用场景分别对应不同的环节。

反欺诈环节:

对申请借贷的用户群体进行反欺诈识别,识别能力主要依赖于风险名单,高危名单(在逃、黄赌毒、涉案)、法院失信被执行人等名单,另外还有虚拟手机号、风险IP、风险地区等名单,通过名单进行反欺诈识别。

再深入点,可以在用户使用的设备端进行反欺诈识别,查看是否是风险设备;还可以通过群体关联,找出是否团伙欺诈行为。

例如申请集中在一个IP地址,一个户籍地,通讯录都有同一个人联系方式等。

身份核验环节:

进行借贷同行业身份核验。

在反欺诈识别过程中,无风险用户来到身份核验环节,这里可以通过身份证2要素接口,核验用户的姓名身份证号是否正真实;通过活体识别判断是否用户本人在操作;通过运营商核验接口,核验用户的姓名身份证手机号是否一致,手机号是否本人实名使用;通过银行卡核验,核验用户的提供的银行卡是否本人,防止贷款成功后,贷款资金到他人账户被冒用。

贷前审核环节:

授权信息获取,针对身份核验通过的用户,进行有感知或无感知的必要信息获取,为后续模型评分准备好数据。

无感知获取的包括多头借贷数据、消费金融画像数据、手机号状态和时长数据等;有感知(需要用户提供相关账户密码)获取的数据有:

运营商报告、社保公积金、职业信息、学历信息、央行征信等。

借贷用户的分层及授信,针对以获取的用户相关数据,根据不同的算法模型输出针对用户申请环节的评分卡、借贷过程的行为评分卡、授信额度模型、资质分层等模型。

不同机构对于不同环节的模型评分叫法不一样,目的都是围绕风险识别及用户资质评估。

贷中监控:

之前环节获取的数据大部分还可以用于贷后监控,监控各项正常指标是否往不良转变,例如本来无多头借贷情况的,申请成功贷款后发现该用户在别的地方有多笔借贷情况,这时可以将该用户列为重点关注对象,防止逾期。

贷后催收:

此时需要催收的主要针对失联部分客户,这部分客户在贷款时填写的号码已经不可用,需要通过大数据风控公司通过某些手段获得该客户实名或非实名在用的其他号码,提高催收人员的触达几率。

八、大数据风控常用的数据类型

大数据风控离不开数据,这些数据猎人将主要的7大类型,这7大类型的存在主要有2大原因:

一是这些数据维度基本可以直接或间接体现用户的还款能力、负债情况、信用情况及其他潜在风险,大部分数据维度都已在金融信贷风控环节得到有效的验证,除了个别场景对于少部分类型数据不太合适外。

二是这些数据都经过标准化的处理,且在其体系内与合作的借贷机构客群最低的交叉比例超过40%以上,也就是借贷机构的100个用户中可以在这个数据接口中查到其中40人及以上的数据。

还有一些原因是这些数据来源的更新频率足够满足风控公司的要求,特别是高风险名单这些要求是实时的,而身份证要素这些则无需更新实时问题也不大。

数据类型主要有:

∙身份信息:

身份证、银行卡、手机卡、学历、职业、社保、公积金;

∙借贷信息:

注册信息、申请信息、共债信息、逾期信息;

∙消费信息:

POS消费、保险消费、淘宝消费、京东消费;

∙兴趣信息:

APP偏好、浏览偏好、消费类型偏好;

∙出行信息:

常出没区域、航旅出行、铁路出行;

∙公检法画像:

失信被执行、涉诉、在逃、黄赌毒;

∙其他风险画像:

航空铁路黑名单、支付欺诈、恶意骗贷。

九、大数据风控的数据源头

大数据风控需要的数据类型这么多,那来源是哪里,或者说这些数据掌握在哪些机构中?

∙身份证数据源头:

公安一所、公安三所、身份证信息查询中心;

∙银行卡数据源头:

各类银行、各地银联;

∙手机号数据源头:

移动、联通、电信;

∙学历数据源头:

学信网;

∙社保公积金数据源头:

社保局、公积金管理中心;

∙借贷数据数据源头:

央行征信中心、有信贷业务的银行、消费金融机构、小贷公司、P2P及有放贷业务的金融机构(保理机构);

∙出行数据数据源头:

中航信、铁路总局、出行APP、运营商、有定位的APP;

∙消费数据:

银行、电商平台、第三方支付、场景平台;

∙兴趣爱好数据源头:

运营商、各类PC平台网站、各类APP、搜索引擎、手机系统商。

其实以上源头直接从事数据输出业务的只是一小部分,原因是大部分源头公司对数据合规输出及场景管理无专门部分负责,而且数据业务盈利不是其主要的业务。

因此活跃在大数据风控行业,提供数据业务的是一些通过相关关系获得代理权的数据代理商,及为这些源头公司提供系统服务的系统商。

十、人工规则及机器模型

大数据风控的实现方式是传统风控的专家经验模型、及现今依赖算法模型两种方式结合较多。

原因是算法模型在大多数常规情况是可以准确识别风险情况,但少部分特殊情况需要人工参与干涉修正及调优的。

专家经验模型的流程是将遇到的新问题(新申请用户的资料)作为入参,风控专家根据历史出现的情况(不同客群的好坏表现)归纳起来,从中找出相关规律(A客群对应好的,B客群对应坏的,C客群没遇到过,但可能是好的等),从而判断新问题可能发展的路径情况(新客户贷后是好的或者坏的)。

算法模型,主要依赖统计学公式,流程是将新数据(新申请用户的资料)作为入参,算法模型(随机森林、决策树、逻辑回归等)在大量的历史客户样本喂养后,已经可以区分出不同客群的好坏表现,从中而判断新用户在模型结果中对应的是好还是坏客户分类。

这其中会引入第三方的数据源(KS、IV、AUC等都是判断第三方数据有效性的指标),看哪些数据能够提升算法模型的识别准确率。

其实从流程看出,算法模型无非把人工经验环节换成了算法模型替代,以此实现批量找出能够判断好坏客户的规律,并将其标准化。

但遇到一些不在历史数据中的情况时,算法模型就可能无效,需要人工参与调优,为了解决新问题算法模型表现不太好的情况,现在有机构尝试用新的算法或逻辑去模仿人工调优这个工作。

十一、大数据风控的产品形态

大数据风控行业中最常见的产品形态有4种:

1.API接口:

主要输出裸字段、脱敏后字段或者评分值;

2.SDK:

爬虫类产品、设备指纹等;例如学历爬虫接口,输入用户账号密码可以登录学信网将用户的学历学籍信息爬取下来。

3.H5报告:

用户风险报告、用户评分报告等;

4.机器模型及决策引擎。

API接口及SDK一般是有风控模型团队机构需

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 日语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1