P2P网络借贷行为中借款成功率及借款利率的实证分析.docx
《P2P网络借贷行为中借款成功率及借款利率的实证分析.docx》由会员分享,可在线阅读,更多相关《P2P网络借贷行为中借款成功率及借款利率的实证分析.docx(28页珍藏版)》请在冰豆网上搜索。
P2P网络借贷行为中借款成功率及借款利率的实证分析
P2P网络借贷行为中借款成功率及借款利率的实证分析
摘要
现在民间出了一种新的借贷方式那就是P2P网络,它使金融市场的融资效率得到了巨大的提升,从而受到了世界各地的广泛关注。
伴随着P2P这个借贷网络平台的快速发展,目前的P2P网络被越来越多的人所重视,而这个平台中弊端也有很多,存在着诸多问题
本文结合前人在相关领域的探索,依据P2P网络借贷的概念和相关理论,在P2P网络研究模型的基础上,以拍拍贷为例,对这个平台进行了具体的研究。
借用二元Logistic回归模型和多元线性回归模型,对P2P借贷平台提出相关假设,进行回归结果分析,最后进行假设验证,本文中为p2p网络借贷提出了一些科学的建议。
关键词:
P2P网络;网络借贷;借款成功率;实网络证研究
1.引言
1.1研究背景
P2P网络借贷作为一种新的民间借贷,但它的存在是短暂的,但无论从速度还是规模而言P2P贷款出现了令人惊讶的快速发展。
P2P网络借贷平台的发展,形成的网络信用正在被越来越多的人所接受。
P2P网络借贷能满足融资难以照顾到的小微企业占小额信贷的融资需求和对扶贫的公众有着很重要的意义。
但是,有借贷成功的款的成功率非常低,面临的三大困难是借贷的成本和借贷的违约率比较高,这对于当前的P2P网络发现来说。
特别是,中国的发展环境,P2P贷款模式的网络可以在它的投资功能和融资发挥作用过多,以及扶贫的作用:
1,在生产领域,是世界存款率最高的,这些存款在中国P2P网络借贷市场具有不容忽视的潜力。
虽然P2P行业仍然是初生牛犊,但在小微企业融资和个人财务状况已经显示出罕见的潜力。
这是由于P2P平台,通过信用评级来收集信息,并根据这些优势联系借款人和贷款人分配信贷的能力,能够满足不一样社会环境中的需求的模式就是P2P网络模式;2,财政分配的网络,P2P可以解决筹集资金的关键社会问题,致力于提高整体社会福利。
一些平台的福利已经开始运行,致力于P2P网络,例如宜信企业下的宜农贷平台。
中国的农村人口数量是非常庞大的,而他们的生活水平都低于社会的平均水平,对于大多数的人而言,所以为他们提供些资金也是很必要的,将在提高农民生活水平有很大帮助。
然而,他们的银行服务有限,对于大多数的农村居民来说,而当地虽然有很多并不是政府所组织的小型的信贷组织来解决这个问题,因为捐赠的资金很少,他们还远远不够以发展。
P2P网络借贷能够帮助他们改善生活到一定程度的标准。
1.1研究主要内容
本文的内容主要分为两大部分:
第一部分先是理论模式的建立以及理论模型数据的准备。
以拍拍贷为例的是第二部分,其进行了实证的研究对P2P的网络信贷,它的出发点就是从出借人投标意愿的影响因素和出借人的要求收益因素,所以就借用了两个回归模型,就是二元Logistic回归模型和多元线性回归模型,进行相关的假设,并进行回归结果分析,最后进行假设验证结果,从而对于P2P网络借贷的运营提出相应的建议。
1.3文献综述
在国外,发源于网络的是p2p的网络借贷模式,在2005年时。
这种新型贷款模式的出现吸引了众多研究者的关注,开始了一系列的完整的P2P网络借贷的研究。
参照国内国外的P2P模型,开发了包括拍拍贷、人人贷等,国内学术界和工业界的专家进行了大量的研究和调查。
本文总结了P2P借贷网络的研究现状和梳理国内外研究成果,以奠定的P2P网络信用风险研究的理论基础。
Prabhala以及Lin以Prosper为例,信用评级体系和操作模式是本文所研究的内容。
在这个的基础上,阐述操作流程和P2P网络平台借钱的运行机制。
Michael则以Zopa为例,Zopa平台面临的不平等信息的问题,但透明的制度降低了其平台的风险,并保持坏账的比例较低。
另外,Emma将对很多国家P2P网络借贷平台的发展现状展开研究,在此基础上发现,Zopa的水平较高有效提升了其安全性。
而Zopa3/4将不能再得到批准贷款。
此网络平台的发展水平较高,可以为客户相关合法权益的保护提高必要的保障。
这也符合一位叫吴晓光的专家的观点,不能让客户承担太大的风险。
王丹在使用定位模型的基础上对此展开研究,P2P网络借贷平台根据相关标准可以划分为两个不同的种类。
学者毕芾然则是风险控制体系的首创者,为相关工作的开展提供了有利的理论指导。
郭卫东的观点则是要站在法律的层面考虑该领域的发展。
为其进一步提高创造有利的宏观环境,并减少P2P平台暗箱操作现象的发生。
在2011年的时候,美国的一份报告说中写到,在网络中,P2P平台有时扮演的是产品推销者的角色,为某些商品的宣传提供了较好的平台。
采取什么措施来增加P2P安全性并在现实生活中将其付诸实践,引起了很多学者的重视。
张天骄主要对其安全隐患等方面展开研究。
按照冯海悦的观点,博弈论和SCP分析是在开展P2P安全性保障研究应该主要利用的理论。
李瑶的研究具体方面则有所不同,再具体分析了我国行业发展现状的基础上,他认为信息披露对于现阶段我国P2P领域的发展也必不可少,应该在科学的理论指导下,将信息披露运用到其实际中来。
周小娟对于P2P行业现阶段的实际情况开展调查分析,在总结了收集到的有效信息的基础上,对于如何提高P2P行业整体的安全性水平给出了自己的建议;赵海荣则是将研究的重心放在整个网络平台上,并对于现阶段网络在对其监督的过程中的实际作用展开分析;王泽华则在仔细分析了现阶段P2P的发展之后,结合相关理论知识,为监管工作整体水平的提升找到了具体途径。
白如冰的研究结果则是,P2P平台的产生离不开很多方面提供的有利条件。
其中数据库和信息科学技术的发展尤为重要,其是P2P产生的最重要因素,之后的发展和提高也必须要在数据库和信息科学技术的发展之下才能得以实现。
1.4P2P网络借贷概述
P2P借贷是从国外引进的一个概念,是理财网站的一种重要形式,这意味着通过网络的平台,有投资愿望的人可将多余资金信贷给有资金需求的人。
借用P2P网络从P2P小额信贷起源,但随着互联网的飞速发展,从“线下”模式,展开“线上”的模式,属于民间借贷网络的扩展。
P2P的网络信贷共有三个部分组成,就是这个网络借贷贷款人、P2P的网络借贷平台和其的网络借贷借款人。
借款人通过这个平台提出自己所需要的资金数量,向贷款人借资金,用自身的信用做抵押担保。
贷款人在借贷的交易中扮演提供资金的角色,它是P2P网络在信贷实践中借款信息的获取方。
只是作为一个交易的中介,并建立一个信贷的关系,这就是P2P的网络借贷平台。
提供配套的信息匹配服务,因此收取的成本的佣金。
借款人通过在网络借贷的平台上发出借款的信息,以此来表达自己对资金的需求,而贷款人可以查看借款人对资金需求的信息通过一些平台,针对指定的借款人的需要的资金通过担保承诺的方法借出资金,这就是网络借贷的操作过程。
这个平台从贷款的机构建立了借贷关系,获取资金借给借款人,然后再通过这个平台来还回款,平台也在整个的借贷的过程中收入相当比例的费用。
2理论模型的建立与模型数据准备
2.1理论模型的建立与理论假设
2.1.1出借意愿影响因素分析的相关假设
决定贷款人贷款意愿的因素,利率和违约情况是主要的两个方面。
违约的情况越小则说明借出的利率越高,贷款很想要借出的可能性也越高。
针对这种现象,有些人说出了自己的想法:
1.不管有没有人进行担保,借款人当然喜欢利息高,出借人的收益也会很好高,增强出借人的借出意愿,就可以很容易的得到出借人的借款,以此类推的假设。
如果出借人愿意借的话,是因为利率比较高。
2.2.如果没有什么特殊的情况,当借款人每个月所还的钱越少也能够说明借款人借出的相对较少,对于出借人来说也很容易还上,但同时违约也会面临着被网络曝光的风险,所以出借人一般的违约情况也不是很常见的。
但是,也有一些相关的证据证明,如果借款的时间较长,那么违约状况的发生则相对来说更容易些。
让我们来想象一下:
H2:
如果出借人更愿意出借,则说明,借款的期限相对来说较短,借款的金额也相对来说没有那么多
3.无论是借款人,还是出借人,他们之间的关系都是很玄妙的。
每个地区的人都有不同的性格差异,所以信任的程度也都各不相同,针对每个人的经济收入水平都有明显的不同,所以他们相对应的还款能力也是不尽相同的。
在一般的情况下,年龄比较大的男性借款人同时他是生活在经济相对发达的地区的,还款能力可能相对较强,所以一般的出借人更愿意把钱借给这一类人,再做一个猜测:
H3a:
年龄相对来说较大的男性同时生活在经济相对发达的地区的借款人更容易被出借人所青睐;
4.应该制定相关的规定,或者通过某种方法在借款人违约的情况下,出借人依然能够通过某种方式获得一定的收益,找一个中间人对于出借人来说是十分有必要的,这样可以规避一定的风险,所以我们猜测:
H3b:
如果想要增强出借人的出借意愿,可以通过抵押或者是担保类的形式去进行贷款
5.无论是借款人还是出借人,双方一定要了解对方的基本情况,不能粗心大意。
双方互相了解的更透彻,被曝光的信息比较多,借款人要付出很高额代价,这是因为借款人的违约。
所以一般来说发生违约事件的利率相对较低;借款人可以被进行信用评比,而且这个评比是被官方授予的,相对来说更值得信赖,借款人如果还款的能力比较高的话,他的违约行为也会很低,说明借款人的信用也很高。
另外,借款多次的借款人在多次借款中都能成功也能说明他的还款能力高,被出借人所认可,针对这种现象我们可以进行猜测:
H3c:
得到信用分越高的借款人能够被出借人所认可,成功借款多次的借款人也会被认可,这种人是有能力及时还款的。
2.1.2收益分析对于出借人所做出的部分猜测:
从最后一个时期的借款人去进行分析,这种方法是逆推归纳法。
在这个时候,出借人会不会进行借款主要可以分成两种情况去进行讨论,那就是:
第一点就是无论最后借款人会不会按时还款,如果在出借人和还贷人之间有担保人,那么出借人都会得到一些相应的收益;
第二点则是如果在出借人和借款人之间没有担保,出借人在借款前应该仔细考虑,自己应不应该借钱给借款人,借款人又会不会不还钱给自己。
实际上在做了担保的情况下,认为借款人的违约可能是没有,,而如果是在没有担保的状况下,借款人违约的概率则需要出借人做出准确无误的预测:
如果借款人借的钱少,时间也很短,那借给借款人的收益也会相对比较低。
H5a:
如果是抵押形式的贷款,那么出借人的收益也没有太多;
H5b:
年龄较大的生活在发达城市的男性借款人的还款能力高,出借人所得到的利息也较低;
H5c:
信用得分较高同时能够成功多次贷款的借款人更容易被出借人所认可,对他们的收益要求相对来说较低。
3.2数据准备
3.2.1变量的介绍与分类
拍拍贷是国内第一家不用任何保障抵押模式的网络借款工具,目前它在国内的网络平台上相当的活跃,所以我们把它当做是本文的主要研究对象。
下面是一些对拍拍贷运行操控模式的相关介绍,在进行大部分的研究后,我们的实验就冷开始进行了。
根据大量国内和国外与此相关书籍的部分研究,下面我们列举了一些相关的信息:
(1)借款数量的大小
在拍拍贷这个网络平台上,借款人首先提出自己想要得到贷款的数量,到这个数量是有着一定范围的,以后可以得到一连串的相关数据,根据这些获得相关数据来看,借款成功的记录有很多。
(2)年利率的数额
可以支付比较高的成本,让接待者得到他们所需求的资金,喝酒时借款年利率。
如果没有什么特殊的情况,借款的利率越高,则说明,获得借款的可能性相对来说就越高。
(3)借款的时间限制
拍拍贷上所规定的最长借款时间不能大于一年,期限必须在1-12月中。
(4)可不可以提现
只本人才有资格将网络账户中的金额提现出去,所以相对来说,风险不是很高,所以拍拍贷上的这种模式十分收到广大借款人的青睐并且越来越收到欢迎。
(5)有无担保
担当担保的可以是人,也就是我们常说的担保人,担保人为借贷人提供担保,如果借贷人在规定的时间内无法偿还债务,那么担保人要对此承担相应的职责,这样就会大大降低出借人的风险性。
(6)是不是安全标
在拍拍贷上或者出借给别人的钱等着回收的就是安全指标。
这个变量也就是名义上的变量,所以要转化为哑变量,将这个名义上的变量,赋值是0的“不是安全标”,而赋值为1的就将“是安全标”。
3.3样本数据的初步分析
在拍拍贷上借款人的地区分布,从单笔的借款列表来看的话,浙江,上海,广东,山东,福建这些地方对网络信贷的需求是很大的,甚至达到了全部总需求的一半以上。
从这些数据可以看出,对网络借贷支持率比较高的是沿海地区和华东地区,并且对于借贷的需求量也很旺盛。
在列表中对借款的数量进行描述,结合这个地区的部分借款人,从中可以看出大多数的借款人是因为自己的比较小型的企业,比如一些来像拍拍贷这样的平台上,出现了资金紧缺的现象。
这种小微型的企业大多数的时候对资金的需求量不是很高的,都是几万到几十万不等,对这样的需求不重视,对于银行等一些传统的渠道,所以这些小的企业很难从他们那里获取所需要的资金。
为这类的小微型企业提供了融资平台的就是P2P网络,它在帮助这些微小型企业的融资起到了很大的作用。
表3-3拍拍贷用户性别统计
性别
频数
百分比
有效百分比
累计百分比
有效数据
1
30754
85.6
85.6
85.6
0
5162
14.4
14.4
100.0
总计
35916
100.0
100.0
下面的3-3表就显示了拍拍贷上的借款人性别,占到绝对比重的是男性。
表3-4拍拍贷用户年龄段统计
年龄
频数
百分比
有效百分比
累计比分比
有效数据
26-31岁
15661
43.6
43.6
43.6
20-25岁
9617
26.8
26.8
70.4
32-38岁
7735
21.5
21.5
91.9
大于39岁
2903
8.1
8.1
100.0
总计
35916
100.0
100.0
下表3-4所表示的是拍拍贷上的借款人年龄的分布,其中借款人占比重为43.6%的是26-31岁的人,借款人比重占26.8%的是20-25岁的人,占借款人比重21.5%的是32-38岁的借款人,而占借款人比重达到8.1的是39岁以上的借款人。
从中可以看出来对贷款需求量比较高的是30岁以下的年轻人,同时接受的程度也比较高,对于网络借贷这种新兴的产物。
表3-5拍拍贷借款申请信息统计
统计
借款金额
借款年利率
借款期限
Valid
35916
35916
35916
Missmg
0
0
0
Mcan
6065.15
19.8474
6.28
Mimimum
3000
5
1
Maximum
500000
26.24
12
Percentiles
20
3000
18
3
40
3000
20
6
60
3500
22
6
80
4971.6
22
10
本文获取的拍拍贷上的借款申请数据为35916条,借款申请的金额从最低的3000元到最高50万元,平均借款金额仅为6065元,且其中80%以上都在5000元以下;借款年利率最低5%,最高为26.24(基准年利率的4倍),平均值为19.85,且60%借款的年利率在20%以上;借款期限最低为1个月,最高为12个月,平均借款期限为6.28个月,且60%以上借款期限在6个月以下。
表3-6拍拍贷成交借款信息统计
统计
借款金额
借款年利率
借款期限
Valid
13360
13360
13360
Missmg
0
0
0
Mcan
9304.780389
17.32036078
6.304041916
Mimimum
3000
5
1
Maximum
500000
26.24
12
Percentiles
20
3000
18
3
40
3576.4
20
6
60
4839.2
20
6
80
8900
21
9
本节中获取到的实际成功的借款数据总共有13360条,考虑到了一些借款的数据,评论成功的借款金额有很多,并且借款金额在8900元以下的就有80%,评价的年利率达到17.32%,有60%以上整年的年利率达到了18%以上,规定每个的借款时间限制为6.3个月,小于6个月的的借款期限在60%以上。
上面的这些数据让我们对拍拍贷有了一个简单的了解,就是说拍拍贷是面向全国性的,大多数的客户都分布在华东地区和沿海地区的一家主要经营小额短期贷款的P2p网络借贷平台。
4.P2P网络借贷行为的实证研究
此章节以拍拍贷为实例进行实证研究,分别通过对出借人投标意愿的影响因素和出借人要求收益因素这两方面的分析和假设,可以用二元Logistic回归模型和多元线性回归模型的方法得出假设验证的结果,用两个回归方程进行分析。
4.1实证分析影响因素即出借人的投标意愿
由于各种各样的原因,借款的成功率一直不太高,在P2P的网路借贷中。
Prosper是最早的借贷网络,它的成功率都不到百分之十,拍拍贷的借贷成功率都不超过20%,在2008年的时候。
本节中的数据2011年7月22日-2012年的8月2日拍拍贷的近一年数据来看,它的借款成功率也都没有超过40%。
提供这些数据例子就是为了研究在P2P网络的借贷平台中影响借贷成功率的重要的原因,可以根据模型的结果,猜测一下借款成功的可能性,对客户提出一些实质性的交易,就是关于怎样提高贷款成功率,进而提升网络的运行效率,即P2P网络借贷平台。
看投标能否完成表现形式,在拍拍贷的借款流程中,因此本文中中代替出借人的出借意愿当成变量,用能不能投标成功来替代。
本章研究需要的变量如下:
表4-1研究网络借贷成功率需要的变量
因变量
自变量
借款信息变量
抵押担保变量
人口特征变量
信用变量
历史表现变量
投标是否完成(Y1)
借款金额(L1)
是否非提现标(G1)
年龄段(D1)
认证总分
(C1)
借款成功次数(R1)
借款年利率(L1)
是否担保(G2)
性别(D2)
借入信用分(C2)
流标次数(R2)
借款期限(L3)
是否安全标(G3)
所在地(D3)
借出信用
分(C3)
4.1.1二元Logistic回归模型简介
对于二元变量中存在的不合理之处,二元Logistic回归模型可以发挥重要的作用。
这样的二元因变量代表的实际意义即投标进展的实际情况,在此论文中,假设Oo代表的是投标没有完成的编码,而1作为则代表已经完成的编码。
除此之外,在名义变量的时候有优势,因此在处理名义变量时也有一定的优势的对于Logistic回归方程,可以自动的将名义变量转化为哑变量,而所在地都是名义变量的是年龄段和借款人,所以Logistic的这种方法能够很方便的对此进行编码,这就是这种方法最大的优点。
本节中的Logistic的回归方法如下所示:
(4-1)
其中:
(4-2)
4.1.2回归结果分析
作为因变量的是投标能不能完成的标准,其他的部分都当成自变量,结果如下所表示:
表4-2回归模型的Omnibus检验结果
回归模型的Omnibus检验结果
Step1
Chi一square
df
Sig.
Step
16816.872
46
.000
Block
16816.872
46
.000
Model
16816.872
46
.000
4-2可以告诉我们,在经过相关的计算后可以得出最终结果是:
观测值是16816.872,自由度是46,p值是0.000。
在
=0.05时,以为p在0.05以下,假设为0的情况不应该考虑,认为所有不同时为0的是回归系数,解释变量全体与Ln(p/1-p)二者之间有直接的关系可以简单地反映出来,因此此模型存在一定的合理性。
表4-3二元Logistic回归模型解释度
ModelSummary
Step
-2Loglikelihood
Cox&SnellRSquare
NagelkerkeRSquare
1
28363.196
.374
.522
a.Estimationterminatedatiterationnumber8becauseparameterestimateschangedbylessthan.001.
特别是像似然,就是让自由变量观测值预测因为变量观测值的概率。
似然的取值范围也是在0和1之间,和其他的任何概率一样。
它的自然对数形式就是对数似然值((loglikelihoodLL),它的对数似然值取值范围是在0到一co之间,是因为对数值负数的取值范围在[0,1]之间。
最大似然值估计的迭代计算法计算得到的是通过对数似然值实现的。
在数学上更为方便的是-2loglikelihood近似服从卡方分布的,所以可用于检测Logistic回归的方法检测性的是-2loglikelihood。
表示了在模型中也包括了自变量的误差的也是-2loglikelihood,它解决了变动的明显的问题对于处理变量无法解释的问题时,就是所谓的拟合劣度卡方统计量(Badness-of-fitChi-square)。
如果-2loglikelihood的实际显著性水平大于给定的显著性水平a时,不能解释的部分是不显著的在因变量的变动中,这也就是说回归方程的拟合程度也就越高。
下面是-2loglikelihood的计算公式:
-2loglikelihood=
(4-3)
在样本的容量是35961的情况下,28363.196在可接受的范围内对于-2loglikelihood来说,R值是0.522,而最终的差是52.2,是在方程中我们可以通过自变量的相关信息知道的。
因为信息的收集和获取以及其他方面还存在缺陷,因为对信息的收集和获取存在不可避免的缺陷和其他方面的问题,因此该条件下的计算结果解释读非常有限。
比如说,是不是上传了清楚得本人的照片在借款人的借款列表中,借款人对借款数量的讲述,是不是有别的认证项目比如淘宝认证户口认证借款人自己申请的财务信息等,这就是对借贷能不能成功的影响较大的影响因素。
这对于在预测自变量对于借款人投标能不能投标方面有很大的影响,尽管文章中并没有得到比较完整的影响因素。
表4-4二元Logistic回归的判别分类结果
从表4-4中可以看出,通过二元Logistic的回归模型预测的方法可以解决对于投标没有完成的11594笔的借款中,而这些其中有8113笔的借款成功预测没有完成预测指标,错误判断率为30%,有22023笔的借款成功的预测投标已经完成,错误判断率为9.5%,在没有投标完成的24322笔的借款数量中,整体的错误判断率是16.1%。
所以,根据上文相关要求建立的Logistic的回归方程在实际的估算借款成功信息等方面有很大的可行性,即便是在数据不完整的情况下。
表4-5借款人所在地部分的回归结果
VariablesintheEquation
B
S.E
Wald
df
Sig.
Exp(B)
Step
1a
所在地
87.987
31
.000
所在地
(1)
.071
.148
.152
1
.697
.944
所在地
(2)
一008
.143
.155
1
.694
.945
所在地(3)
.131
.126
.3