第一章 绪论
第一节 研究背景及意义
一、研究背景
《第 42 次中国互联网络发展状况统计报告》数据显示,截至 2018 年 6 月,我 国的网民规模为 8.02 亿,其中手机网民规模达 7.88 亿,互联网普及率达 57.7%①。互联网的普及不仅促进了日常交流,互联网更是成为企业间、企业与客户间交易的主要渠道,使业务交易和服务更加方便实时、快捷和高效(张园园,2006)。电子商务线上运营模式被广大消费者熟知和接受,电子商务的蓬勃发展使许多线下企业纷纷触网。互联网金融也逐渐兴起,互联网与金融的深度融合催生了众筹、P2P(Peer-to Peer)网贷等新型业务模式。十二届全国人大政府工作报告提出了“互联网+”行动计划,推动中国电子商务、互联网金融和工业互联网在国际市场中健康发展并逐步扩大影响力。同时移动互联网、物联网、云计算、大数据等技术的应用促进了交易多样化,这些都不断地改变着人们的生活习惯和消费方式。
然而网上信息不对称导致的信用缺失现象日益严重,网络失信弊端开始显现,很多信用违约、监管不当以及投资风险问题等逐渐暴露出来,例如 2018 年上半年投资理财市场的 P2P 爆雷潮。无论是传统的商业模式还是基于互联网的业务往来,信用始终是其发展稳定的基础,个人信用的用途也日渐丰富,为了确保交易公平安全,建立健全可靠的互联网信用评价体系迫在眉睫。
不同于国外发达国家有着稳固的市场经济基础,国内对于个人信用评价的研究起步较晚,没有比较完善的信用评价指标和信用评价模型。面对信用问题,传统个人信用评价以“5C”分析法为主要依托理论,从品德、能力、资产、抵押担保和经济状况五方面来评估个人用户的总体信用(韩茜等,2018)。银行和少数信用评价机构从用户主动提供的身份信息和金融活动中收集个人基本内容、借贷历史、消费信贷和违法违纪记录等信息评价用户信用。传统个人信用的评价维度主要依托于多维的数学模型,信用评价所需要收集的数据及计算过程均比较复杂(李前慧等,2017)。由于传统个人信用评价数据维度有限并且数据具有时效性,对于短时间内的信用评估所要求的人工成本较高、处理速度压力太大,因此并不能完全体现个人的实时信用变化情况。
...........................
第二节 主要研究内容及方法
一、研究目标
本文旨在探索如何通过用户的社交数据来判断其信用程度,拟解决的关键问题如下:
1. 社交平台中挖掘出的信用大多体现在用户的行为中,所能表现的也只是用户信用的一部分。探索用户在社交网络中信用的表现形式以及如何证明用社交数据预测的用户信用能与真实信用表示一致。
2. 在社交网络中用以评估用户信用的行为指标非常丰富,包括用户的注册信息、兴趣关注、发博行为、转发行为、点赞行为、购物记录分享、社交关系等多种信息都能不同程度的体现信用情况,然而如何在众多指标中需要找出最适合最能体现用户信用的指标,建立行为模型并说明行为维度评价信用的可行性这是我们需要考虑的一个问题。
3. 在行为模型的基础上扩充评价指标,建立更全面的个人信用评价体系,如何确定指标与信用之间的联系,以及如何确定指标权重,计算出用户的信用分值。将结果与阳光信用分进行比较,检验本文提出的方法的可行性与准确性。
下图 1-1 为本文的技术路线图:
..........................
第二章 相关理论与研究现状
第一节 相关理论
一、信任理论
信任在不同学科领域中有不同的含义,当社会发生变化时,信任本身的涵义和功能都会随之改变,对信任最早的研究来自心理学。信任涉及两方,即信任者与被信任者(Baier,1986)。心理学普遍认为,信任在成熟和互相满足的人际交往中是不可缺少的,互动形成了人们复杂的社会,信任在之间可以促进社会交换(Cook,2005;Jones 等,1997)。张维迎和柯荣住(2002)将信任定义为是除了物质和人力资本之外能够决定一个国家社会发展和经济增长的社会资本,通过跨省调查信任数据,证实信任确实会影响一个地区的经济绩效。金玉芳和董大海(2004)基于消费者的消费过程,探讨了影响信任的因素及其对消费者信任的影响。Lapavitsas(2007)认为与信用有关的信任的基础是偿还金钱的能力。Michell等(1998)则确定了与信任行为有关的 22 个变量,并将其分为四个维度,分别为正直、公平、可靠和满意。国内外对信任理论的研究和实践都证明信任在金融经济、社会发展都十分重要。
互联网普及之后,互联网信任也随之出现。Bierhoff 和 Vornefeld(2004)提出在互联网环境中信息技术的可靠性与信任的发展直接相关,并且人们的关系信任可以转化为系统信任。王曙光等(2014)以 P2P 网络借贷为例,从四个角度总结了影响网络信任的因素。在线信任与其他环境下的信任比较更难以合理地评估,因此 Friedman 等(2000)提出要明智又道德地设计和利用技术解决这个问题。信任问题是社交网络发展的一个瓶颈(王洪流,2013),解决社交网络中的信任问题是大势所趋。
二、信息不对称理论
信息不对称现象简直无处不在,由于信息不对称的存在交易的过程中总有一方因为信息不完整或不同步而对交易产生疑惑、缺乏信心。信息不对称是指在交易过程中由于市场信息误导或信息获取方式不同,交易一方不能即时同步地获得另一方的完全信息,导致其在交易中处于劣势地位从而交易风险升高。或者由于行业性质或法律政策等限制,监督和观测的成本比较高,导致双方在市场交易中的信息数量和种类存在着一定的差异(孙晶和李程,2007)。杜泽超等(2006)指出信息不对称会产生两个问题:道德风险和逆向选择。杨立等(2018)讨论了社交网络对于缓解 P2P 借贷信用风险的机制和条件,他们建立了信息不对称理论模型,从事前、事中、事后这三个环节进行分析,研究结果表明社交网络将事前信息获取、事中责任连带、事后违约约束的优势引入交易中能有效缓解信息不对称带来的问题并能够推进利用社交数据进行信用评价的整体发展。由此可见,除了投资者自身对信息的理解和接受程度(顾娟和刘建洲,2004),交易的环境也会造成信息不对称。陈映雪等(2012)学者凭借着微博网络获取了中国城市间网络信息联系数据,研究发现信息不对称对城市格局、社会经济发展都会产生不利的影响,拉大竞争差距。
..............................
第二节 国内外研究现状
一、征信概述、分类及数据来源
征信,取自《左传·昭公八年》:“君子之言,信而有征,故怨远于其身;小人之言,僭而无征,故怨咎及之”(张智富和李寅,2016)。征信又可解释为信用评价,简单来说是对信用风险即违约风险的评估(张玲和张佳林,2000)。按业务对象进行区分,信用评价主要分为企业信用评价以及个人信用评价。一般来说,信用评价的目的在于考核相关申请人或业务对象的信用情况,以便全面了解其在社会经济活动中的还款能力和违约可能性,控制信用风险,进行信用管理(赵昕等,2002)。由专业的权威机构或经过认可的独立机构经过正当途径获取个人或组织的信用信息,进行整理、分析、加工、汇总等,最后将信用结果通过信用分数、信用评级、信用档案等形式传递给社会或各个经济主体等信息使用者。
结合国内外市场中受信者的资信信息来源渠道,按投资主体分类征信机构主要可以分为公共征信机构和私营征信机构(Binici 和 Hutchison,
2018;唐明琴,2012)。唐明琴(2012)指出欧美国家由各国政府、中央银行主导的信贷机构以及国内的中国人民银行征信中心及其接入的各大商业银行、信托公司及金融企业等均为公共征信机构。而私营征信机构则主要为商业性征信公司,多由企业管理和经营,例如美国的 Equifax、TransUnions 和 Experian 三家征信机构以及央行于2018 年 2 月 22 日公布的百行征信有限公司(朱晓磊和姚佳,2008)。私营征信机构在运行的同时也会受到必要的监管。陈茜(2011)根据评估对象的不同,将征信机构分类为企业征信机构、个人征信机构和有关金融产品的征信机构。三类征信机构服务对象明确,分工明细。然而由于市场需求和行业竞争,一些资信机构会同时面向企业和金融产品的评估。
信用评价的传统数据来源主要包括三个部分:(1)个人身份信息,包括个人自然身份及住房、收入、工作单位等反映家庭、工作等情况的信息,以便获得其联系方式和第一手信用资料(Guo 等,2016;李伟超,2013);(2)个人信贷档案,主要记录与金融机构交易形成的信贷关系,如银行记录的借贷历史、信用卡还款记录等,以及在事业单位、政府部门等发生的违约档案,例如作弊记录、处分记录等(Carneiro 等,2017;李伟超,2013);(3)社会公共数据:包括交通、医疗、通信、慈善等方面的信用记录(丁伟等,2016;王晶晶等,2018)。随着互联网的普及,征信范围逐渐从传统征信过渡到互联网征信和大数据征信。吴晶妹(2014)提出网上的一切数据都是信用,互联网征信本质上是一个“大数据”概念,用海量的数据捕捉信用,通过信用行为状况来描述综合信用,判断用户的可信度和交易偿还能力。电子商务与互联网金融的发展,线上交易数据、P2P 平台的借贷数据以及社交网站的社交数据等都可以用做信用评价,多样化的数据使金融机构能够更全面更准确地了解客户的信用(Huang,2017;Ma 和 Wang,2016)。
...............................
第三章 基于精细加工可能性模型的信用研究 ............................ 18
第一节 社交理论介绍 ............................. 18第二节 行为模型及假设建立 .......................... 20
第三节 数据来源及计量建模 ............................. 22
第四章 基于 AHP 和模糊综合评价法的个人信用评估 ............................ 32
第一节 相关方法、模型介绍 ................................ 32
第二节 基于社交数据的个人信用评价及实例验证 .......................... 34
第三节 本章小结 ....................... 42
第五章 总结与展望 ............................. 43
第一节 主要结论及意义 ............................ 43
第二节 不足与展望 .............................. 44
第四章 基于 AHP 和模糊综合评价法的个人信用评估
第一节 相关方法、模型介绍
一、层次分析法
层次分析法(Analytic Hierarchy Process,简称 AHP)是由美国运筹学家 Saaty提出,是一种具有层次性的权重决策分析方法(Saaty,1994)。AHP 将与决策有关的因素分组按层次分为目标层、准则层、方案层等,在此基础上根据变量特性对非定量变量作定量分析。利用 AHP 我们可以把复杂的问题简单化,通过两两比较判断确定对上一层次因素的权重,经过权重合成后得到用于决策因素的重要性排序,从而制定决策和方法。AHP 不仅将定性和定量集于一体,并且可以反映人的主观判断是否有错以便重新调整直至合理。
利用 AHP 确定指标权重的具体步骤大致可以分为以下三步:
(1)构建层次结构模型
在利用 AHP 制定决策的第一步就是构建一个多层次的结构模型,层次间的因素存在着隶属关系或其间相互影响。而模型的层次数则由所要分析问题的总体情况决定,参考问题的重要性和复杂程度,一般可以分为三层。
(2)建立两两相较的判断矩阵
在 AHP 中,通常采用判断矩阵使决策定量化。首先邀请问题所涉及领域内专家对每一层次中的因素重要性进行定量,一般多采用的 1-9 重要性标度法。后根据专家所定分数建立判断矩阵。
.........................
第五章 总结与展望
第一节 主要结论及意义
第一,本文基于 ELM 理论框架构建了行为模型,通过中央路径和周边路径来探讨影响用户社交信用的因素,研究表明社交平台中身份认证与支付意愿对用户信用有显著的影响,而用户的活跃度、受欢迎情况、关注情况等社交关系也在一定程度影响着用户的社交信用。交互作用的结果表明,经过身份认证的微博用户,不用再过多的关注他的活跃程度,这个结果可以减少在信用评价过程中所需要的工作量。同时,代表社交信用的阳光信用分与代表真实信用的芝麻信用分之间的匹配工作,选择分类模型验证阳光信用分的正确分类率证实了社交信用与真实信用之间的同比关系,得出了芝麻信用分的正确分类情况与真实信用成正比的结论,即在个人信用评价研究中,社交数据能够作为真实数据的一部分补充数据。第二,本文通过专家选择出微博用户信用的评价要素,确定综合评价指标并构建微博用户信用评价指标体系,形成了一套微博用户主体信用评估算法。通过案例验证了信用评价指标体系和评估算法是正确可行的,阳光信用分的验证更说明了使用社交数据进行个人信用评价研究的实用性以及本文研究的连贯性。
社交数据是随着用户社交行为即时产生的,通过用户实时的互联网社交数据对用户进行信用评估,能够清晰地了解用户的信用总体情况和变化状态。用户的行为大多是有习惯性的,不易存在刻意伪造的情况。在大数据和互联网金融的热潮下,将随处可见的社交数据作为研究对象,用以评价网络用户的信用,是对社交数据信用评价的发展和探索,证明了社交数据信用评价的发展潜力。
使用社交数据进行个人信用评价研究,如若扩大范围便可以扩展到互联网数据。通过互联网数据进行信用评价是一项潜力巨大的评估任务。它可以利用新兴技术挖掘用户的所有互联网数据从而更全面更多维地评估用户的总体信用情况,并随时监控用户信用的变化。在不侵犯用户隐私的前提下,用户在微博和各种平台上的数据以合法合理的方式使用,可以最大限度地挖掘他们的行为数据,以便更好地利用资源。在信息时代,合理利用大数据获取有用信息,为社会创造价值是值得深入的。随着信贷交易范围的大幅扩大,交易双方之间不可避免地存在信息不对称,给信用评价带来了一些不便。本文的研究结果表明,用户信用可以通过微博平台的行为数据进行评估,有效地减弱信用评分过程中信息不对称带来的负面影响。在线 P2P 平台、小微企业和互联网金融公司均可以使用微博的行为数据来评估借款人或交易者的信用状况。特别是在没有任何信用参考的情况下,本文的研究结果可以极大地帮助这些平台和企业增加信用信息渠道,降低信贷成本。
参考文献(略)