当前位置:网站首页 >> 生活

大数据风控的现状问题及优化路径

时间:2019-04-25 19:12:13 来源:互联网 阅读:1次

大数据已撼动了世界的各个方面,从商业科技到医疗、政府、教育、经济、人文和社会其他各个领域。早在1980年,阿尔文?托夫勒(Alvin Toffler,1980)在《第三次浪潮》一书中就预言大数据将成“第三次浪潮”。奥巴马政府将大数据定义为“未来的新石油”。凯文?凯利(Kevin Kelly,2014)认为所有的生意都是数据生意。2013年互联金融将“大数据”推向了新的高度。金融的核心是风险控制,将风控与大数据结合、不断完善和优化风控制度和体系,对于互联金融企业和传统金融企业而言都同等重要。

一.大数据风控发展迅速,但有效性不佳

在应用层面,金融行业利用大数据进行风控已取得了一定的成效。使用大数据进行风控已成为美国等发达国家互联金融企业的标准配置。

美国Zest Finance公司开发的10个基于学习机器的分析模型,对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行动做出丈量的指标,而这1过程在5秒钟内就能全部完成。

为上商家提供金融信贷服务的公司Kabbage主要目标客户是ebay、Amazon、PayPal等电商,其通过获取这些企业店店主的销售、信用记录、顾客流量、评论、商品价格和存货等信息,以及他们在Facebook和Twitter上与客户的互动信息,借助数据发掘技术,把这些店主分成不同的风险等级,以此来肯定提供贷款金额数量与贷款利率水平。

中国互联金融企业对于大数据风控的运用也如火如荼。

阿里推出了面向社会的信誉服务体系芝麻信誉,芝麻信誉通过分析大量的络交易及行动数据,对用户进行信誉评估,这些信誉评估可以帮助互联金融企业对用户的还款意愿及还款能力做出结论,继而为用户提供相干的金融和经济服务。

腾讯的微众银行推出的“微粒贷”产品,其风控核心就是,通过社交大数据与央行征信等传统银行信用数据结合,运用社交圈、行动特征、交易、基本社会特点、人行征信5个维度对客户综合评级,应用大量的指标构建多重模型,以快速辨认客户的信用风险。

对大数据风控的理论研究尚处于萌芽阶段,本文以“大数据风控”为主题在CNKI数据库进行搜索,与此相干的文献数量可以从侧面反应大数据风控的理论研究现状。

CNKI数据库中以“大数据风控”为主题的文献共46篇。在这些文献中,以报导性的文章较多,重要报纸全文库和特点期刊总共为33篇,占比72%;而理论研究的文章较少,中国学术期刊总库为12篇,占比26%;尚没有CSSCI2014—2015年的来源期刊(如图1)。

图1 CNKI数据库与大数据相干的文献数量和分类

虽然大数据风控在实践上已有所进展,但是其有效性也受到一些挑战。

例如,以大数据风控为基石的P2P平台就频频暴露出各种各样的问题来。对于P2P平台来说,由于其纯线上操作的特点,大数据风控的有效性是决定其经营状况的重要因素,如果大数据风控有效性较差,则面临的坏账压力较大,容易出现提现困难乃至跑路的问题。

贷之家的数据显示,2015年上半年新增问题平台419家,是2014年同期的7.5倍,已超过2014年全年问题平台数量。截至2015年10月底,全国问题平台数积累已达1115家。

2.当前大数据风控有效性不足的缘由分析

一些学者对大数据风控的有效性问题进行了研究。

王强(2015)指出当前个人大数据征信的问题,1是数据的真实性,2是数据搜集的法律障碍,3是坏账的不可预测性问题。

乃至有作者认为大数据风控是无效的,陈宇(2015)援用各种证据认为大数据风控是无效的。

整体而言,当前大数据风控有效性欠佳的缘由主要有以下几个方面:

(1)数据的质量问题

当前大数据风控的有效性欠佳,其重要缘由就是数据的真实性不高,包括社交数据和交易数据两个方面。

1.社交数据的真实性问题

美国lending club和facebook合作取得社交数据,在中国宜信也曾大费周折的收集借款人的社交数据,二者得出的结论都是社交数据根本就不能用。美国很多大数据征信公司的信息错误率高达50%,垃圾进、垃圾出。

2.交易数据的真实性问题。

当前许多电商平台的刷单现象非常严重,这将导致交易数据的严重失真。随着购的火爆,有关电商平台“刷单”的报导屡见报端。

电商“刷单”有两种方式,一种是商家找所谓的消费者进行“刷单”。卖家买快递单号,其收件人和寄件人与实际的买家、卖家不一致。

另一种是快递公司发空包,但快递公司并未完成配送,而帮助商家完成平台上的物流信息。

(2)大数据风控的理论有效性问题

从IT技术层面论证大数据风控的实践性案例已很多,但是在经济金融的理论层面,大数据风控还面临一些问题需要解决。

1.金融信誉与社会信誉的相关性不确定

目前大数据主要来源于互联,而人们在络中的表现并不能完全反应其真实的一面。相同的人群在不同场合出现的特点是不一样的,尤其是目前人们上、线下割裂的状态,其行为方式常常会出现强烈的反差。

例如有些人不善交际,却将自己做的美食展现在微博上,吸引大量关注,粉丝暴增。因此络并不能确切地证明某人的社交圈子,也就是说互联的数据很难还原用户现实中的信息。

2.大数据对“黑天鹅”事件的滞后性

在现实世界,总会出现不可预测的“黑天鹅”事件,一旦出现则有可能冲击大数据风控模型的基本假定,进而影响大数据风控的有效性。大到美国的次贷危机,小到个人意外事件的产生,在某种程度上大数据风控是没法预测的,但这些事件的产生,对宏观经济和微观主体都会产生重大的影响。

例如,2008年美国次贷危机后产生了一种“策略性违约”行动——贷款主体本身有能力还款,但是其在房价远低于贷款总额的时候,重新购买一套房子,并对之前的房贷断供,贷款者可以此方法进行“套利”。

虽然此类违约者会因此有不良信誉记录,但是这对信誉报告的影响有限,由于其他的债务定期偿还。而大数据对这类突变事件的预测能力则非常有限。

(3)大数据搜集和使用的制度问题

在数据搜集和使用的进程中也面临着合法使用的问题。如何高效、适度地开发和使用大数据,不仅仅是一个技术问题,也是一个社会问题,这些泄露的数据大量流入数据黑市,造成了用户安全、企业安全甚至国家安全方面的连锁反应。数据的搜集和使用在很多时候都没有征得数据生产主体的同意,这导致了数据的滥用和隐私的泄漏。

近年来,个人数据泄漏事件频频发生,因个人数据泄漏而造成损失的屡见报端。猎豹移动安全实验室发布的《2015年上半年移动安全报告》显示,截至2015年上半年,猎豹共监测到496起数据泄露事件,影响超过544万人。2015年10月19日,乌云发布消息称,易的用户数据库疑似泄漏。

图2 年国内外数据泄密情况

资料来源:上海汉均信息技术有限公司《2005—2014年全球泄密事件分析报告》

数据安全问题也将越来越多的企业推向风口浪尖。

上海汉均信息技术有限公司发布的《2005—2014年全球泄密事件分析报告》显示,10年间,全球泄密事件中,我国泄密事件数量占比为58.5%,其中高频发地域主要是东部沿海经济较发达、产业格局以高技术含量为主的1二线城市(如图2)。

Verizon发布《2015年数据泄露调查报告》,报告覆盖95个国家,其中有61个报告了问题,触及79790个安全事件(Security Incident),超过2000个(2122个)确认数据泄露(Data Breach)。

三.提高大数据风控有效性的路径

虽然大数据风控的有效应用尚处在诸多障碍,但这并不能成为大数据风控无效的理由。由于对数据这个资源的挖掘尚处于初级阶段,在消除障碍、解决问题中前行,是大数据风控发展的一定趋势。有效扫除当前大数据风控的障碍需要各方面的共同努力,其中金融企业、金融研究部门和政府监管部门的角色特别重要。

对于金融企业而言,要从基础数据上保证客户数据的多样化、连续性和实时性,确保数据真实可靠。

对金融研究者而言,可从经济学、数学等多个角度综合论证大数据风控的有效性,为大数据风控提供理论支持。

对政府监管部门而言,需要从法律制度、会计制度等方面进行建设,构建数据公道运用的良好环境体系。

(1)对于金融企业而言,要构建多样化、连续性和实时性的基础数据

1.多维度的搜集数据,互联互通,打破数据的孤岛

美国征信系统的完善是由于美国政府对其具有的大数据资源的开放程度日益透明化。

目前我国的大数据风控系统还没有实现互通互联,阿里、银联、平安、腾讯和众多的P2P公司,都是各自为政,P2P公司拿不到央行的数据,几家大的互联平台在相干大数据的分享上彼此也未互通有无。

因此,各金融企业要建立互联互通机制,打破数据孤岛,从而能多维度地搜集数据,确保数据之间能够相互验证。

2.从供应链交易环节获取数据

获得真实数据的途径就是要切入客户的交易环节,尤其是稳定可持续的交易环节,即供应链。

一方面,经过了几十年的发展,当前的供应链都有一套完整上下游进入和退出机制,数据的真实性对核心企业而言至关重要,因此这些数据的质量非常。

另一方面,这些数据和数据维度对供应链中的企业评价是可靠的,金融企业可以此为基础,加上本身的风险控制经验,构建一套全新的基于数据的信誉评价机制。

3.积极布局“物联+”

物联覆盖了产品生产、交易和使用的环节,因而互联只是物联的一部分。在物联下,不但要取得交易环节的数据,更重要的是获取生产环节和使用环节的数据。

因而,金融企业要积极布局“物联+”,为取得更为全面的数据打下基础。例如,企业机器运行数据,可以搜集客户汽车驾驶数据,可穿着设备的身体状态数据,等等。这些数据都是大数据风控不可或缺的部分。

(二)对金融研究部门而言,可从经济、金融等多个角度综合论证大数据风控的有效性,为大数据风控提供理论支持

当前对于大数据风控模型的构建大多是从技术的角度探讨的。但是,从经济、金融角度进行的探讨亟待加强,不同的经济假定会使模型推导的结果产生截然不同的变化。因此,从经济、金融等角度对大数据风控有效性的研究就显得很有必要了。比如大数据风控如何顺应经济周期的变化,如何从统计上论证过去的数据对于未来行动判断的准确性,如何解决道德风险所带来的不确定性。例如,唐时达(2015)提出要把数据提升至与传统抵质押品同等重要的高度,建立“数据质押”风控体系。

(三)对政府监管部门而言,要推动和完善与数据相关的制度建

1.法律制度的建设,对数据的搜集和使用予以法律上的保护

我国对数据保护的制度性举措散见于多部法律中,如宪法、刑法、侵权法等,多是以保护个人隐私、通讯秘密等形式出现,尚缺少一部数据保护的专门性法律。这导致了数据的法律边界不明,数据保护法律的操作性不强、数据保护执法机制滞后等问题,制约了数据搜集和应用的发展。

对此,理想的状态是出台一部《信息保护法》。在完善个人信息保护法律制度的道路上,应出台《个人信息保护法》,明确国家机关、商家和其他法人、自然人掌握个人信息的边界和使用的范围[]。齐爱民、盘佳(2015)认为要构建数据主权和数据权法律制度[8]。2014年人民法院颁布的《关于审理侵害信息络传播权民事纠纷案适用法律若干问题的规定》(以下简称《规定》)就是此领域的进展之一,《规定》首次明确了个人信息保护的范围。

2.会计制度建设,对数据资产予以明确的计量

随着数据重要性的提升,数据列入企业资产负债表只是时间问题,数据将和土地、劳动力和资本一样,成为一种生产要素(Viktor Mayer-Sch?nberger,2013)。愈来愈多的理论界和实务界的研究者都倾向于认为数据将成为个体的财产和资产。

2012年达沃斯世界经济论坛发布的《大数据,大影响》报告认为,数据已成为一种新的经济资产种别。

姜建清在2014达沃斯世界经济论坛上发表观点,其认为个体的数据其实就是个体财产的一部分,没有经过本人同意不应当被滥用。

因此,需要建立相应的会计制度对数据价值进行科学有效的评估。有学者对此进行了初步研究。例如,刘玉(2014)从会计的角度对数据的资产可行性进行了分析,探讨了数据资产的计量方法,研究了大数据资产的折旧、表露等问题。

文丨巴曙松;侯畅(东北大学工商管理学院);唐时达(北京大学光华管理学院博士后流动站)

参考文献:

[1]王强“.垃圾进垃圾出”:大数据征信的难题[EB/OL].财新,.

[2]陈宇.风吹江南之互联金融[M].上海:东方出版中心,2014,(6):.

[3]梁宵.企业数据安全“乌云”密布:难以估计的“未来”危机[N].中国经营报,(6).

[4]本报朱剑红.打破信用信息“孤岛”(政策解读)[N].人民,(2).

[5]唐时达,李智华,李晓宏.供应链金融新趋势[J].中国金融,2015,(10):.

[6]叶文辉.大数据征信机构的运作模式及监管对策——以阿里巴巴芝麻信誉为例[J].国际金融,2015,(8):.

[7]本报见习韩天琪.个人信息保护圈如何划[N].中国科学报,(5).

[8]齐爱民,盘佳.数据权、数据主权的确立与大数据保护的基本原则[J].苏州大学学报(哲学社会科学版),2015,(1):.

[9]刘玉.浅论大数据资产的确认与计量[J].商业会计,2014,(18):.

来源:《金融理论与实践》 2016年02期(本文仅代表作者观点)

男小便的时候肚子刺痛感
如何缓解鼻塞头痛
阴部潮湿吃什么药来调理呢

相关文章

一周热门

热点排行

热门精选

Copyright (c) 2011 八零CMS 版权所有 Inc.All Rights Reserved. 备案号:京ICP0000001号

RSS订阅网站地图