您的当前位置:首页大数据技术在金融行业风险控制中的应用探讨

大数据技术在金融行业风险控制中的应用探讨

来源:乌哈旅游
大数据技术在金融行业风险控制中的应用探讨

作者:俞 枫 苑 博 叶小同 冯必成 侯 秦 来源:《新经济》 2016年第24期

国泰君安信息技术部 俞枫 苑博 华东理工大学商学院 叶小同上海华腾软件系统有限公司 冯必成 侯秦

摘 要:在大数据时代,数据的重要性毋庸置疑,是企业战略资产以及企业创新的核心驱动力和竞争力,对各行各业都有深远的影响,金融行业尤甚。如何利用大数据创新提高金融行业的风险控制成为时下关注的话题。本文介绍了大数据征信的概念、特征,以及当下大数据相关技术并提出了其在金融行业风险控制的应用建议。

关键词:大数据 金融业 风险控制 征信 客户画像

基金资助:上海市经济和信息化委员会专项资金,资金项目编号201502021。

一、引言

“大数据”的概念是麦肯锡公司在2011 年5 月发布的报告中首次提及的,报告中指出:“数据已经渗透到当今每一个行业和业务职能领域,引起了社会各行业的强烈关注”。大数据具有数据量大、种类多样、速度快、价值密度低、真实性这五个特征。这五个特征反映了大数据巨大的商业价值,同时也决定了对其的处理方式与特殊要求,大数据技术应运而生。大数据技术是一种高效的处理方法,能够通过更加快速、精准的方式挖掘并提升大数据的价值,能够满足各行各业对数据处理的需求。

在大数据时代,数据的重要性越来越凸显,逐渐成为企业战略资产以及企业创新的核心驱动力和竞争力,引起了各个行业的变革,银行业同样如此。大数据的应用促进商业银行全面调整经营理念、组织架构、业务流程、管理模式、IT 架构等,使得自身核心竞争力不断增强,企业的组织绩效以及资本的运营效率不断提升,盈利能力也不断提高。具体说来,大数据应用能够使得商业银行业务发展空间不断拓展,同时加速产品创新,客户服务水平与商业银行管理水平也得到很好地提升。商业银行由于经营多年,其本身其实已拥有大数据,大数据,只是缺少的只是技术和思维。换而言之,只要有大数据分析技术并具备应用思维,就能使得自身的核心竞争力不断提升。但是大数据在给银行带来机遇的同时也带来了挑战。大数据时代到来,传统商业银行在信息处理和交易成本上的优势弱化了,商业银行的竞争对手越来越多,并且传统的金融模式也逐渐转为了互联网金融模式,主要表现为金融服务脱媒化、渠道虚拟化、服务个性化、经营模式生态化、决策数据化等几大特征。中债资信评估有限责任公司发布了《2016 年宏观经济展望与24 大行业信用展望报告》指出:伴随着去杠杆、去产能的持续推进,风险将进一步释放,2016 年,银行业“不良”规模及增速仍有可能上升。不良率上升除了经济下行导致的逾期风险上升的原因之外,银行在风险控制中存在漏洞和缺陷也是重要原因。在这种背景下,利用大数据征信创新来提高银行等金融行业的风险把控受到越来越多的关注。

二、大数据征信及相关技术介绍

1、大数据征信

征信指的是通过对自然人、法人以及其他组织的信用信息依法进行收集、整理、保存、加工等工作,形成信用报告,并对外提供信用评估、信息咨询等服务,从而判断信用风险,进行

信用管理的行为。信用是金融的核心,征信体系在现代金融体系运行中起着越来越大的作用。大数据征信指的是基于大数据技术对征信评价模型和算法进行重新设计,并且通过对获得的多维度的信用信息进行考察,从而产生对个人、企业以及其他社会组织的信用评价。大数据征信数据主要有以下几个来源:网络上的公开数据、用户授权的数据以及第三方合作伙伴提供的数据。同时,在互联网时代,电商活动、第三方支付平台建立了宝贵的信用资源,能够从用户的网购、微博等活动痕迹中提取信用信息,从而给出信用等级的参考,完善大数据的积累,像阿里的芝麻信用、京东白条信用分等级等都是根据用户的购买、借贷行为给出评分。

大数据征信有着覆盖范围广泛、数据源丰富、征信信息高维、

实时性强、预测准确、可以快速迭代、量化结果更准确的特征。它覆盖了广泛的人群,运用全新的信用评估体系,采用非传统结构的信用信息数据(不单单包括现金流等财务状况数据,还包括地址、社会关系行为数据如用户在因特网上的交易行为等半结构化、非结构化数据)。大数据征信将更多信用记录以外的信息纳入征信体系,用更多维度的信息来刻画信用。

2、大数据相关技术

随着云计算技术的不断发展,云计算产品越来越成熟、廉价、可用,为大数据提供基础保障,同时基于大数据的管理工具也越来越多,例如Hadoop 工具、IBM 的 “大数据平台”架构、HP 的HAVEn 等都已经在很多领域广泛使用。大数据搜索工具也呈现多样化发展,在免费产品方面有斯坦福大学设计的DataWrangler、Google Refine、JavaScript InfoVis Toolkit 等等,在付费软件方面有Tableau(用于海量多源数据查询、分析、展现,是传统数据库查询速度的100 倍)、QlikTech(用于大数据的商业智能方面,无限制挖掘数据)、DataSift(用于大数据的社交数据平台,每秒挖掘12 万条Twitter 数据,向大规模用户提供Twitter 数据分析服务)等等。

大数据技术的应用也越来越广泛。在技术层面,通过利用大数据图分析与流处理技术,能够对历史数据、一段时间窗口的信息流和触发计算的事件进行快速统计,并且与模型匹配,在百毫秒级别内进行响应作出判断;处理非结构化数据,能够整合图像、语音、文本、网页、JSON、XML 等非结构化数据,转化成结构化字段等。在实际应用方面,江苏银行基于Hadoop 打造了面向全行的开放共享大数据平台,并且推出了个人消费贷款产品“享e融”和小微金融贷款产品“税e 融”;招商银行利用大数据分析进行精准营销,对客户的购物、上网习惯等进行精准细分,推出“凡客卡”、“魔兽卡”等等;摩根大通为了防止诈骗,引入了信用卡和借记卡数据在业务交易中进行检验等。

三、设计思路

金融行业加强风险控制应当加强应用大数据技术,创新征信体系,从而完善风险监控。本文从以下四个角度提出了设计思路。

1、建立信用信息服务平台

首先要建立一个统一的信用信息服务平台,该平台包含多维度信用信息,基于此平台信用信息得以共享共建。平台的数据主要来源于以下四个渠道: 一是政府部门,包括来自质检、环保、工商、税务等部门的企业信用数据,还包括来自司法、税务等部门的个人信用数据,如个人身份、行政处罚、法院判决、纳税等信息;二是央行,包括央行征信系统中的金融信用信息,如企业、个人信贷交易等;三是互联网大数据平台,包括电商、支付、社交、生活服务类等互联网大数据信息,如芝麻信用、京东白条等平台;四是其他信用数据平台,这里主要指如物流企业、外贸企业等的第三方的信用服务平台。基于以上四个渠道获得的信用信息数据,利用大数据技术进行整合,汇聚政府部门数据、央行征信数据、互联网大数据等信用信息。

2、构建征信视图,进行客户画像

通过已建立的信息服务平台,并结合基于爬虫等技术手段获得的舆情信息,利用半结构和非结构化数据的加工分析技术,将信用信息数据转化成结构化数据,并在结构化数据的基础上进行加工整合,构建全面的客户征信视图,进行客户画像,从而实现对客户的360 度画像标签。客户画像可以分为个人客户画像和企业客户画像,其中个人客户画像包括性别、年龄、健康状况、职业、婚姻、文化水平、收入等人口统计学特征数据,还包括个人消费能力、兴趣、风险厌恶情况等数据,而企业客户画像涉及企业生产经营的各个环节,包括生产、运营、销售、客户、财务、流通等数据,还包括相关产业链的上下游数据。

客户画像还可以分为立体画像和专业画像。其中立体画像指的是通过数据挖掘和关联分析技术,以多维标签组合对客户特征进行全面描绘,建立一个以客户为维度,综合消费、投资、支付、信贷等信息的立体画像。对立体画像背后内在关联的挖掘,对于设计监控模型、管理交叉风险、实行精准营销等决策给予了强有力的信息支撑。专业画像指的是为了实现某种管理目的以及业务需求,以大数据和标签组合化思路深入剖析形成的特定画像,如营销画像、风险画像等。专业画像能够应用到控制风险、维护客户关系、精准营销等众多领域,使得诸如银行等机构能够准确对客户的交易行为进行预测、迅速洞察并有效防范潜在的风险、及时抓住营销机会等等。

需要注意的是,客户画像并不是一成不变的,会伴随着客户行为以及交易习惯的改变而进行动态的调整。因此,为了保证准确性,需要对客户画像进行管理,一般采用系统自动更新与人工定期修正相结合的方式。

3、建立风险控制模型

风险控制模型是能够量化欺诈风险的模型,是一种智能模型。该模型以可观察到的交易特征作为变量,利用计算出来的分值来代表交易的欺诈风险,并且在此基础上将欺诈风险分为几个不同等级。通过风险控制模型与客户画像相结合,从客户进行交易的第一个行为就进行分析,以对应的风险分数赋予客户的每一个动作,为反交易欺诈,从而能够有效控制风险进行科学决策,对欺诈风险高的交易可以据此形成预警并展开调查。此外,在风险模型的基础上,结合客户画像,可以在并行数据处理技术环境下灵活运用R 语言等工具,自动挖掘客户担保圈的关系,对预警担保圈的形成进行自动标识。

4、智能决策与业务应用流程结合

在信用信息服务平台数据的基础上,将征信视图、客户画像与开发设计出的风险控制模型以及相应采取的业务策略,融入到现有的作业流程中,与实际业务相结合,如风险控制、客户细分、信息快速推介、精准营销等等,从而对传统的作业模式加以改进,实现创新。

作者简介:

俞 枫 (1969.03-),男,上海,国泰君安信息技术部总经理,教授级高级工程师。

苑 博 (1982.07-),男,吉林,国泰君安信息技术部大数据平台总监。

叶小同 (1993.12-),男,江苏南通,华东理工大学商学院硕士研究生。

冯必成 (1976.09-),男,上海,上海华腾软件系统有限公司技术研发总监,高级工程师。

侯 秦 (1969.11-),男,陕西省渭南市,上海华腾软件系统有限公司市场主管,工程师。

因篇幅问题不能全部显示,请点此查看更多更全内容