大数据技术在金融行业风险控制中的应用探讨
来源:乌哈旅游
新经济2016年12月(下) 大数据技术在金融行业风险控制中的应用探讨 国泰君安信息技术部俞枫苑博 华东理工大学商学院上海华腾软件系统有限公司 冯必成侯秦 I1-1-,1,同 摘要:在大数据时代,数据的重要性毋庸置疑,是企业战略资产以及企业创新的核心驱动力和竞争力,对各行各业都有深远的 影响,金融行业尤甚。如何利用大数据创新提高金融行业的风险控制成为时下关注的话题。本文介绍了大数据征信的概念、特征,以 及当下大数据相关技术并提出了其在金融行业风险控制的应用建议。 关键词:大数据金融业风险控制征信客户画像 基金资助:上海市经济和信.g4e_,委员会专项资金,资金项目编号201502021。 引言 “大数据”的概念是麦肯锡公司在201 1年5月发布的报告 中首次提及的,报告中指出:“数据已经渗透到当今每一个行业 和业务职能领域,引起了社会各行业的强烈关注”。大数据具有 数据量大、种类多样、速度快、价值密度低、真实性这五个特征。 这五个特征反映了大数据巨大的商业价值,同时也决定了对其的 处理方式与特殊要求,大数据技术应运而生。大数据技术是一种 高效的处理方法,能够通过更加快速、精准的方式挖掘并提升大 数据的价值,能够满足各行各业对数据处理的需求。 在大数据时代,数据的重要性越来越凸显,逐渐成为企业战 略资产以及企业创新的核心驱动力和竞争力,引起了各个行业的 变革,银行业同样如此。大数据的应用促进商业银行全面调整经 营理念、组织架构、业务流程、管理模式、IT架构等,使得自 身核心竞争力不断增强,企业的组织绩效以及资本的运营效率不 断提升,盈利能力也不断提高。具体说来,大数据应用能够使得 商业银行业务发展空间不断拓展,同时加速产品创新,客户服务 水平与商业银行管理水平也得到很好地提升。商业银行由于经营 多年,其本身其实已拥有大数据,大数据,只是缺少的只是技术 和思维。换而言之,只要有大数据分析技术并具备应用思维,就 能使得自身的核心竞争力不断提升。但是大数据在给银行带来机 遇的同时也带来了挑战。大数据时代到来,传统商业银行在信息 处理和交易成本上的优势弱化了,商业银行的竞争对手越来越 多,并且传统的金融模式也逐渐转为了互联网金融模式,主要表 现为金融服务脱媒化、渠道虚拟化、服务个性化、经营模式生态 化、决策数据化等几大特征。中债资信评估有限责任公司发布了 (<2016年宏观经济展望与24大行业信用展望报告》指出:伴随 着去杠杆、去产能的持续推进,风险将进一步释放,2016年,银 一、行业“不良”规模及增速仍有可能上升。不良率上升除了经济下 行导致的逾期风险上升的原因之外,银行在风险控制中存在漏洞 和缺陷也是重要原因。在这种背景下,利用大数据征信创新来提 高银行等金融行业的风险把控受到越来越多的关注。 二、大数据征信及相关技术介绍 1、大数据征信 征信指的是通过对自然人、法人以及其他组织的信用信息依 法进行收集、整理、保存、加工等工作,形成信用报告,并对外 提供信用评估、信息咨询等服务,从而判断信用风险,进行信用 管理的行为。信用是金融的核心,征信体系在现代金融体系运行 中起着越来越大的作用。大数据征信指的是基于大数据技术对征 信评价模型和算法进行重新设计,并且通过对获得的多维度的信 用信息进行考察,从而产生对个人、企业以及其他社会组织的信 用评价。大数据征信数据主要有以下几个来源:网络上的公开数 据、用户授权的数据以及第三方合作伙伴提供的数据。同时,在 互联网时代,电商活动、第三方支付平台建立了宝贵的信用资源, 能够从用户的网购、微博等活动痕迹中提取信用信息,从而给出 信用等级的参考,完善大数据的积累,像阿里的芝麻信用、京东 白条信用分等级等都是根据用户的购买、借贷行为给出评分。 大数据征信有着覆盖范围广泛、数据源丰富、征信信息高维、 实时性强、预测准确、可以快速迭代、量化结果更准确的特征。 它覆盖了广泛的人群,运用全新的信用评估体系,采用非传统结 构的信用信息数据(不单单包括现金流等财务状况数据,还包括 地址、社会关系行为数据如用户在因特网上的交易行为等半结构 化、非结构化数据)。大数据征信将更多信用记录以外的信息纳 入征信体系,用更多维度的信息来刻画信用。 2、大数据相关技术 接影响银行的盈利以及发展。 对于影响最大的第一主成分,得分最高的是兴业银行,其次 是中信银行,最末的是广发银行。说明在这十大银行中,盈利性 能力最强的是兴业银行,其次是中信银行,而对于广发银行的盈 利性能力得分为负值,说明要想更好地成绩,其盈利能力和资产 质量有待提高。 [4]杨家才.商业银行竞争力及其评价研究.[J]_金融研究 2008.12. [5]曹永栋、陆跃祥.城市商业银行竞争力指标体系及其对策 设计.(J】.财政金融.2012.1. [6]楼裕胜. 商业银行竞争力评价方法研究》.[M].浙江大 学出版社.2007. [7]于春红、徐建楠.商业银行竞争力的综合评价研究.[J]. 参考文献 …邵新宏、朱涛.我国商业银行竞争力及其影响因素的实证 分析.[J】.统计观察2006.5. 中国经贸. 【8]胡章宏. 中国商业银行竞争方略一一现代银行家致胜之 道》.[M].北京:经济管理出版社.1996. 作者简介: 王肖云 (1991.09一),性别:女,山东滨州人,现就读 于南京财经大学统计学专业,硕士研究生,研究方向:经济统计。 [2]迟国泰、郑杏果、杨中原.基于主成分分析的国有商业银 行竞争力评价研元[N].管理学报2009.2. 【3】焦瑾璞. 商业银行国际竞争力研究》.[M].中国时代经 济出版社.2001. 52 金融观察 随着云计算技术的不断发展,云计算产品越来越成熟、廉价、 行为以及交易习惯的改变而进行动态的调整。因此,为了保证准 可用,为大数据提供基础保障,同时基于大数据的管理工具也越 确性,需要对客户画像进行管理,一般采用系统自动更新与人工 来越多,例如Hadoop工具、IBM的“大数据平台”架构、HP的 定期修正相结合的方式。 HAVEn等都已经在很多领域广泛使用。大数据搜索工具也呈现多 3、建立风险控制模型 样化发展,在免费产品方面有斯坦福大学设计的DataWrangler、 风险控制模型是能够量化欺诈风险的模型,是一种智能模 Google Refine、JavaScript InfoViS Toolkit等等,在付费软 型。该模型以可观察到的交易特征作为变量,利用计算出来的分 件方面有Tableau(用于海量多源数据查询、分析、展现,是传 值来代表交易的欺诈风险,并且在此基础上将欺诈风险分为几个 统数据库查询速度的i00倍)、QlikTech(用于大数据的商业智 不同等级。通过风险控制模型与客户画像相结合,从客户进行交 能方面,无限制挖掘数据)、DataSift(用于大数据的社交数据 易的第一个行为就进行分析,以对应的风险分数赋予客户的每一 平台,每秒挖掘12万条Twitter数据,向大规模用户提供 个动作,为反交易欺诈,从而能够有效控制风险进行科学决策, Twitter数据分析服务)等等。 对欺诈风险高的交易可以据此形成预警并展开调查。此外,在风 大数据技术的应用也越来越广泛。在技术层面,通过利用大 险模型的基础上,结合客户画像,可以在并行数据处理技术环境 数据图分析与流处理技术,能够对历史数据、一段时间窗口的信 下灵活运用R语言等工具,.自动挖掘客户担保圈的关系,对预警 息流和触发计算的事件进行快速统计,并且与模型匹配,在百毫 担保圈的形成进行自动标识。 秒级别内进行响应作出判断;处理非结构化数据,能够整合图像、 4、智能决策与业务应用流程结合 语音、文本、网页、JSON、XML等非结构化数据,转化成结构化 在信用信息服务平台数据的基础上,将征信视图、客户画像 字段等。在实际应用方面,江苏银行基于Hadoop打造了面向全 与开发设计出的风险控制模型以及相应采取的业务策略,融入到 行的开放共享大数据平台,并且推出了个人消费贷款产品“享e 现有的作业流程中,与实际业务相结合,如风险控制、客户细分、 融”和小微金融贷款产品“税e融”;招商银行利用大数据分析 信息快速推介、精准营销等等,从而对传统的作业模式加以改进, 进行精准营销,对客户的购物、上网习惯等进行精准细分,推出 实现创新。 “凡客卡”、“魔兽卡”等等;摩根大通为了防止诈骗,引入了 信用卡和借记卡数据在业务交易中进行检验等。 参考文献: 三、设计思路 1、方方. “大数据”趋势下商业银行应对策略研究【J].新 金融行业加强风险控制应当加强应用大数据技术,创新征信 金融,2O12,12:25—28. 体系,从而完善风险监控。本文从以下四个角度提出了设计思路。 2、马杰.大数据征信应用于互联网金融风控研究[D].对外 1、建立信用信息服务平台 经济贸易大学,201 5. 首先要建立一个统一的信用信息服务平台,该平台包含多维 3、刘新海.阿里巴巴集团的大数据战略与征信实践[J】.征 度信用信息,基于此平台信用信息得以共享共建。平台的数据主 信,2014,10:1 0-14+69. 要来源于以下四个渠道:一是政府部门,包括来自质检、环保、 4、刘新海,丁伟.大数据征信应用与启示一一以美国互联网 工商、税务等部门的企业信用数据,还包括来自司法、税务等部 金融公司ZestFinance为例[J】.清华金融评论,2014,1O:93-98. 门的个人信用数据,如个人身份、行政处罚、法院判决、纳税等 5、刘芸,朱瑞博.互联网金融,小微企业融资与征信体系 信息;二是央行,包括央行征信系统中的金融信用信息,如企业、 深化[J].征信,2014(2):31-35. 个人信贷交易等;三是互联网大数据平台,包括电商、支付、社 6、卢芮欣.大数据时代中国征信的机遇与挑战[J].金融理 交、生活服务类等互联网大数据信息,如芝麻信用、京东白条等 论与实践,2O15,02:103—107. 平台;四是其他信用数据平台,这里主要指如物流企业、外贸企 7、孙浩.金融大数据的挑战与应对[J].金融电子化, 业等的第三方的信用服务平台。基于以上四个渠道获得的信用信 2012(7):51-52. 息数据,利用大数据技术进行整合,汇聚政府部门数据、央行征 8、王秋香.大数据征信的发展、创新及监管【J].国际金 信数据、互联网大数据等信用信息。 融,2015,09:6O-66. 2、构建征信视图,进行客户画像 9、蔚赵春,凌鸿.商业银行大数据应用的理论、实践与影响 通过已建立的信息服务平台,并结合基于爬虫等技术手段获 [J].上海金融,201 3,09:28—32+I 16 得的舆情信息,利用半结构和非结构化数据的加工分析技术,将 l0、吴晶妹.未来中国征信:三大数据体系[J].征信,201 3 信用信息数据转化成结构化数据,并在结构化数据的基础上进行 (1):4-I2. 加工整合,构建全面的客户征信视图,进行客户画像,从而实现 1 1、叶文辉.大数据征信机构的运作模式及监管对策一一以 对客户的360度画像标签。客户画像可以分为个人客户画像和企 阿里巴巴芝麻信用为例[J].新金融,2015,07:60-63. 业客户画像,其中个人客户画像包括性别、年龄、健康状况、职 1 2、D.Agrawa1.et a1.Chal1enges and 0pportunities with 业、婚姻、文化水平、收入等人口统计学特征数据,还包括个人 Big Data[R].Cyber Center Technica1 ReportS,February 消费能力、兴趣、风险厌恶情况等数据,而企业客户画像涉及企 2O12. 业生产经营的各个环节,包括生产、运营、销售、客户、财务、 1 3、Howe D,Costanzo M,Fey P,et a1.Big data:The 流通等数据,还包括相关产业链的上下游数据。 future of biocurat ion[J】.Nature,2008,455(7209):47-50. 客户画像还可以分为立体画像和专业画像。其中立体画像指 的是通过数据挖掘和关联分析技术,以多维标签组合对客户特征 作者简介: 进行全面描绘,建立一个以客户为维度,综合消费、投资、支付、 俞枫 (1969.03.),男,上海,国泰君安信息技术部总 信贷等信息的立体画像。对立体画像背后内在关联的挖掘,对于 经理,教授级高级工程师。 设计监控模型、管理交叉风险、实行精准营销等决策给予了强有 苑博 (1982.07.),男,吉林,国泰君安信息技术部大 力的信息支撑。专业画像指的是为了实现某种管理目的以及业务 数据平台总监。 需求,以大数据和标签组合化思路深入剖析形成的特定画像,如 叶小同(1993.12一),男,江苏南通,华东理工大学商学 营销画像、风险画像等。专业画像能够应用到控制风险、维护客 院硕士研究生。 户关系、精准营销等众多领域,使得诸如银行等机构能够准确对 冯必成 (1976.09一),男,上海,上海华腾软件系统有限 客户的交易行为进行预测、迅速洞察并有效防范潜在的风险、及 公司技术研发总监,高级工程师。 时抓住营销机会等等。 侯秦 (1969.11.),男,陕西省渭南市,上海华腾软件 需要注意的是,客户画像并不是一成不变的,会伴随着客户 系统有限公司市场主管,工程师。 53