陶光明:风险管理中的科技应用​
字号

大数据时代已经来临,数据已渗透到每一个行业、每一个业务职能领域,成为相关组织最重要的资产。与此同时,大数据、人工智能被各企业抢滩登陆,产业格局正在发生巨变,互联网巨头对金融服务的冲击日益显现。面对当今之变局,在银行的风险管理中,如何利用金融科技迎接挑战?

痛点凸显:传统风险管理弊端亟待解决

近几年,国内外经济金融形势动荡反复,金融市场反应剧烈,国家产业行业政策不断调整,各类银行客户的经营风险和道德风险更加复杂多样,信贷风险管理的难度不断加大,传统风险管理的弊端集中暴露出来。

一是银行缺乏有效的风险信号采集工具。目前,银行客户的财务报表、生产经营情况等关键信息采集,主要依赖分支机构对客户的现场调查和客户提供。由于客户财报数据滞后性、财报粉饰、客户隐瞒经营实质或信息披露缺失等信息不对称因素,再加上客户经营跨区域化、交叉化,银行凭借有限的人力难以对信贷业务的贷前、贷中和贷后风险信息进行有效收集和精准识别。

二是客户识别困难。随着企业融资产品多样化,客户发展集团化,一些企业为了获得更多的融资,不仅本身融资产品更加多元化,同时通过关联企业尤其是隐性关联企业进行融资。而银行传统的风险管理手段,很难对企业之间的关联关系进行识别,导致企业过度融资的可能性很大,银行风险管理措施也很难落实。一旦企业发生风险就会涉及巨额融资,从而给银行带来重大损失。

三是传统风险模型出现瓶颈。国内商业银行在客户授信审批、评级、风险预警管理等传统模型的运用过程中,主要依赖专家经验、黑名单或通过人工方式制定监测规则等手段,当客户申请或交易信息与规则匹配时则触发相应业务策略。此模式局限性在于:枚举场景有限,指标维度单一,精准度不足,无法对客户风险事件进行全面覆盖。与此同时,传统模型的升级换代周期一般较长,指标未能灵活调整,客户会针对已有的规则进行回避,导致银行风险预警模型效果降低。

四是信息难以有效整合和利用。与客户及其风险相关的信息,很多都是非结构化的,其中蕴藏的有意义信息无法被及时发现和挖掘,人工无法识别,传统的计算机技术难以处理,淹没在高熵无序的信息海洋之中,对实际的风险管理基本没有意义。

为解决传统风险管理模式的弊端,我们应强化大数据、机器学习/深度学习等金融科技和监管科技成果在银行风险控制中的应用,集中力量推进银行风险管理科技创新和数字化转型。

建构基础:建设风险大数据平台、计算框架和AI设施

随着互联网快速普及,全球数据呈现爆发式增长,每次浏览网页、搜索或者用智能手机上网,几乎都会增加数十亿字节之多的数据,而且数据结构多样、逻辑复杂,传统的关系型数据库已渐渐无法满足风险管理的数据分析需求。在此背景下,招商银行建立了由关系型数据库、非关系型数据库、Hadoop集群、Spark计算框架以及机器学习服务器组成的风险大数据离线平台。

利用关系型数据库来存储和处理结构化数据,使用HDFS作为分布式存储的基础,既解决了巨量数据的存储,也保证了数据的安全性;同时利用架设在其上的Hive和HBase来处理数据文件的映射关联和列式数据,用MongoDB来存储文档;在准实时的分布式计算层面,使用基于内存的Spark计算框架来进行高效的数据处理。

在大数据平台的基础上,风险大数据AI基础设施架构使用Python语言,利用Pandas和Scikit-Learn等开源库,进行随机森林、XGboost、SVM、朴素贝叶斯等进行机器学习,再在其上使用谷歌TensorFlow构建神经网络模型。借助这些“神兵利器”,AI风控领域的探索可以涵盖多个方面:通过高维机器学习模型和集成学习模型,量化企业的风险;通过结合GraphX图计算与关联分析,建立网络关系特征,识别企业间关联关系;运用自然语言处理技术训练LSTM网络等多种模型,实现对企业风险舆情信息的精准识别;通过jieba分词工具和TF-IDF算法实现对授信报告的文本特征提取,利用短文本分类工具Tgrocery中的三分类模型,实现授信报告风险点的智能提取;使用机器学习,结合大数据,不断迭代训练,完成开发新的预警模型和新的评级系统。

场景应用:在风险预警、评级、政策、审批等多方面突破

在风险大数据平台基础上,招商银行结合业务场景,借助机器学习、深度学习及其他分析工具,推动智慧风控体系相关功能模块依次进入开发、上线、迭代阶段,在客户知识图谱建设、风险预警、风险评级、信贷政策制定等各个方面实现突破。

融合企业客户内外部数据,建立客户知识图谱。企业的股东背景、集团关系、上下游情况是贷款审查关键要素,了解借款人的关联企业风险是信贷作业的重要内容。之前客户关联信息依靠人工维护,工作量较大且无法保证信息的完整、及时、准确。招商银行利用大数据和人工智能工具,融合外部数据和内部数据,完成了客户关联图谱建设,实现了包括股权投资关系、对外投资关系、控制人关系、集团关系、交易关系、担保关系、诉讼关系等十大企业关联关系的自动识别。

打造基于机器学习的综合智能预警体系。2017年末,招商银行启动了人工智能在风险预警领域的应用,研发完成基于机器学习算法的对公智能预警体系,通过大数据降低客户“信息不对称”水平,建立中台直接甄别客户风险的路径。智能预警的设计以“准”为首要目标,区别于行内外传统的预警手段,在智能算法部署、指标工程构建、运行迭代频率、预警触发机制上均采用了新技术、新思路,推动预警准确率步上新台阶。2018年智能预警正式推广应用以来,经过一年的检验,首期发布的预警名单,出现风险信号的准确率达75%以上。

建设基于机器学习的新智能评级系统。基于大数据、机器学习的新一代对公客户评级系统,相对于传统评级具有诸多优势。一是算法更有效。采用机器学习算法,对规律的学习更准确,处理信息的效率更高。二是迭代更快速。每月可根据最新数据重新学习规则,自动形成新版模型,以适应客户不断变化的风险规律。三是特征指标更丰富、维度更新颖。系统由原先一个模型10~20个指标扩展至400多个指标,不仅有更丰富的财务指标与非财务客观指标,还挖掘了诸多创新维度指标,如基于图计算技术建立的客户资金交易网络信息、客户知识图谱的信息、基于信用卡行为反推企业风险的信息等。四是评级波动性更小、抗干扰能力更强。系统不易受单一指标的影响造成评级大幅波动,对部分指标的错误录入能够做到相对少干扰评级结果。

基于具体场景的风险分析能力建设。不同业务、不同客群拥有不同的风险特征,对具体场景建立相应的风险特征模型对风险判别至关重要。一是担保圈风险识别。担保圈一般指因借贷担保关系形成的网络,圈内成员往往通过亲朋好友、区域、行业、客群、银行产品等因素被联系在一起。圈内担保关系结构复杂,潜在风险巨大。近三年来,招商银行因担保代偿生成的不良客户数占不良总量的12%。从数量上看,担保代偿是不良生成第三大原因。另外,保证类业务的不良率也远高于平均水平。针对保证类业务,招商银行基于担保数据,借助图计算技术,构建担保关系图谱,建设担保风险监控工具体系。截至目前,招商银行已开发出担保圈自动梳理算法,梳理出多个担保圈。机器梳理替代之前担保圈繁琐人工梳理工作,而且机器识别在范围上、准确性、及时性三个方面远远超过人工识别,大大提高了银行对担保圈的风险管理能力。二是金融司法纠纷。司法诉讼是重要的外部风险信息,客户涉诉能够在一定程度上反映其信用状况。司法信息包括法院公告、开庭公告、裁判文书、行政处罚、执行信息、失信人等多种文书。为了从大量且不断增加的司法文书中识别出真正体现客户还款能力和还款意愿的有效信息,招商银行基于司法数据,利用NLP技术,构建文本极性分类模型,剔除无效信息,提高司法数据揭示风险的效率。在此基础上,针对有效信息构建文本多分类模型,实现司法文书的案由分类,如银行借款、民间借贷、权属纠纷、劳务纠纷等。通过对不同类型的司法信息进行分析,对重大风险类型予以主动触发式风险提示。同时,对于司法文书中的重要信息,如涉案金额、判决结果等,通过结构化自动提取来提高司法文书表达信息的效率。三是风险传导。客户发生违约除了其自身经营问题之外,外部风险也不容忽视。近年来,因关联企业的风险冲击、股东纠纷、上下游行业萧条、担保公司倒闭等外部因素导致的违约案例屡见不鲜。由于外部关联风险的多样性、复杂性,外部风险传导的规律一直难以有效地预测。招商银行通过实施客户关联图谱项目,逐步厘清客户的担保关系、交易关系、集团关系等关系,再利用图计算、机器学习、深度学习等技术,改进风险传导预测工作。四是风险舆情。在互联网时代,企业舆情已然成为企业形象和企业盈利的重要影响因素,突然发生的舆情危机事件往往会对一个企业产生“生死攸关”的影响。然而企业舆情信息散落在各类网站,由人工逐一筛选浏览效率非常低下。文本批量处理是NLP技术的强项,招商银行利用NLP技术,完成了企业负面舆情信息自动化监控平台的建设,实现了对新闻舆情标题、正文、日期信息的自动抽取和分类,并实时对接预警系统,推送预警信号。五是涉小贷公司融资。客户融资行为是风险关注的重点内容。若客户融资渠道涉及小额贷款公司、信托公司、民间借贷等,往往表明其资金情况不容乐观。为对涉小贷公司融资风险进行量化,招商银行通过对交易数据进行大数据分析,筛选出与小贷公司出现交易的客户,结果显示该部分客户出现预警和违约的概率远远高于一般客户(约占30.9%),其中与小贷公司发生过转贷交易的客户,出现预警和违约概率更高。

宏观政策智能化研读与制定。行业信贷政策是银行开展公司业务的重要依据。招商银行将客户所处行业分为优先支持、适度支持、审慎介入和压缩退出四类,并对行业白名单以及行业准入标准进行明确。由于行业信贷政策内容丰富,银行在信贷政策的定制以及宣导贯彻方面往往因系统化程度较低而效率不高,行业政策定制费时费力,政策意图较难触达前端业务人员。招商银行通过搭建行业线上化研究平台,丰富行业政策线上化工具,逐步达成宏观政策智能化研读与制定的目标。一是建立政策行业信息平台,支持最新政策推送及检索查询,并利用自然语言处理技术,实现行业、地区、热点领域的政策的焦点政策图谱,协助业务人员第一时间获取行业管理动态,提高政策的分析效率。二是上线客户行业分析及智能问答,支持用户关于信贷政策相关问题的快速回答,提升信贷政策查询效率。

数据质量检查和提升。数据质量是银行风险量化和风险管理的基础,确保数据的正确性、有效性和及时性是银行风控的一项重要工作。为此,招商银行以金融科技手段作为突破口,建设了数据质量管理系统和配套检查工具,运用科技的力量进行数据质量的管理。一是将手工检查的规则通过系统来实现,在减少人工操作的同时,保证检测标准的统一并且缩短了发现问题数据的时效。通过不断积累和完善的数据检查规则,及时分析和发现数据质量问题,持续跟进、监测执行过程直至问题修复。二是通过大数据技术,匹配行内外客户信息数据,校验疑似错误,提醒系统用户核实客户资料,及时识别客户风险。

数据驱动:强化金融科技研发应用和人才培养

金融科技赋能风险管理是一个系统工程,长期以来不断面临着理念、基础、技术和人才等方面的制约和突破。

创导理念、拓展方法,使金融科技理念更加深入人心。金融科技的基础是信息和数据,银行业要顺应金融科技趋势,牢牢树立“以数据创造价值”为着眼点,以数据管理为立足点。要培育数据文化,树立数据意识、数据思维,从数据上看问题,从数据上分析问题、理解问题、解决问题。逐步打破传统经验为主的决策模式,建立数据驱动为核心的判断决策流程,真正做到用数据来论证、用数据来管理、用数据来决策。

进一步大力推进金融科技成果的研发、并应用于日常的风险管理工作。积极探索并利用金融科技新工具、新思路,加快金融科技成果推广应用,以效率提升、风险发现和商机洞察为目标,重点推进对公智能预警体系、客户知识图谱、政策和行业知识图谱等金融科技的应用研究。在集团风险识别、高风险担保圈、基于机器学习算法的客户评级、财务报表欺诈识别、企业风险特征提取和风险传导等方面,进一步强化金融科技研究和应用。在“基础统一管理、应用全面开花”的思路下,建立基础(系统建设、数据汇集、处理和分析)、应用支持、应用等机制。

加强金融科技人才培养。金融科技赋能风险管理,同时也对风险管理人才队伍提出了更高的要求。目前,风险管理队伍的知识结构、专业背景、能力素质尚难适应银行数字化转型之需。未来需要大力度的持续投入,积极培养具有数据处理分析能力、新技术应用能力、数据模型研发能力和风险管理能力的复合型金融科技人才。

来源:微信号: 中国金融杂志,https://mp.weixin.qq.com/s/-GT5FaQ18v1ReT-ZIY0sQw 发表时间:2020年1月3日

中国民生调查2022
协办单位更多
V
海关总署研究中心
V
中国石油集团国家高端智库研究中心
V
贵州省人民政府发展研究中心
V
成都高质量发展研究院
V
中国东北振兴研究院
访问学者招聘公告
关于我们
意见建议
欢迎对中国智库网提出宝贵的意见和建议!