“随着催收流程越来越合规,风控压力一下子向贷前环节倾斜不少。”一家金融科技平台负责人向记者感慨说。
但他遇到的最大挑战,却是数据孤岛问题迟迟得不到解决,严重制约了借款人信用评估准确。
所谓数据孤岛,主要分成两个方面,一是不同机构自主存储维护海量数据却没有共享,造成数据资源大量浪费;二是即便部分机构平台拥有大量数据,但不同来源数据在逻辑上相对孤立,造成沟通成本极高且影响信用评估效率。
为了破解数据孤岛问题,这位金融科技平台负责人曾寻找多家电商平台开展数据合作,用于完善借款人信用评估准确性。但他发现,数据的“跨岛合作”操作繁琐缓慢,且不少共享信息数据缺乏实时性。
“这也是金融科技平台贷款利率居高不下的原因之一,由于无法全面准确评估借款人实际信用状况,不少平台只能抬高贷款利率转嫁潜在的坏账风险。”他指出,这既增加了借款人财务成本,又使得金融科技平台业务竞争力削弱不少。
记者多方了解到,相关部门注意到这个问题。除了发起百行征信汇聚各家金融科技平台数据,完善个人金融信用评估准确性全面性之外,近年来地方政府正尝试设立信息数据共享平台,连接打通不同行业数据,通过金融科技等最新技术实现这些数据的互联互通,从而为金融机构与企业提供更全面的个人企业信用评估信息,完善整个社会信用体系建设。
在多位金融科技平台业内人士看来,不同于以往百行征信主要收集个人金融信用数据,平台与电商平台开展数据合作——连接打通单个行业与个人金融信用数据等操作模式,这些新的信息数据共享平台最大特点就是整合不同行业数据,从而为个人信用状况准确评估提供更广泛的参考维度。
“不过,要让各个行业留存的海量数据在社会信用体系建设方面发挥巨大作用,首先得解决数据流通和交换问题,其中除了技术问题,还会涉及不少法律问题,比如用户隐私保护,数据授权等,这也是当前这些地方政府主导型信息数据共享平台面临的一大操作难题。”一位熟悉相关信息数据共享平台运作模式的知情人士向记者透露。
在上海市社会信用促进中心主任傅春看来,当前金融科技可以有效解决上述问题。以区块链技术为例,它具有不可篡改性与可溯源两大特点,因此每个人可以通过区块链技术看到自己的信用数据被哪些机构使用,主要使用在哪些领域,是否征得自己同意。
傅春指出,在社会信用推进过程里,这类信息数据共享平台要发挥巨大作用,迫切需要建立的,是一个中间桥梁,即信用指导手册,它相当于信用行业的交规,让各个市场主体能以合乎规范的方式分享使用不同行业数据,只要这个问题得到妥善解决,未来金融机构将更快地开展一系列基于场景化、定制化、个性化的信用服务和信用产品,进一步完善社会信用体系建设。他指出。
数据孤岛待解
多位金融科技平台人士透露,面对数据孤岛问题,多数金融科技平台主要采取两种方式尝试解决:一是通过百行征信获取更多黑名单数据完善自身反欺诈数据库,从而提升对借款人信用状况评估的准确性;二是与更多电商等场景服务平台开展数据合作,获取第三方数据完善自身智能风控模型建设。
上述金融科技平台负责人对此指出,在实际操作过程中,上述做法效果未必理想。比如并不是所有金融科技平台都向百行征信提供自身所有的黑名单数据,导致个人金融信用数据不全,影响平台的风控效率;此外不少电商平台所提供的数据存在较强的局限性,只有在特定消费场景下,这些数据才能发挥提升个人信用状况评估准确性的作用,一旦脱离这些场景,相关数据的“价值”大打折扣。
一家国内大型金融科技平台产品总监也坦言,他们曾针对不同消费场景搭建了不同消费信贷产品运营模型,如今这些产品落地遇到的最大短板,就是数据孤岛问题,导致很多有价值的产品研发变成空中楼阁。因为这些产品运营模型背后的数据支撑都是模拟出来的,一旦投入实际使用未必“有效”。
在傅春看来,这也是相关部门推动不同行业数据分享交换,助力社会信用体系建设的主要原因之一。
“其实,不同行业之间的数据是存在交叉与互补的。通过将旅游行业、房产行业、金融行业、教育行业等数据进行流通交换,可以更准确全面地描绘个人、企业当前的信用状况、经济实力与未来消费需求等,从而助力各行业机构提升精准营销与风险管理水准。”傅春指出。
记者多方了解到,在相关部门支持下,上海社会信用促进中心采取“政府+市场”的双轮驱动模式,已联合银联,蚂蚁金服、万达征信等不同行业平台,汇聚众多行业的数据。
在信用算力董事长兼CEO张建梁看来,要将不同行业数据连接打通并打破数据孤岛问题,一个关键问题是能否找到合适的技术让这些数据“物尽其用”。
“比如人工智能技术的核心在于海量丰富的数据,若数据孤岛依然存在,将会很大程度限制人工智能技术使用效果。”他认为,整合不同行业数据的好处是尽早洞察到个人、小微企业资金运作风险的某些规律,帮助平台提前做好风险防范。比如,德国中小企业在出现破产风波前两年,企业经营现金流会迅速下滑,但中国中小企业在出现经营风险前两年,其现金流反而不会很差,原因是中国中小企业很难从银行拿到贷款,只能从民间或亲戚朋友处借款,因此这类隐性借款很难在经营性现金流体现。但金融科技平台若能汇总大量中小企业破产前发生的状况,通过AI深度学习与大数据分析技术可以找出不少企业经营恶化迹象,从而及时做好贷后风险管理措施。
此外,不少个人借款额不高,导致还款违约的主要因素不是还款能力,而是还款意愿。因此金融科技平台可以“交换分享”借款人在餐饮、旅游、购物消费、房贷等不同领域信用消费记录,有效识别这类风险。
但记者多方了解到,要实现不同行业数据的交换流通,并非易事。当前整个信用行业依然缺乏不同行业数据交换流通的操作准则,导致平台之间基于自身利益,不愿拿出所有数据进行“分享”,影响整个数据交换流通的“公平”效率。
傅春告诉记者,目前上海市社会信用促进中心已成立信用大数据联合实验室,实验室主要从业务场景、社会应用、制度建设、产业发展等四个方面开展工作,对信用大数据应用产品建模、交易规则和定价等一系列相关问题进行探索、促进信用大数据新产品、新服务和新技术的研发。同时,实验室也着手专门研究跨行业和领域的信用信息共享的相关标准。
银行的努力
为了打破数据孤岛对个人企业信用状况评估准确性的制约,传统银行也在尝试融合不同领域数据。
一位国有大型银行零售业务部门主管向记者表示,当前银行在研发针对小微企业与个人的消费贷款产品方面也遇到数据瓶颈。究其原因,银行内部主要汇聚个人或企业的金融信息,对他们公共事业缴费、社交网站行为等数据缺乏了解,难以全面了解他们生活行为特征,导致消费信贷产品风险定价未必精准。
因此这些年他所在的银行开始尝试引入第三方数据,比如通过与第三方机构合作“获取”企业纳税信息与公共事业缴费,从而判断企业在贷款存续期间的经营状况;近日他们还开展与政府相关部门合作,通过获取企业员工的社保基金缴费数据,侧面了解企业员工薪资水平涨跌,进而判断企业的业务发展状况好坏。
记者多方了解到,为了持续提升个人企业信用状况评估准确性,部分银行正与当地法院与公安机关展数据合作,将失信个人与企业等公开资料信息纳入贷款风险评估模型,一旦贷款企业与这些失信人(或企业)存在业务往来,银行风控模型将迅速提示潜在的贷款风险。
这位国有大型银行零售业务部门主管坦言,尽管银行积极尝试引入不同领域行业数据,但当前被银行采纳的数据占比并不高。究其原因,一是银行担心数据来源的合规性,比如部分金融科技平台利用爬虫技术“采集”借款人大量个人隐私信息。但这些隐私信息需要个人授权才能使用,因此银行担心一旦个人问责,银行也会受到牵连;二是数据局限性比较强,比如不少场景服务方所提供的数据仅限于特定的消费场景,一旦离开特定消费场景,其使用效果就大打折扣。
“这背后,也折射出银行自身风控模型开发不足的短板。”他指出。要解决这个瓶颈,还需要银行加大引入不同领域行业数据,在加大风控模型研发投入同时采取系统化操作方式持续压低运营成本,从而塑造自身消费贷款业务核心竞争力。
“不过,即便融合大量不同行业领域数据,银行风控模型能否见效,仍是未知数。”多位业内人士透露,这考验着数据采集的质量。事实上,相比个人消费者的数据与用户画像相对容易获取,不少小微企业数据往往难以连续有效,且无法通过现场调查了解企业真实的经营状况,因此银行要健全小微企业的大数据风控模型,除了引入员工社保基金缴费、企业水电费与企业缴税等数据,还需要结合各个行业最新数据对行业发展前景进行研判,从而提前洞察不同地域不同行业潜在的经营风险,才能最大限度提升相关企业信用评估的准确性全面性。