邦盛科技王雷:AI风控的「能力边界」

没有一条真理,可以解决人生所有的难题;也没有一项技术,可以帮助一家企业所向披靡。

金融科技行业,纵使是一个简单的项目,也需融合算法、专家经验、工程部署、接口打通等一系列环节,才能完成一套解决方案,远不止一项单点技术就可以“打包票”。

在这个过于信仰技术的时代,知道技术能做什么固然重要,知道它不能做什么也许更重要。

为此,雷锋网《AI金融评论》策划了「AI能否解决金融刚需问题」系列选题,借同一个话题,对不同背景的受访者、产品和客群各异的企业们进行采访,期望在不同的商业和技术认知下捕捉观点碰撞的火花。

在前三篇采访中,我们采访了冰鉴科技CEO顾凌云、慧安金科CEO黄铃、品钛执行副总裁李惠科。

本系列的第四篇文章,由邦盛科技执行副总裁王雷讲述他从事「AI金融风控」多年旅程中经历的有趣故事。

以下为王雷的亲身经历:

“头疼”的难题

一直以来,银行对「信用卡套现」的行为都十分头疼。

信用卡,本质上是一种贷款。银行希望贷款用于消费,而不是炒股、炒房甚至赌博。但是,现实生活中,很多人并没有合规地使用这笔钱,从而衍生出了「套现组织」。

对于银行来说,信用卡里的钱如果不是用于消费,而是用于投资、赌博,一是增大了这笔钱不能返还的风险,二是违背了国家的贷款政策。

所以银行会通过一些技术手段,对套现行为进行识别、监测。

邦盛科技之前就接到一个大型银行的订单,他们本身有一个在风控领域积累了很长时间和经验的优秀团队,但是还是希望在这个基础上更上一层楼,于是找到我们,希望通过金融科技公司的AI能力,引入解决问题的新思路。

当时,这家银行已经能很好地识别出哪些个体的行为属于骗贷,但是对于那些变化多端、组织严密的“专业”骗贷团伙,还是有些束手无策。

在项目初始阶段,客户对我们的期望很高,认为我们一定能通过更先进的技术和方法,通过对个体骗贷行为的分析,找到某种联系,识别出诈骗团伙。

那会儿,其实许多机构还没能达到这样的水准,即使是行业里最好的金融机构投入了大量精力,也没能十分精准的识别出这些诈骗组织。而我们又处于创业初期,经验匮乏,当时并没有信心能完成这个任务。

当然,有没有信心和做不做,是两码事。我们决定接受这个挑战。

一口气“抓”了几千个犯罪团伙

样本,是智能风控想要发挥作用的重要前提。

想要通过AI识别出诈骗团伙,追本溯源,还是得从高质量的样本入手。

而样本的质量高低,很大程度上依赖于专家的经验。在风控领域,专家的经验是比AI能力更稀缺、更重要的资源。比如薅羊毛是怎么薅的、什么样的行为是薅羊毛,专家会通过多年积累的经验和规则去识别哪些行为是“薅羊毛”、哪些行为属于盗卡、哪些是洗钱、哪些属于申请欺诈等等。

我们团队中的优秀专家对这家银行的样本进行了分析,发现它们的样本质量不是非常好。

于是专家们通过在风控领域多年的经验,对样本进行了加工,获得了一些我们认为比较好的样本。在此基础之上,我们使用了机器学习建模平台和关联图谱平台,把可疑的个人和团伙都甄别出来。

那次,我们团队几个人在两个多月的时间里,揪出了大几千个「信用卡套现团伙」,几千个账户,并查出几十万张有问题的信用卡。

经过那段时间的不断探索后,我们对整个行业的理解有一种豁然开朗的感觉。

之前,我们在没有开始做“识别套现团伙”的工作时,认为这是一件很难的事。但下一次在做其他的事情,我觉得是可以解决的,而且思路非常清晰。

其实,那次项目因为涉及到的银行体量非常大,我们面临的风险和压力也非常大。

但是我们顶住了压力,积累了许多欺诈团伙的特征和画像,并对模型进行进一步的优化。

后来这家银行通过我们提供的线索进行了调查,确定了这些人的确属于套现团伙,并降低了他们的信用卡额度,并对部分信用卡进行锁卡处理,效果非常好。

也是因为这次经历,我对AI在「风控领域」的应用价值,有了更直观的认识,使得我对AI在风控场景下的应用,更加有信心。

如今,邦盛科技为这家国有大行做了一个更大的项目,一个包含申请反欺诈、电子渠道交易反欺诈等全方位、全行级的反欺诈系统。

而“识别套现团伙”成为了整个大型项目中的一个组成部分,继续为这家银行提供服务。

抓住银行的心

思之所想、解其所忧,才能抓住一个人的心。

同理,想要获得银行大单,首先要认识它,然后解决它做梦都想解决的问题。

在和银行客户打交道时,不一定所有时间、所有产品,它都会觉得满意。这时,我们需要对项目的效果进行量化,沉浸到它的角度思考问题,让它信任你。

因此,我们会时时刻刻追踪AI产品的效果,并制定一系列可以看得见、摸得着的指标,让它对我们工作的效果有一个清晰的认识,建立信任感。

比如拦截非法金额数目、对客户的干扰率程度、风险等级,我们会把这些有关风控的数据或者结果记录下来,作为统计最终模型好与坏的一个标准。

我们一般建议客户,三个月或者是六个月调整或者优化一次模型。频繁的调整,不是银行的风格。

对于银行等金融机构来讲,“稳定”压倒一切,其次才是改善。所以,他们对新技术的应用也是比较谨慎的。

银行不会轻易改变自己现有的风控方法,因为改变意味着不确定的风险。只有观察到技术和效果真的十分稳定,他们才会采用新的技术系统。

AI在信贷领域主要防控两种风险,一种是欺诈风险,另一种是我们常见的信用风险,比如我们年轻人十分熟悉的“芝麻信用”和“微信支付分”。

一笔贷款的发放,银行得先判断它是否是有欺诈的风险,然后再判断它信用风险的高低。

首先,金融机构最担心的事儿是被骗子欺诈,把贷款放给了骗子。

当通过反欺诈技术将骗子拒之门外后,银行还要担心普通人能否正常还钱。普通人也有可能因为做生意经营不善、丢了工作或者社会环境的改变等因素,还不上钱,所以要判断他们的信用风险。

在评估信用风险上,「评分卡模型」是可解释性非常好、也很稳定的一个模型,现阶段也使用的非常多,各家银行都是比较习惯使用这种传统的方式。所以,我们在这一领域,需要我们金融科技公司技术能力的场景并不多。

而在反欺诈领域,越来越多的金融机构开始接受机器学习模型。因为欺诈行为更具有隐蔽性,欺诈风险比信用风险更难以控制。

而且业内一般需要六个月来训练控制风险的模型,上线模型至少又得三个月,加起来就是九个月。在这段时间里,整个市场的欺诈形式是会发生很大变化的,欺诈团伙发现金融机构会欺诈行为进行防控后,他们还会变换手法。

针对这样的情形,邦盛科技专门在模型训练中设立了一个环节——特征工程。在这个环节中,我们尽量呈现出更多的特征,我们将几千到上万个特征输入到一个模型中,使它覆盖更多的可能性,虽然不能彻底解决问题,但通过这样的算法调优,欺诈行为的成本会越来越高。

此外,银行需要考虑自己所用的技术,是否符合监管政策的要求。

机器学习这类技术,最大的一个问题是不透明、不可解释。它使用的是非线性的算法,当模型说贷款可以放,但是它推理的过程是不可逆、也不可用文字解释的,这样在使用过程中就会受到一些限制。

模型本身是一个算法的配合,我们也在尝试通过一些技术方式,来增强模型的解释性。

AI不是万能的

邦盛科技从创业初始,到如今与中国农业银行、中国建设银行、招商银行等多家大型银行合作,对行业的理解也是经历了一个从无到有的过程。

但是AI也存在很多不能解决的问题。

刚刚提到AI风控效果的好坏取决于样本。在欺诈等场景中,样本天然比较充足,而信用卡盗刷、账户盗用等场景下,因为银行的防控力度比较强,发生的案件数量较少,能积累到的样本也就较少,使得智能风控的效果也是参差不齐。

现在,机器学习和AI应用在金融的各个领域都在尝试,但是每个银行对样本积累的重视程度也不一样,所以有的做的比较好,有的做的一般。

目前我们对样本的依赖程度过高,所以业内很多公司也都在尝试无监督或者半监督的技术方式。

有监督就是有样本,无监督就是无样本,半监督就是样本质量不够高。

有监督的样本,是团队从业务中一点点积累下来,通过规则体系和专家经验,输入到模型,然后模型跑起来。

采用无监督的方式,一般是因为团队没有积累样本,又没有这个领域的专家,于是依靠纯粹的算法,通过聚合量、聚类等数理关系,找出高风险的金融交易,提取这些异常的样本后让专家判断。无监督的流程是先通过模型得出结果,让人来判断,然后模型再根据人的判断的结果去优化。

在实践中,我们不管用哪种技术方法,我们都会建议客户采用综合的解决方案,而不是单一的AI产品,这套解决方案包含着专家经验、规则体系、模型体系、图谱体系、大数据计算等,这些元素必须结合在一起才能形成解决问题的合力。

社会上大部分的问题本身,都是一个很复杂的东西,它需要系统化的思路方法和技术才能解决,我们不能单一地认为依赖于某一个高新技术就能解决所有问题。

我们每年会招很多新人进来,也会接触到很多新入行的创业者,我整体的感觉是,大家有点过于迷信技术,迷信高端的算法。

任何一个技术的应用,都有前提条件,比如数据环境、样本质量。每一次对AI模型的调整,少则三个月,多则几年,运营的成本也非常高。

如果环境条件不允许,技术就很难达到大家期望的状态。

所以对于很多这些新入行的优秀人才,我建议先对这个领域有一个比较深刻的业务理解,看看没有能力给技术创造出一个好的环境出来。

没有对业务足够深刻的理解,不能把没有达到期望的数据转化成高质量的样本,模型很难运转起来。

雷锋网雷锋网