新浪财经讯 2019北京国际金融安全论坛于2019年11月18日至19日在北京金融安全产业园举办,主题为推进金融安全科技新发展。慧安金科(北京)科技有限公司参加北京市畅融工程,金融安全前沿技术路演。

以下为路演实录:

慧安金科:我是北京清华大学信息研究院兼职教授,慧安金科北京有限公司的创始人和CEO,非常高兴在这里跟大家分享,慧安金科用人工智能做金融风控合规和营销相关的一系列的解决方案跟经验。

慧安金科这家公司做人工智能跟我们行业里其他的公司有不太一样的地方,我们专注在用半监督主动式机器学习的方法,跟行业里头很多家做风控安全的企业不太一样,我们专注于用这些大数据在没有标签、海量数据、用大规模的图分析、聚类分析,在没有标签的情况下能主动去发现隐藏在数据里头的狡猾多变的威胁,欺诈、洗钱的手段。

行业里也存在着很多公司,包括他们传统的以基数据、名单、数据库做风控的一系列的公司,我们的区别在于我们提供了基于无监督集体学习、图分析、聚类分析等等一整套的方案,提供深度的数据挖掘的方法,在没有标签不知道威胁在哪里的情况下,能够做全方位的数据的挖掘,去主动发现这些隐藏的而且以前没有见过的欺诈行为、洗钱行为。

慧安金科非常荣幸跟学术界包括清华大学、五道口金融学院,也非常荣幸成为中国人民银行反洗钱中心重点研究的试点单位,非常感谢创新工厂、高翎资本包括园区的大力支持。

慧安金科的核心创始人有三位,加州博士毕业,并且在海外有创业经验的人成立,我本人在甲胄伯克利学院毕业其他的创始人包括徐教授是清华交叉信息研究院助理院长也是建设银行建行金科的独立董事,另一位创始人段亦涛是网易有道的首席科学家,他的专业是分布式机器学习系统,提供大规模机器学习的系统和解决方案。在这个基础上,我们有非常顶级的商业团队,带领我们整个在行业里面非常资深的反洗钱、反欺诈的内控合规的业务专家、解决方案专家,能够融合机器学习、人工智能的这些技术,跟行业里反洗钱、反欺诈合规的经验做深度的合作,利用行业的经验加人工智能的平台结合在一起,能够深度挖掘设计行业里面非常领先,创新性的金融的安全合规和解决方案。

整个公司员工都是从国际一流的大学包括加州伯克利、多伦多大学、华盛顿大学、佐治亚理工等等国际一流大学国内清华大学等、北航等等国际一流的学校毕业的学生。公司目前核心的业务是金融行业核心风控和合规业务入手,包括反洗钱、交易反欺诈、内控审计合规和智能营销,这里面是用人工智能的手段挖掘金融机构这些体系上用户的行为数据,包括信用卡刷卡、银行账号的转账,包括做外汇的购买等等,这些账户的操作和交易行为,用图分析、聚类、异常监测和有偿监督结合在一起,一整套的人工智能核心的建模平台、决策的中台和业务的前台,为金融机构的风控合规,把他们以前做的从事后的调查管控发现,逐步推向事前的预警、事中的管控和检测,完成金融监管从事后到事前的转变,提供一系列的解决方案。

这里面临的最大的痛点,在金融行业特别跟人工智能机器学习结合在一起,非常大的痛点是没有标签样本,机器学习需要有学习的过程,需要也很多你知道是好还是洗钱的账户、正常账户,有很多标签数据才能训练出来高质量的机器学习模型,然而在金融风控合规、反洗钱、反欺诈的领域每一个标签都是被人家欺诈,洗钱分子在这家银行洗钱成功,给银行带来了巨大的资金损失我们才能认定出来。

我们希望建模的过程中这样的标签越少越好,但是我们面临的这些洗钱分子、欺诈分子都是在全球范围内协同作战,高智商,动力非常强的,他们有着无数的身份,有着无数的账号可以做任意维度、狡猾多变的洗钱行为,隐藏在正常的里头,这些行为非常难以认定,而且在没有标签、没有学习的过程中,如何做到非常准确、覆盖率非常高的检测,这是一个非常大的挑战,以往基于信息库包括有监督的机器学习都是难以解决的。另外整个洗钱欺诈这些人都是手段非常高明,而且动力非常强的敌对分子,他们会不断的变换身份,规避以往的风控系统、安全系统的检测,绕过它,而且不断产生新的欺诈手段,我们以前用黑白名单、历史样本训练出来的模型或者规则只能防范住历史上已经发生的行为,对于不断改变行为产生新的洗钱手段和犯罪的手段我们是难以管控的。在这样的情况下,我们基于历史的规则、黑白名单甚至有监督机器学习很难胜任,面临着狡猾多变没有标签的挑战。

慧安金科在这种场景下我们运用无监督的机器学习、异常检测的学习,利用少量标签和海量数据上大规模账号建立的关联分析和行为异常结合起来,设计了一整套的解决方案。我们看一下在这样的挑战下,我们看到,如果我们只有少量的标签,可以看到如图这里有些浅红色的是坏账,浅绿色的是好账户,是已知的标签,在这样的情况下我们用机器学习可以训练一个模型,就是看到的这条虚实线是有监督的机器学习,在这种情况下它可以做一些分类,但是可以看到对于很多正常账户,行为非常不一样的情况下,它会在这个地方有可能会犯错误,把这些正常的账户分类到风险账户。同时我们周围很多很多有风险的账户,特别是对于由黑产、灰产所操控,特别是集中操控的多个账户,在没有行为表现的情况下,这些有监督的机器学习做分类的时候有可能会把这些集中操控被黑/灰产创造的账户,分类到正常账户里,这样会犯很多错误。利用半监督机器学习融合图分析聚类的方法,先对账户的关联和行为方式先做聚类,聚类出一个个团伙,在团伙基础上做标签传播,把好的标签通过相似性、关联性传播到这些关联非常紧密的人身上,再做分类的时候,学习出来一个半监督模型的分类,就是如图这条实线,它的分类就可以很好的把正常账户和有关联的风险账户非常完整的分开,这就是用半监督和无监督的方法。整个建模过程不完全依赖于标签,而更多依赖于行为的异常和关联的异常。这样我们就对原来用户的行为进行,不但关心它的行为交易异常,深维关联出来异常的事,把单账户的行为和多账户的行为异常一起来做,在很多情况下,即使账户没有风险行为、没有交易行为但是有关联异常也可以提前检测出来,实现风险管控从事后到事前的检测方式。

基于这个我们有一整套平台,包括机器学习平台、线上决策平台以及对业务专家可视化调查展示平台,三方平台会部署对接银行机构的系统,用标准的数据接口和银行机构对接,使用的包括银行帐户信息、账户操作行为和交易行为,在这个行为上自动形成关联图进行大规模的关联分析和检测,检测可以和机器学习融合,把关联行为化交易行为相融合进行机器学习建模,建模完以后一定要生成可以检视的,因为建模没有标签,不知道是对是错,这时候要解析的特别清楚,决策的理由和根据是什么,可以让业务专家一目了然的看的非常清楚,对整个决策过程进行反馈,形成正向的行为不断帮助机器学习系统自学习、进阶,自动发现学习未知的欺诈和洗钱行为,学出来的模型可以放到决策的中台,不停的对异常的交易,每时每刻进行事中的决策和管控,及时发现风险,风险行为会进入到专家的审核,形成风险报告。整个机器学习平台会部署到银行的数据中心线上的决策引擎会部署到银行的中台进行决策分析,专家调查会部署到银行的前台进行业务的整合。这就构建成了通用的智能风控合规大脑,可以做高性能、实时的决策,帮助银行随时随地监控风险,实现数据追踪业务管控风险的转变。

我们核心的一块跟行业里最大的区别是有个高性能图计算的引擎,包括图动态的构建,图上做深度挖掘,在图里可以想像出来,在全中国银行机构的账户成为图的节点,里面有各种各样的交易行为、关联组成编,从图上发现不正常的社区或者高密度的关联区域,检测各种各样的异常结构,去发现洗钱团伙或者欺诈的行为,以这个为基础构建了整个反欺诈、反洗钱的引擎,在这里分享一下利用图引擎、半监督的机器学习构建的AI的反洗钱架构。基于大数据平台有一系列的特征的加工提取和机器学习、图算法相关的底层模块,从而构造洗钱可以交易识别引擎、洗钱规则优化引擎、洗钱网络识别引擎,对接的是银行核心的交易系统、信贷系统、结算系统、转账系统,有各种数据融入到我们平台,进行大规模的关联分析、网络分析、客户风险交易分析,提出一系列的信号,反馈给反洗钱专家,帮助他们进一步检测和校验这些洗钱的交易、客户和团伙。

我们最近跟行业里一家股份制银行做了整个洗钱网络的识别,在整个银行反洗钱系统里,银行自己有一整套规则系统,规则系统基本上是针对单个账户甚至单条交易进行检测,举个例子,如果去银行柜台取现20万这一定是大宗可疑加以,如果银行从APP转账从北京转到云南、转到新疆,超过三万块钱一定成为可疑交易,但是这么多可疑交易,大部分都不是洗钱行为,这次我们在银行的规则系统是本着合规的要求来做的,它的原则是宁可杀错一千也不可放过一个,在这里银行的规则检测出来的95%以上都是误伤,这些误伤需要反洗钱专家大量人工审核,比如一家股份制银行超过500个以上的反洗钱专家每天审核各种案件,把那些可疑但是不真正是洗钱的账户去除掉,这里其实有非常多的人工的工作,非常沉重的负担在这里。我们跟银行合作提供了一整套基于图分析和半监督机器学习的人工智能的引擎,这个引擎有两个目标,一个目标是银行的规则只能针对单个账户、单笔交易进行管控,很多非常狡猾多变的洗钱的团伙,由数百、上千上万个账号做任意额度洗钱的话规则是很难检测的,这时候我们用网络关联、图的结构分析和机器学习相关联的方法,可以把多个账号协同作战的洗钱行为把它进行多维度的检测,这是一方面。另一方面我们做这种检测的时候可以超越规则看单个账户的方式,检测出来的不管是覆盖率还是准确率都比原来高得多。

这时候我们看一下跟股份制银行合作做主要的简单的结果示意,在做洗钱网络分析的时候,这时候不单单是看某一个账户有什么样的交易或者可疑的洗钱行为,这时候看的是多个账户之间是不是有不同的交易对手把他们联结在一起,一小波洗钱用户多个账户一起倒腾这些钱,并且我们发现这些洗钱团伙通常都会被一小波人控制,同一个IP甚至上百个帐号在控制这种交易,多个交易对手操控和开户的信息把他们聚集在一起,每个月通过这样的关联分析都能检测到7到800个洗钱团伙,数千的成员,这为银行检测出来所有的洗钱账户的40%或者以上都是通过网络进行关联分析的,这时候我们的准确率是在80%甚至以上,相对规则系统只有5%-10%的准确率,这样的话我们还能增补很多规则以前完全不能发现的隐藏的洗钱行为。用我们的手段不但可以增补很多系统,而且可以提供动态的洗钱的网络图,包括他的成员的基本信息、关联信息、自动生成的洗钱模式的描述。这样反洗钱专家调查的时候可以观察整个网络、整个资金的来龙去脉、观察整个团伙是怎么协同作战的,大大的提高审核的效率和准确率,帮助他发现以前规则系统所漏掉的还没有呈现出洗钱行为的潜伏账户,提前进行预警。这样也为银行机构客户的风险评级,这个评级是在洗钱行为还没有发生之前的事前预警打下基础,所以大大节省了银行、金融机构的负担,帮他们优化了资源,增补了很多漏检的客户,纠正了反洗钱专家的失误,因为我们看的数据更全、更细、更准确。

刚才给大家描述的是整个洗钱网络的检测,这个检测是在事后,账户已经做了洗钱行为我们才做网络分析,同时我们也用一整套人工智能的手段,能够在客户还没有洗钱,甚至个客户在银行刚刚开户的一刹那就能做洗钱风险的评级,这也是跟股份制银行深度合作的,开户的时候获取的基本信息,比如零售客户他的年龄、性别、家庭住址、开户网点、开户时间。对公账户对于公司资本信息、股东信息、经营范围、注册地等等这些信息,提取了一系列的特征,包括文本的、时序的、关联的特征,进行全方位的机器学习的建模,在他还没有任何行为,只有开户信息的情况下就能做非常准确的洗钱的风险评估,这个已经在股份制银行做出来了,整个模型的调优目前正在上线过程中,这个模型在对公客户做到94%的准确率,在前面100名的评分里我们的准确率92%,前500名评分里准确率60%以上,这个准确度是在没有任何交易只看到开互信息的情况下做出来,完全超过了银行机构做客户风险评级的程度。

同样对于零售客户达到90%以上的准确率,在前八百名甚至前一千名达到30%以上,依照这种客户的风险评级可以帮助银行客户做更准确的客户背景调查和风险管控,成为真正实现监管从事后到事前风险预警的转变。从这里就可以实现。

总结一下,刚才给大家分享的图分析、机器学习建模以及它在反洗钱领域的应用,除了这个之外我们整个业务线也囊括了整个银行核心的风控体系包括交易的内控、合规、营销和反欺诈,我们做出来的交易反欺诈系统我们在多家银行进行落地,能够实现复杂的机器学习模型在20毫秒之内进行大规模的特征提取,评分,从而能够帮助我们进行实时的拦截,在这20毫秒之内我们要做数百条事件的基础上做数百个维度的特征提取和评估,就在信用卡刷卡的一刹那我们就能够快速的判断,这个刷卡是本人的正常交易还是被别人欺诈后的盗刷,真正实现事中可疑交易的阻断。整个解决方案在2019年金融科技创新大奖赛获得了金奖。我们也会在行业里头内控审计,用无监督、半监督的办法,包括影子银行发现众多风险授信场合超过50亿,帮助审计的调查提升5倍以上的效率,而且准确率都得到了非常大的提升。这一系列的解决方案都是我们创新性的把人工智能的手段跟银行核心风控和监管结合在一起,能够做到行业里甚至全世界范围内都是非常创新领先的方案,引领技术方案的创新。

我们的竞争优势是在AI算法、有监督、半监督、主动式机器学习算法,全世界最优秀的算法都在不停的引进,包括建模的平台、调查的分析和数据洞察的平台,可以进行大规模的数据分析、建模和迭代,同时我们用非常资深的反欺诈、反洗钱的专家,他们都是在央行、在各个省级部门工作十年以上,会跟建模工程师天天在一起,迭代打磨我们的解决方案,为我们的金融机构、监管机构提供行业应用的方案,经验和案例支撑。

总结一下慧安金科积累了十多年用AI方法做互联网黑产、灰产、地下网络经济犯罪、反欺诈、反洗钱多年的经验,用行业独有的半监督算法,整个团队是国际化的视野,能够时时刻刻关注国内外洗钱欺诈地下网络经济犯罪得罪新的迹象,国际领先的模型算法论文研究和实践成果,把它不停的融合到行业内,设计出世界一流风险方案,给他们体够事前的预警,事中的监测和管控,事后的解决方案。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。