半监督主动式机器学习的技术优势：银行金融风控场景分析

风控技术的发展，经历了传统的黑白名单、规则系统，各风控公司都在不断探索新的风控技术和手段。随着人工智能的发展，现在风控领域大量使用有监督机器学习方法，同时，有一些公司在探索和应用更高级别的无监督机器学习。

事实上，在有监督和无监督机器学习之间，还有一种半监督机器学习方法，也是慧安金科主打的风控方法，综合了有监督和无监督机器学习的优势，尤其在针对特定场景的风控方面效果非常显著。

以银行金融风控场景为例，我们来了解一下半监督主动式机器学习的技术优势。

银行金融风控面临的主要业务场景包括欺诈交易检测、反洗钱、内控合规，等等。欺诈交易一般指第三方欺诈，也就是发生的交易并非持卡人本人意愿的交易，通常是不法分子利用各种渠道盗取了卡信息，伪卡作案。

洗钱指的是通过各种手段隐瞒非法收入的来源和性质，将它们合法化，目的是逃避法律的制裁。

银监会、人行、外汇组织等都会要求银行、出入境管理、证券等机构对大额、可疑的交易进行监控，并制定了严格的监控标准。但是，只要有标准就有规避的办法，不法分子会想方设法来反推存在的标准，设计新的手段来段绕开监管机构的反洗钱检测系统。

欺诈交易和洗钱活动在行为表现上变化莫测、难以捉摸，但是银行的风控系统却要在几十毫秒内做出是否拦截一笔交易的决定。这对银行的风控系统的准确性和即时性提出了很高的挑战，因为拒绝一个优质用户的正常交易将直接影响该用户对银行的信任。

为此，银行部署了相应的风控系统，但是面对不法分子越来越复杂且变化多端的攻击模式，银行风控系统往往疲于应对。比如，他们使用不同的地点、信用卡和设备来设计不同的规避手段，并进行不同金额的汇款来混淆视听。

针对这类活动，传统的风控方法是黑白名单和规则系统。当机器学习方法开始向风控领域渗透之后，在银行风控领域得到了广泛的应用。这些技术都在某些层面上解决了银行金融风控面临的问题，却仍然存在漏网和误伤的情况。

与这些方法相比，慧安金科的半监督主动式机器学习方法无论在成本控制、还是风控结果上都存在着一定的优势。

优势一：主动发现未知欺诈模式，提前预警

黑白名单是最简单直接的方法，当然误伤率也最高，因为很难划清楚黑白之间的那条线，而大多数用户实际上处在黑白之间的灰色地带。

规则系统是黑白名单的升级版，一般是通过业务经验以及对历史风险事件的总结形成的规则组合，需要根据业务成本、对风险的容忍度设置关键变量的阈值，只要符合其中一项就算命中。当新的欺诈交易或洗钱行为发生时，就会增加一条新的规则或者根据具体情况修改阈值。

由于传统的黑白名单和规则系统都对经验有很高的依赖性，不但无法覆盖全部用户事件，而且精细度不足，在银行反洗钱场景中的误报率很高。根据普华永道提供的数据，反洗钱检测输出的所有警报中有90%~95%都是误报。

同时，黑白名单需要根据历史数据去清洗，规则系统需要大量的专家根据历史案例去生成，它们的时效性和维护成本都会很高，而且难以防范狡猾多变、不断变化手段的欺诈/洗钱分子。因此，银行现有的反洗钱风控系统需要花费大量的人力调查警报事件、优化风控系统，费时费力，且效果不佳。

慧安金科的半监督主动式机器学习技术能够主动地发现新的可疑行为，从而实现主动识别和提前预警的目的。通过实时地获取用户的行为数据和环境数据进行分析，它可以主动地识别用户行为和关联的异常，有效地在不法分子实施攻击之前识别可疑行为，主动报警，提醒客户风控人员加强对这些可疑人群的关注和防范。

此外，它将人工智能模型与专家系统有机融合，当把检测结果输出给客户风控专家之后，收集客户风控专家的反馈意见，并将客户主动打上的强标签添加到模型中，让模型主动地学习，不断优化升级，防范那些变化多端、想方设法规避检测的不法分子。

优势二：仅采用少量的历史标签，迁移扩散

有监督机器学习可以利用多维数据建立复杂的规则模型。对于银行风控场景来说，根据欺诈交易或者洗钱活动发生的概率给规则系统里的每一条规则加上一个权重，再将规则转化为可以计算的数值，通过计算得到此类事件发生的概率。计算权重的过程，就是模型训练和学习的过程，也是模型不断优化的过程。

用来训练模型的，就是标签样本。由于采用少量标签建模的检测结果常常不准确，有监督机器学习通常使用大量的标签样本来训练模型，并在此基础上预测新的样本。

然而，标签并不容易获得，而且获取标签的成本太高，因为每一个标签都代表着已经发生过的攻击活动，每一个标签都是血淋淋的代价。而且标签往往只代表历史，代表过去发生的欺诈活动，当欺诈分子使用新的手段，依赖过去的标签数据训练出来的模型很难抓到它们。

标签太少，模型就不够准确，增加标签，又会显著增加风控成本。因此，对于有监督机器学习而言，可用标签数量的多少其实是控制风控成本和提高风控效率之间的博弈。

慧安金科的半监督主动式机器学习技术的核心思想是利用有限的标签建立高质量的模型。它使用非常少的标签样本和大量没有标签的样本进行建模分析，再将标签迁移、扩散到更多没有标签的样本上，获得更多准确的标签，从而可以在攻击行为发生之前快速识别潜在的欺诈分子。

同时结合专家经验将新的攻击模式以可视化的方式展现出来，提供给客户的风控专家，并将客户风控专家反馈回来的强标签注入机器学习模型，让模型不断学习，提高识别风险的准确率。

优势三：检测结果可视、可解释，参考度高

慧安金科的半监督主动式机器学习技术，基于每个用户的行为数据和环境数据建立模型，在分类和聚类算法的基础上，融合机器学习、异常检测、图分析等技术来搭建了一套企业级人工智能决策引擎。

这个决策引擎可以实时监测客户平台上的用户行为，并将最终的检测结果通过一套非常完善的数据可视化系统提供给客户，客户可以看到用户分布、行为分布，可以看到欺诈分子的风险高低和行为特点，甚至可以看到我们确定欺诈分子的决策路径。

基于这样的可视化系统，可以实现检测结果的可解释，从而为客户风控人员进行决策提供依据，方便他们对高危用户进行更好的管控。

“这是最好的时代，也是最坏的时代。”互联网向各行各业的渗透是一把双刃剑，对于银行而言，金融业务的互联网化一方面降低了经营成本、获客成本，同时提高了运营的效率，另一方面也为不法分子的攻击活动提供了便利。

与不法分子之间的较量，是技术水平与创新能力的角力，也是银行风险管控与盈利创收之间的博弈。风控之路，道阻且长。在与不法分子的长期拉锯战中，技术创新是永恒的主题。

选择了半监督主动式机器学习，意味着慧安金科已经在智能风控领域走在了前列。在未来与不法分子的对抗中，慧安金科将继续以半监督主动式机器学习技术为根本，不断创新，构建更为完善的一站式风控模型，为银行以及金融机构提供以应用场景为导向的人工智能决策引擎服务，帮助客户主动地应对日益变化的风险环境、自动地响应新的威胁和攻击，为客户提供全方位的智能检测与防护策略。

半监督主动式机器学习的技术优势：银行金融风控场景分析

猜你喜欢