数美科技CTO梁堃:怎么样构建全栈式智能风控体系,在线业务安全的挑战与实践

日前,由雷锋网鲸犀频道与腾讯“千帆计划”共同举办的“CCF—GAIR全球人工智能与机器人峰会”在深圳盛大召开。在“如何利用SaaS赋能企业转型升级”闭门会上,数美科技联合创始人&CTO 梁堃发表了以《在线业务安全的挑战与实践——构建全栈式智能风控体系》为题的精彩演讲。

数美科技联合创始人&CTO 梁堃
梁堃在会上强调:“随着业务互联网化程度越来越高,购物、出行、金融等行业正从交易成单型转向用户运营型,并且随着用户红利的下降,获客成本越来越高,业务、营销、内容等方面都面临着越来越严峻的安全挑战。

并指出现有风控方案的防御能力单薄、标准难统一、防御时效性差、防御进化慢等挑战问题。进而阐述了布控体系、策略体系、画像体系、运营体系,总共四大全栈式风控体系,以及风控数据流、风控平台架构、风控模型架构、多集群部署架构等实时风控架构。

同时,数美科技梁堃结合营销反欺诈、非本人支付、内容安全等案例,介绍了全栈式实时风控解决方案。

以下内容根据现场演讲实录整理所得:

随着数字化时代的到来,大量企业将业务迁移到互联网上,为客户带来便利服务的同时,也面临着从黑产抢促销、刷单、薅羊毛到UGC、PGC内容安全等各个方面的风险挑战。

对于企业来说,企业自身的数字化转型,已经成为趋势,如何避免转型中可能遭遇的各类欺诈威胁和内容合规风险,保障企业整体业务逻辑的顺畅,成为企业必须考虑的问题。

梁堃:数美科技成立于2015年,一直致力于为全球客户提供专业的AI在线业务风控和反欺诈服务,截至目前,我们服务了上千家不同的公司,包括互联网、互联网+金融等领域。我想通过这次演讲,将我们数美科技的实践经验与成果分享给大家。

这次演讲主要分为四个部分:风险态势、全栈风控体系、实时风控架构、实践案例

风险态势

随着移动互联网的发展和普及,衣食住行、教育、金融、医疗等各行各业都在逐渐地将自己的业务放在互联网上,并通过更为直观的包含图、文、音视频在内形式进行呈现,今年疫情也极大地加速了业务在线化的进程。

另一个趋势是,随着当今移动互联网用户增长的逐渐放缓,单个客户的获客成本在快速上升,越来越多企业的经营理念逐渐从交易成单型转向用户运营型。

在这里插入图片描述
什么是传统的交易成单型?进入一家商店,点一杯咖啡,我付钱他给我商品,用户和商店的交互就结束了。而现在的用户运营型则不是这样,商店会通过App等渠道,将自己的用户运营在自己的手里,并通过给用户提供更多的服务,提高用户活跃度,最终提高自己的交易量。

在这两个趋势下,在线业务本身、营销、内容等方面就会面临着越来越严峻的挑战。

后面会举几个典型的例子,第一个典型的例子是支付欺诈。2015年以前,其实支付风控在国内已经做得比较好了,那时国内的支付欺诈比例非常低。但是随着各种业务向互联网方向的转移,在今天我们可以看到第三方支付交易的规模在快速增长,与此同时,支付欺诈的损失金额也在不停的增长。

第二个典型的场景是营销相关。黑产、羊毛党疯狂套利。我们看到的营销活动种类非常多,如做任务得奖励、分享得奖励、用户裂变、拼单等等。但是本质逻辑只有两个:一个是花钱买用户,主要目标是拉新,例如,注册有奖,新用户首单奖励、用户裂变等,通过让利、花钱买一部分新的用户进来;只要是这个逻辑,每个用户就有一个价格,黑产就可以批量造一些假用户,通过这种方式获利。

在这里插入图片描述
第二个本质逻辑是花钱买活跃,例如签到奖励、积分、观看奖励等,只要本质逻辑是花钱买活跃,用户的每次活跃就有一个价格,黑产会用机器的方法造一些假的活跃卖给你。

只要我们在线上做这样的营销活动,不管营销活动的形式如何,总是绕不开这两个本质,这就有黑产套利的机会。

提到内容安全,目前几乎每个App都会有UGC内容,用户可以发表自己的评论、上传头像、语音视频聊天等。怎么保证这些内容不是违法违规的?怎么保证不会引起用户不适?

面对这些风险的时候,传统的手段会面临四类不同的挑战:一是防御能力单薄,传统的黑名单、简单规则等,会发现很容易被绕过去;二是标准难统一,仅仅依赖人工判断非常耗时、耗力;三是防御时效性差;四是防御进化慢。

全栈风控体系

2016年年初,我们用过一些单点的方法,是不是做一个SDK就可以把黑产拦住?是不是在注册的环节可以做一下机器人和真人的识别?是不是可以搞一个验证码的模型?在和黑产对抗的痛苦过程中,我们提出了一个理念、我们叫做全栈式的风控体系。

主要分为四个部分,在我们看来,要想把风控解决得比较好,这四个部分缺一不可。

1、布控体系。布控体系从来不是一个点布控,而是多点布控。比如启动、注册、登录、业务行为,为什么单点防御不行?因为它有几个挑战,在一个点上防御,这个点做得再强,像马奇诺防线一样,一旦这个点被突破,后面就一马平川。

在这里插入图片描述
我们做风控第一个原则是要在最恶劣的情况下控制全局风险,往往这个点被突破不是技术方面的问题,而是合作方业务上出现的一些问题。本质上,做到多个点布控的时候,任何一个点出问题,总是能控制全局,同样也能更多的识别出这样的问题。

2、策略体系。如何检测风险,应该从哪些方面检测风险?我们认为应该从四个方面来检测:要检测设备是不是有风险,设备是不是遭到了大量的恶劣篡改?行为层面是不是有影响?

一个账号一秒钟高频访问了三次或者更多次,那对内容风险的检测,对音频、视频、图片、文本内容是不是存在违规、存在风险检测?最后是欺诈团伙的检测。像虚拟机,一技多开、篡改设备,前面也提到,大家用一些偏灰黑产的方式在微信上运营,这是很危险的,这个可以通过技术手段识别出来。

如何对行为进行检测?人在设备上操作检测,操作过程中,手机的陀螺仪加速没有变化,那大概就是机器做的。如果你的注册、登录、做任务、提现是等时间线的操作,那大概也是机器做的。这是两种比较简单的情况,黑产是非常聪明的,他会用一些随机的方法,这个时候就需要利用复杂的模型解决类似的问题。

在这里插入图片描述
如何识别风险内容?UGC的内容如何知道是否包含违法违规内容,比如黄赌毒这种信息?如何保证自己的平台没有让人不适的内容?传统方法靠人来审核,现在可以用机器来辅助,基于深度学习理解语音、视觉、文本的内容语义。同时识别出数百个标签。

如何检测欺诈团伙?尤其是羊毛党和渠道,从来都不是由一个人完成,都是团伙作案,如何快速识别出团伙是风控的关键,因此利用关联网络、风险传播等无监督算法发现黑产团伙,可以识别潜在和新型诈骗威胁。

3、画像体系。我们知道画像大多会用在营销领域,而画像在风控中非常重要,画像分很多种,更多是欺诈团伙的画像,这个体系同时说明了为什么要用多点布控,画像体系可以真正做到互相打通多个场景的数据,共同识别黑产。

例如,有一个羊毛党注册的时候没有被发现,随着他的行为越来越多,有登录、业务活动、最后提现,但在领券的时候识别出他,在他领券和提现的时候可以通过画像体系看到他前面所有的行为,通过所有的行为判断他是不是羊毛党,这就是画像体系的正面,识别出来这个账号是羊毛党。

4、运营体系。风控与其他的SaaS软件之间核心的区别是什么?软SaaS是在交付的时候,这个软件的大部分功能已经完成了,后面更多的是维护、增加一些新的需求和目的。而部署整个风控的工作才刚刚完成,像从黑产的情报、分析、规律的发现、特征提取,模型训练再到上线,这是不停的迭代,只有这个迭代、运营体系不断的迭代,模型才能快速的进化,进而识别有效对抗黑产。

实时风控架构

前面讲的是业务风控的策略模型,下面我讲一下实时风控的架构。

这里的第一个点是,业务系统要和风控系统解耦合。如果风控逻辑和业务的逻辑绑在一起,后面维护起来会很痛苦,每一次业务的升级都可能导致风控逻辑出现问题,反过来,每一次风控逻辑的更新都需要在业务系统上线,则会拖慢和风险对抗的速度。

在这里插入图片描述
我们建议,业务系统和风控平台是相互独立的,两者间通过标准的API交互。

第二点是风控决策体系,风控决策体系分为几层。其中最下面一层是前面提到的风险画像。这之上是包括设备风险引擎、深度学习引擎、社群发现引擎等在内的基础引擎层。每一个基础引擎从一个特定的方面判断当前请求的风险。

基础引擎之上是智能决策引擎,决策引擎拿到所有基础引擎提供的风险信息后,针对不同的场景执行场景特定的风控策略。在这种风控平台的架构支持下,可以实现多个不同场景的风控在同一个平台上实现,在不同的场景下有各个场景适合的特定模型和策略。

在这里插入图片描述
第三点,风控系统必须响应非常快,这样才能实时拦截处置风险。而做到响应快必须做到两点:一是引擎的性能要足够高;二是风控系统要部署在业务系统的“附近”,以避免网络开销。我们在全球部署了7个不同的集群,便于客户就近接入。

最后是一些实践的案例,第一个是我们之前为金融机构提供的服务,非本人交易的情况。第二个是直播平台,内容风险和羊毛党套利。第三个是电商社交平台,上面有大量的内容风险。我的报告就到这里,谢谢大家!

数美科技联合创始人&CTO 梁堃:
北京大学计算机硕士,国内知名机器学习与数据挖掘专家。曾任百度、小米,高级工程师、架构师,拥有多年机器学习和人工智能领域经验。

猜你喜欢

转载自blog.csdn.net/SHUMEITECH/article/details/108494505