反作弊

一、现存问题

第三方流量主的流量质量不佳,甚至进行流量作弊。而当前要解决的问题为:判断流量是否是作弊的流量

1.举例:(1)假量  (2)次量、真假量互掺  (3)针对我们的程序实现作弊方案

2.作弊分层:(1)低层次通过ipcookie、点击频率、经纬度等确定

      (2)中等层次:通过程序模拟普通人工操作

      (3)高层次:水军团对,高层次技术或人为操作

3.产生这种情况可能有多种: 1.流量主希望收益增多   2.广告主彼此的恶意竞争  3.网络爬虫4.随意了解5.无意点击等

二、概念明确

要解决这一问题,主要是实现 流量主的实际收获=广告主的实际付出。可实现方式公式:

 广告主花费=流量主收益=效果总量价值=广告数据量*广告平均效应*信用度(价值比例)

可以从流量主方进行把控

1. 流量主信用度

(1) 流量主的信用度和流量主收益有关,在使用时具备参考价值

(2) 流量主的信用度提供给同行其他企业作为信息公示

2. 流量主的用户数据真实性

(1) 用户固有数据的可靠性

(2) 用户行为数据是否符合人为规律

可以从广告主方进行把控

1.   预算控制

2.   投放效果建议

3.   流量主选择建议

4.   流量主、广告主合作方式衔接

三、参考资料

1. 淘宝方案

 

数据体系:包括所有的数据,作弊前后,用户行为数据。投诉信息的收集。

分析体系:分析的方法论体系建立,有一套完整的流程、算法。

规则体系:主要是反作弊线上的规则。如何评估一个规则

监控体系:能够主动发现作弊并且能够发现已经上线的规则中的异常。

2. 《程序化广告》书籍

a) 用户标识

i. Ipcookie、窗口大小、操作系统、版本号等

b) 用户行为

i. 广告浏览点击是否符合正常规律

ii. 到站情况

c) 广告来源

d) 品牌安全

i. 寻找品牌安全供应商提供该项服务,过滤黑名单的

e) 可见度测量时间间隔要求多久展示

f) 算法优化

i. 投放预算、速度等定向条件

ii. 特征分析

四、未来发展趋势

1. 各种动态的常规特征监控非常规的数据:利用机器学习进行自动提取可信度高的数据,例如通过imei号关联,将自动生成的多种特征进行数据分析,将不符合各种特征的数据进行提取出来做人为二次分析。(例如:获取某个imei号在某一时间使用某一款app  等这样的事件,获取n条动作相同的权重的名词、动词形成特定的人物画像标签,同时通过监控在多种维度判断该imei是否可以被去掉)如此一来,我们根据现有判断信用度高的数据,通过特征提取,我们不知道会生成怎样的符合规律数据特征,进行数据分析提取

2. 信用度门槛。标识数据的唯一性。黑白名单的建立

a) 建立信息传递体系。例如如果发现黑名单,则具备该黑名单关联的数据,将统一增加黑名单可能性,白名单一样

b) 网络曝光

i. 通过网络爬虫搜集网络数据

ii. 从作弊人员那里购买作弊信息。杜绝作弊人员作弊共性信息

五、当前可行方案

1. 通过我们不定时的程序,访问流量主应用,核对数据是否正确

2. 定时确定影响,该数据效果是否为广告主带来了媒体效应、增加了收益

3. 留存率,留存流量主过往信息

4. 建立有效的标识数据(imeiip、常用wifi、常去的地方、第三方数据属性情况 进行数据聚集整合)

5. 标识数据是否正常,符合常规数据特征

    (1) 用户行为:

a. imei是否正常同一秒同一个imei不可能同时访问几个应用,应用后台运行不会去访问广告。

b. 地理位置是否正常,不可能同一时间相隔的经纬度非常远

c. 活跃情况判断。例如一个人在使用墨迹天气,不可能一天打开七八次,而且还不是在早上和晚上

 (2) 数据包是否完整

6. 预期监控。根据不同的流量主,给一个曝光广告频率、操作行为、人群段等信息划分,一旦到达某种程度则予以报警,进行数据分析

7. 收集不完整的数据分析,如果分析得出是伪造数据的可能性比较大,则逐步列入流量主、数据唯一标识的可信度,逐渐步入黑名单

六、针对该问题实施方案

1. 根据有经验的广告平台行业人员推荐、或者找第三方信用度量的中间商  寻找流量主接入

2. 寻找流量主接入,尽可能的接入流量主的数据,前期按照广告月租之类的,后面精细按照每条数据进行结算

3. 增加权重黑白名单,或衔接信用度中间商(具体接入网上没找到)

4. 数据分析方式不断优化反馈验证

(1)规则模型

(2)业务模型

(3)概率模型

(4)唯一标识权重、媒体权重、黑白名单建立

(5)数据变化趋势模型

(6)多种形式收集广告投放响应。第三方,广告主预期效果访问、媒体主效果展示访问、问题点发现分析(抽样 广告主ID、搜索词、竞价词、来源站点、IPBIPC段和B))

5. 数据分析形成流量主各个特征,供广告主选择

6. 相关的指数从第三方拿(来源(站内、搜索引擎、联盟站点、tanx流量广告系统))

 

猜你喜欢

转载自blog.csdn.net/u012990630/article/details/78721175