腾讯安全部门-大数据挑战赛-learner队伍（进入复赛） - 代码天地

腾讯安全部门-大数据挑战赛-learner队伍（进入复赛）

其他 2018-07-02 16:09:01 阅读次数: 0

赛题描述

鼠标轨迹识别当前广泛运用于多种人机验证产品中，不仅便于用户的理解记忆，而且极大增加了暴力破解难度。但攻击者可通过黑产工具产生类人轨迹批量操作以绕过检测，并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。我们期望用机器学习算法来提高人机验证中各种机器行为的检出率，其中包括对抗过程中出现的新的攻击手段的检测。

比赛数据

本题目数据来源于某人机验证产品采集的鼠标轨迹，经过脱敏处理，数据分为3部分（数据量分别为3000条，10万，200万）。

一、特征工程

1：

x和y两个一维坐标下，可以得到一组速度和一组加速度，计算最大最小平均值和方差  变异系数 中位数，这是22个特征

2：

二维坐标下，可以得到一组速度向量和一组加速度向量。一组速度向量可以先求 极径 的 最大、最小、平均值、方差、变异系数、中位数，还有 极角的5个，一共11个。一组加速度向量也同样是11个！

3：

再计算时刻t的间隔情况，最大最小平均值和方差变异系数，加上个数、中位数，这是7维特征，

4：

 后面（t时间分布，后1/5吧）一些点x方向的方差，（之前已经把所有点x方向的方差做出来了），另一个是 两者的差值

5：

将 one_fifth_x 这个特征连接在原先特征上面，然后求出 差值

6：

第一个点 到 第三个点之间的 时间段 在 整个时间段 所占有的比例

7：

2701~2900 最后一个点x方向上的速度 和 总体均值的差值

二、模型工程

1：使用xgb gbdt 随机森林 svm lightgbm这几种模型进行投票选择，最终选取阈值判断在0.5的几种模型的交集

三、提分点

1：这种对抗性比赛，一个很突出的特点是负样本很少，所以在模型训练过程中针对这种问题有两种解决方案。一是不断从预测集中找出来负样本放在训练集中，而是训练一个一分类模型 one-svm class

猜你喜欢

转载自blog.csdn.net/a1066196847/article/details/77434670

腾讯安全部门-大数据挑战赛-learner队伍（进入复赛）

当安全遇上AI 阿里聚安全算法挑战赛队伍经验分享

报名参加 RT-Thread 挑战赛的队伍的资料整理记录

腾讯安全技术岗校招一面--游戏安全部门

达观杯文本智能信息抽取挑战赛四到十名队伍分享

达观杯文本智能信息抽取挑战赛前三名队伍分享

【Mathorcup杯大数据挑战赛复赛 A题二手车估价】思路及Python实现

大数据挑战赛（大佬篇）

30支队伍将在阿布扎比角逐奖金达500万美元的2020年穆罕默德-本-扎耶德国际机器人挑战赛

第三届法研杯司法人工智能挑战赛论辩挖掘前两名队伍分享

第三届法研杯司法人工智能挑战赛司法考试前两名队伍分享

第三届法研杯司法人工智能挑战赛司法摘要优秀队伍分享

第三届法研杯司法人工智能挑战赛阅读理解前两名队伍分享

【 2021 MathorCup杯大数据挑战赛 A题二手车估价】初赛复赛总结、方案代码及论文

360安全挑战赛

2018华为软件精英挑战赛-复赛赛题

ijcai2018-阿里妈妈广告算法赛-总决赛参赛队伍比赛攻略_learner_ctr队

快手大数据挑战赛---总结

大数据挑战赛-鼠标轨迹识别

2022年微信大数据挑战赛

2019银联高校极客挑战赛复赛

2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析

如何评价2020腾讯安全平台部极客技术挑战赛？

如何评价2020腾讯安全平台部极客技术挑战赛？

大模型应用创新挑战赛圆满收官，十三支决赛队伍逐鹿上海！

【思路代码详解】2023mathorcup大数据复赛B题妈妈杯高校数学建模挑战赛电商零售商家需求预测及库存优化问题

【预选赛】2019CCCC大数据挑战赛 --------短文本情感分类

33的挑战状(bilibili首届安全挑战赛)

关于安全部和运维部门如何高效的协同工作，保障企业整体性安全。

Hilti SLAM挑战赛数据集

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)