数据挖掘竞赛黑科技——对抗验证（Adversarial validation）

其他 2020-08-04 07:30:38 阅读次数: 0

通常情况下，我们一般都会使用交叉验证来作为评估模型的标准，来选择我们最后的模型。但是在一些数据挖掘竞赛中，数据集一般分为训练集合测试集，国内比赛可能根据比赛阶段划分多个测试集，由于数据集采样和分布的原因导致训练集和线上测试集可能存在分布不一致的情况，这时候CV无法准确的评估模型在测试集上的效果，导致线上线下不统一，分数上不去。而缓解这一问题的黑科技，就是对抗验证Adversarial validation。(图片来自 Coggle数据科学公众号，见致谢。)
在这里插入图片描述

样本分布的变化

样本分布变化主要体现在训练集和测试集的数据分布存在差异。比如，在化妆品或者医美市场，男性的比例越来越多。基于过去的数据构建的模型，渐渐不适用于现在。

此时为什么交叉验证不适用？

比如我们现在要对淘宝用户的购买行为进行推荐或者预测。
我们的训练数据集中用户的年龄分布大概在18~25岁，而我们的测试集中主要是70岁以上的老人组成。这时我们的数据样本分布就发生了变化。(图片来自知乎刘秋言)

这时候使用交叉验证就无法准确评估模型的效果。因为交叉验证时每一

猜你喜欢

转载自blog.csdn.net/HowardEmily/article/details/105729340

数据挖掘竞赛黑科技——对抗验证（Adversarial validation）

Adversarial validation

常用CV策略及对抗验证（Adversarial validation）

JQ validation表单验证

SpringMVC之验证Validation

交叉验证(Cross Validation)

validation 后台参数验证

参数验证 validation

eclipse取消validation验证

交叉验证（Cross Validation）

Spring Validation 验证

Validation参数验证

Validation

SpringMVC——BindingResult验证框架Validation

JQuery验证插件validation的使用

jQuery Validation Engine 表单验证

交叉验证（Cross Validation）简介

JAVA参数验证 Validation(一)

交叉验证(Cross-validation)

验证(Verification)与确认(Validation)的区别

（四）交叉验证(Cross Validation)

Struts2 Validation 验证

webapi Model Validation 模型验证

Web Api Validation(参数验证)

Spring MVC DataBinding/Validation (验证)

交叉验证（Cross-validation）

.Net MVC Validation 验证Model

什么是交叉验证(Cross Validation)？

JQ——表单验证插件（validation）

Sklearn——交叉验证(Cross Validation)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)