面经问题记录 - 代码天地

面经问题记录

其他 2019-02-27 10:01:08 阅读次数: 0

1.样本不均衡问题

1）增少：

SMOTE算法：简单来说smote算法的思想是合成新的少数类样本，得到少数样本A的最近邻中随机样本B，取AB连线的随机点合成

下采样

2）减多

随机欠抽样方法：上采样

3）增加样本惩罚项权重

2.过拟合问题

1)降低模型复杂度

2)增大数据集

3）数据清洗

4)正则化项（即增加惩罚度，L0(非零参数个数)，L1（元素绝对值之和）,L2范数（各个参数平方和的开方））

为什么L0和L1都可以实现稀疏，但常用的为L1？L1范数是L0范数的最优凸近似，而且它比L0范数要容易优化求解

5）Dropout层进行随机丢弃

6）早停

3.什么叫稀疏？参数稀疏有什么好处？

稀疏解即只在某（几）个轴上有实数，另外的轴为0 ，

1）例如模型参数中很多w=0，那么模型变得简单，不易过拟合

2）特征自动选择，会学习地去掉这些没有信息的特征，也就是把这些特征对应的权重置为0

3）可解释性，非0参数越少，公式表达能力越强。

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/87924707

面经问题记录

面经｜三四月前端面试问题记录

面经记录

【问题记录】问题记录专用

问题记录

Hbuilder问题记录

Java问题记录

Jira 问题记录

Jenkins问题记录

eclipse问题记录

ios问题记录

spark问题记录

Storm 问题记录

scrum问题记录

弱智问题记录

repo问题记录

maven问题记录

日常问题记录

Tomcat 问题记录

Spring问题记录

java 问题记录

IDEA 问题记录

Ocaml问题记录

SpringBoot 问题记录

seetalib问题记录

xcode 问题记录

git 问题记录

dboss问题记录

小问题记录

AS使用问题记录

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)