L1正则化在0处不可导时如何处理？

其他 2020-02-11 10:41:31 阅读次数: 0

1 坐标轴下降法

设lasso回归的损失函数为：

其中，n为样本个数，m为特征个数。

由于lasso回归的损失函数是不可导的，所以梯度下降算法将不再有效，下面利用坐标轴下降法进行求解。

坐标轴下降法和梯度下降法具有同样的思想，都是沿着某个方向不断迭代，但是梯度下降法是沿着当前点的负梯度方向进行参数更新，而坐标轴下降法是沿着坐标轴的方向。

下面为具体的更新过程：

（3）通过以上步骤即可以得到每轮的迭代结果，如果相对于的变化很小，则停止迭代，否则，重复步骤（2）.

通过以上迭代过程可以看出

1. 坐标轴下降法进行参数更新时，每次总是固定另外m-1个值，求另外一个的局部最优值，这样也避免了Lasso回归的损失函数不可导的问题。

2. 坐标轴下降法每轮迭代都需要O(mn)的计算。（和梯度下降算法相同）

坐标轴下降法的数学依据为：

对于一个可微凸函数，其中为n*1的向量，如果对于一个解，使得在某个坐标轴上都能达到最小值，则就是的全局的最小值点。

2 Proximal Algorithms 近端梯度下降

西瓜书P253有介绍

3 ADMM

[Algorithm]ADMM简明理解

Reference

坐标轴下降法（解决L1正则化不可导的问题）

[Algorithm]ADMM简明理解

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/104126446

L1正则化在0处不可导时如何处理？

L1正则在0处不可导怎么办？

L1正则化与稀疏性、L1正则化不可导问题

坐标轴下降法（解决L1正则化不可导的问题）

L1正则化

算法—L0、L1、L2正则化区别

L0,L1,L2正则化

机器学习正则化之L0、L1与L2范数

正则化：L0 vs L1 vs L2

浅谈15--------- L0、L1、L2正则化区别

L1正则化与稀疏性

正则化（L1和L2正则）

L1正则

【ML基石】L0范数、L1范数、L2范数与核范数正则化

L1、L2正则化以及smooth L1 loss

正则化项L1和L2

L1、L2正则化

L1,L2正则化

L1与L2正则化总结

L1，L2正则化的区别

L1和L2正则化原理

L1与L2正则化

L1和L2正则化

L1 & L2 正则化的理解

L1 L2正则化

L1，L2正则化

机器学习 - 正则化L1 L2

L1,L2正则化代码

理解L1与L2正则化

MachineLearning—L1、L2正则化介绍

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)