L1和L2正则化的区别

🕗 发布于 2024-10-10 01:08 人工智能

L1和L2正则化是机器学习中常用的两种正则化技术，用于防止模型过拟合，特别是在线性回归、逻辑回归等线性模型中。
它们通过在损失函数中添加一个与模型参数相关的惩罚项来工作。

L1倾向于将一些不重要的特征的权重压缩为零，但是L2正则化倾向于使参数值接近于零但不会完全为零
适用场景：L1它具有稀疏性，可以有效地进行特征选择，适用于特征冗余的场景（适合在希望筛选出少量重要特征的情况下使用）。L2减少对单个特征的依赖，平滑所有特征的权重，（适合在所有特征都可能有贡献的情况下使用）处理噪声时效果更好，可以使模型更加平稳。

详细讲解：
L1正则化和L2正则化是防止模型过拟合的两种常用方法，它们通过对模型的损失函数添加惩罚项，来约束模型参数（即权重），使模型的复杂度降低，避免过度拟合训练数据。

1. L1正则化（Lasso Regularization）

L1正则化通过在损失函数中加入模型参数的绝对值之和作为惩罚项，公式如下：

[ Loss = Loss_{original} + \lambda \sum_{i} |w_i| ]

这里，( w_i ) 是模型的权重，( \lambda ) 是正则化强度的控制参数。
主要特点：L1正则化会倾向于让一些权重变为零，因此它具有稀疏性。这意味着它可以有效地进行特征选择，将不重要的特征的权重压缩到零，模型只会保留最有用的特征。
应用场景：如果你想从大量特征中自动筛选出重要特征，L1正则化是很好的选择。

2. L2正则化（Ridge Regularization）

L2正则化通过在损失函数中加入模型参数的平方和作为惩罚项，公式如下：

[ Loss = Loss_{original} + \lambda \sum_{i} w_i^2 ]

主要特点：L2正则化不会使权重变为零，而是让权重更接近于零。因此，它更适合处理当所有特征都可能有一定作用的情况，因为它不会丢弃任何特征，而是平滑地调整每个特征的权重。
应用场景：L2正则化更适合在所有特征都比较重要的情况下使用，尤其是在高维数据集上，它可以有效地避免过拟合。

3. L1与L2正则化的区别总结

惩罚方式：L1正则化对参数的绝对值惩罚，L2正则化对参数的平方惩罚。
稀疏性：L1正则化会使一些权重变为零，产生稀疏性（特征选择）；L2正则化不会使权重变为零，但会使权重较小。
适用场景：L1正则化适合在希望筛选出少量重要特征的情况下使用；L2正则化适合在所有特征都可能有贡献的情况下使用。

4. Elastic Net（弹性网）

为了结合L1和L2正则化的优势，有一种正则化方法叫Elastic Net，它将L1和L2正则化结合起来，公式如下：

[ Loss = Loss_{original} + \lambda_1 \sum_{i} |w_i| + \lambda_2 \sum_{i} w_i^2 ]

这样可以既实现稀疏性，又能避免过度稀疏导致的信息丢失。

L1和L2正则化都是为了减少模型复杂度，提高泛化能力，使模型在未见过的数据上表现得更好。

原文地址：https://blog.csdn.net/weixin_63681863/article/details/142783331

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：黑马java学习笔记13(阶段二第四章4-2~第四章4-3 98)
下一篇：OpenJudge | Disk Tree

LSTM和GRU
复杂性：LSTM比GRU有更多的参数和更复杂的结构。性能：两者在不同任务上的表现可能有所不同，没有绝对的优劣之分，通常需要根据具体任务进行选择。应用：LSTM和GRU广泛应用于自然语言处理（NLP）、
阅读更多2024-10-10
ChatGPT：引领人工智能新潮流！
2022 年 11 月，OpenAI 发布了 InstructGPT 的姐妹模型 ChatGPT，也被称为 GPT-3.5，使用了指示学习和人工反馈的强化学习训练模型，其模型参数约有 20 亿，训练总
阅读更多2024-10-10
腾讯云SDK用量统计
音视频终端 SDK（腾讯云视立方）将新版连麦管理方案的多个功能集成至，便于用户快捷使用，具体分为快速上手、连麦应用、用量统计和地址生成器四个功能页面。更多连麦功能说明，请参见。音视频终端 SDK（腾讯
阅读更多2024-10-10
maven加载依赖成功但是引入import不了包，注解报错
突然就复现不出来了，奇了怪了，简单说一下吧，就是模块里引入了SpringBoot Test那个依赖然后，这个包下没有，导致我@SpringBootTest一直出不来，就找不到这个包下的注解类。然后这里
阅读更多2024-10-10
Spring Boot 应用开发案例:在线书籍管理系统
本案例将开发一个“在线书籍管理系统”，用户可以通过注册和登录进入系统，操作自己的书籍信息。用户注册、登录（基于 JWT 的认证机制）查看所有书籍增加书籍修改书籍信息删除书籍功能的开发将采用前后端分离的
阅读更多2024-10-10
docker compose入门6—如何挂载卷
通过以上方法，你可以灵活地将宿主机的文件和目录挂载到 Docker Compose 容器中。这对于配置、持久化数据和共享文件非常有用。
阅读更多2024-10-10
第五章：软件工程（5.3软件设计--5.4软件实现）
结构化设计(StructuredDesign，SD)是其它以SRS和SA阶段所产生的是一个的过程。概要设计和详细设计主要任务是确定软件系统的结构主要任务是为每个模块设计实现的细节。
阅读更多2024-10-10
Laravel Filament 如何配置多语言支持
Laravel Filament 配置多语言支持
阅读更多2024-10-10
外包干了4年，技术退步太明显了。。。。。
先说一下自己的情况，本科生，20年通过校招进入武汉某软件公司，干了差不多4年的功能测试，今年国庆，感觉自己不能够在这样下去了，长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测
阅读更多2024-10-10
Python对PDF文件的合并操作
在处理 PDF 文件时，合并多个 PDF 文件为一个单一文件或者将某个单一文件插入某个PDF文件是一个常见的需求。Python 提供了多种库来实现这一功能，其中PyPDF2是一个非常流行的选择。该库提
阅读更多2024-10-10

L1和L2正则化的区别

1. L1正则化（Lasso Regularization）

2. L2正则化（Ridge Regularization）

3. L1与L2正则化的区别总结

4. Elastic Net（弹性网）

相关文章