正则化

L1和L2正则化

L1和L2正则化是机器学习和深度学习中常用的两种技术，它们用于控制模型的复杂度，防止过拟合，并提高模型的泛化能力。这两种正则化方法通过在损失函数中添加一个额外的惩罚项来实现，该惩罚项与模型参数的大小相关。下面是L1和L2正则化的详细解释：

L2正则化，也称为欧几里得范数正则化，通过惩罚参数的平方和来工作。它的目标是使参数值尽可能小，从而限制模型的复杂度。

数学表达式：
[ L_{2} = \lambda \sum_{i=1}^{n} w_i^2 ]

其中，( w_i ) 是模型参数，( \lambda ) 是正则化系数（一个超参数），控制着正则化项的强度，( n ) 是参数的总数。

特点：

L1正则化，也称为拉普拉斯范数正则化，通过惩罚参数的绝对值之和来工作。与L2正则化不同，L1正则化可以产生稀疏权重矩阵，即模型参数中的一部分会变为0。

数学表达式：
[ L_{1} = \lambda \sum_{i=1}^{n} |w_i| ]

其中，( w_i ) 是模型参数，( \lambda ) 是正则化系数，( n ) 是参数的总数。

特点：

正则化是深度学习中控制模型复杂度的重要工具，通过合理选择正则化类型和调整正则化系数，可以显著提高模型的泛化能力和性能。

正则化

https://cs-lb.github.io/2024/06/01/深度学习/正则化/

作者

Liu Bo

发布于

2024年6月1日

许可协议