作者:山海 | 来源:互联网 | 2023-06-19 17:53
7.1过拟合的问题训练集表现良好,测试集表现差。鲁棒性差。以下是两个例子(一个是回归问题,一个是分类问题)解决办法:(1)丢弃一些不能帮助我们正确预测的特征。可以使用工选择保留哪些
7.1过拟合的问题
训练集表现良好,测试集表现差。鲁棒性差。以下是两个例子(一个是回归问题,一个是分类问题)


解决办法:
(1)丢弃一些不能帮助我们正确预测的特征。可以使用工选择保留哪些特征,或者使用一些模型选择的算法来帮忙(PCA);
(2)正则化。保留素有的特征,但是减少参数的大小。
7.2代价函数

其中λ称为正则化参数。
经过正则化处理的模型和原模型的可能对比如如下:

不对θ0正则化。
7.3正则化线性回归


对于j=1,2,3……有:

可以看出,正则化线性回归的梯度下降法的变化在于,每次都会在原有算法的更新规则的基础上令θ值减少了一个额外的值。
7.4正则化的逻辑回归模型
