在统计学中,平均平方誤差(英語:mean-square error、MSE)是对于无法观察的参数
的一个估计函数T;其定义为:
即,它是“误差”的平方的期望值。误差就是估计值与被估计量的差。均方误差满足等式
![{\displaystyle \operatorname {MSE} (T)=\operatorname {var} (T)+(\operatorname {bias} (T))^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/57d49f1e0275f312e20c5c697d862348dd026bec)
其中
![{\displaystyle \operatorname {bias} (T)=\operatorname {E} (T)-\theta ,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61b811b098a8b6dbd5268afb03c378481b5c9a39)
也就是说,偏差
是估计函数的期望值与那个无法观察的参数的差。
下边是一个具体例子。假设
![{\displaystyle X_{1},\dots ,X_{n}\sim \operatorname {N} (\mu ,\sigma ^{2}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d4234462ce9b3797e383b8af87ac4952cd7b5f4)
即
是一组来自正态分布的样本。常用的两个对σ2估计函数为:
和 ![{\displaystyle {\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\,\right)^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/155e2a34f02a1cf0a48e1a2ab94c3a91a0a84222)
其中
![{\displaystyle {\overline {X}}=(X_{1}+\cdots +X_{n})/n}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7a30f1b9c37a22f402e506bdb9c8ecaeca245192)
为样本均值。
第一个估计函数为最大似然估计,它是有偏的,即偏差不为零,但是它的方差比第二个小。而第二个估计函数是无偏的。较大的方差某种程度上补偿了偏差,因此第二个估计函数的均方误差比第一个要大。
另外,这两个估计函数的均方误差都比下边这个有偏估计函数大:
这个估计函数使得形如
(其中c是常数)的均方误差最小。
外部链接[编辑]