H5W3
当前位置:H5W3 > python > 正文

【Python】统计科学之讲讲什么是异方差

统计科学之讲讲什么是异方差

张俊红发布于 今天 02:48

今天我们来讲一下异方差,在异方差以前,我们先讲一下与异方差类似另一个概念:同方差,那同方差又是什么呢?同方差 = 相同 + 方差,顾名思义就是方差相同。那方差又是什么呢?方差是用来反映数据的波动情况的,方差相同,说明数据的波动情况是相同的。讲完了同方差,那什么是异方差,大家应该也就明白了,异方差就是方差不相同。

为什么要讨论异方差呢,是因为我们在回归分析和方差分析中都是假设样本之间是同方差的。在方差分析中,同方差是各组之间的方差相等;在回归分析中,同方差是指对于每一个样本点来说,随机误差的平方和(残差平方和)是一样的。我们在回归部分给大家讲过,残差平方和是回归值与实际值之间距离的平方和,这一部分是除了自变量X影响之外的其他影响因素造成的,所以我们把这一部分误差叫做随机误差,如果不同样本点之间受随机误差的影响是一样的,则随机误差平方和就是一样的,也就是同方差,反之则是异方差。

如下图反映的就是同方差,也就是不同受教育年限群体之间工资波动情况是相同的。
【Python】统计科学之讲讲什么是异方差

下图反映的就是异方差,也就是不同受教育年限群体之间工资波动是不同的,受教育年限越长,工资波动会越大;受教育年限越短,工资波动会越小。
【Python】统计科学之讲讲什么是异方差

了解完了什么是异方差以后,我们来看一下如何看不同样本点之间到底是同方差还是异方差呢?这就涉及到异方差的检验了。检验异方差有描述统计方法和专门的统计检验方法,我们这里主要给大家分享一下描述统计方法——看残差图。

残差图是以残差平方和为纵坐标,一般以回归拟合值y作为横坐标,当然也可以以其他自变量x作为横坐标,以下为几种不同类型的残差图:
【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:随着横轴的变化,纵轴围绕着一条水平线在波动,说明数据之间是满足同方差性的。

【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:随着横轴的增大,纵轴的数值在变小,说明不同样本之间点之间的方差是不一样的,即异方差。
【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:横轴和残差之间是二次关系,也是异方差。

关于上面的残差图如何绘制,我们在后面的回归实操部分给大家一起讲解。

mysqlpython机器学习数据库网页爬虫
阅读 23发布于 今天 02:48
本作品系原创,采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议

俊红的数据分析之路
公众号:《俊红的数据分析之路》,分享数据分析相关的内容。
avatar

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1 声望
0 粉丝

0 条评论
得票时间

avatar

张俊红

公众号:《俊红的数据分析之路》,分享数据分析相关的内容。

1 声望
0 粉丝

宣传栏

今天我们来讲一下异方差,在异方差以前,我们先讲一下与异方差类似另一个概念:同方差,那同方差又是什么呢?同方差 = 相同 + 方差,顾名思义就是方差相同。那方差又是什么呢?方差是用来反映数据的波动情况的,方差相同,说明数据的波动情况是相同的。讲完了同方差,那什么是异方差,大家应该也就明白了,异方差就是方差不相同。

为什么要讨论异方差呢,是因为我们在回归分析和方差分析中都是假设样本之间是同方差的。在方差分析中,同方差是各组之间的方差相等;在回归分析中,同方差是指对于每一个样本点来说,随机误差的平方和(残差平方和)是一样的。我们在回归部分给大家讲过,残差平方和是回归值与实际值之间距离的平方和,这一部分是除了自变量X影响之外的其他影响因素造成的,所以我们把这一部分误差叫做随机误差,如果不同样本点之间受随机误差的影响是一样的,则随机误差平方和就是一样的,也就是同方差,反之则是异方差。

如下图反映的就是同方差,也就是不同受教育年限群体之间工资波动情况是相同的。
【Python】统计科学之讲讲什么是异方差

下图反映的就是异方差,也就是不同受教育年限群体之间工资波动是不同的,受教育年限越长,工资波动会越大;受教育年限越短,工资波动会越小。
【Python】统计科学之讲讲什么是异方差

了解完了什么是异方差以后,我们来看一下如何看不同样本点之间到底是同方差还是异方差呢?这就涉及到异方差的检验了。检验异方差有描述统计方法和专门的统计检验方法,我们这里主要给大家分享一下描述统计方法——看残差图。

残差图是以残差平方和为纵坐标,一般以回归拟合值y作为横坐标,当然也可以以其他自变量x作为横坐标,以下为几种不同类型的残差图:
【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:随着横轴的变化,纵轴围绕着一条水平线在波动,说明数据之间是满足同方差性的。

【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:随着横轴的增大,纵轴的数值在变小,说明不同样本之间点之间的方差是不一样的,即异方差。
【Python】统计科学之讲讲什么是异方差

上面这种类型的残差图:横轴和残差之间是二次关系,也是异方差。

关于上面的残差图如何绘制,我们在后面的回归实操部分给大家一起讲解。

本文地址:H5W3 » 【Python】统计科学之讲讲什么是异方差

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址