为什么偏正态分布的样本不是正态分布?
I的印象是,如果我从一个偏正态分布中随机抽样,根据中心极限定理,我的样本的分布将是正态的,但图表清楚地表明不是这样的。有人能帮助我理解我的假设哪里错了
解答动态
我的印象是,如果我从一个偏正态分布中随机抽样,根据中心极限理论,我的样本的分布将是正态的。你对中心极限定理的理解是错误的(正如戴夫指出的,这是一个很常见的误解)。CLT指出,在某些条件下,样本平均数的极限分布是正态分布,而不是从非正态总体中采样的数据将具有正态分布。
如果运行不同的模拟,您可以看到这一点,你模拟样本的地方方法:
导入随机导入numpy作为npfromscipy.统计导入skewnorm,normimport seaborn作为snsimportmatplotlib.pyplot文件当pltskewed=skewnorm(4)时,对于范围(10000)内的i,模拟的_平均值=[]:数据=倾斜.rvs(100)模拟_平均数.append(np.平均值(数据)sns.distplot图(模拟平均值,拟合=标准值)节目()
在此在特殊情况下,我们看到当n=100时,平均值的样本分布或多或少是正态的;正态拟合是黑线。这并不总是正确的,因为CLT是一个渐进的结果,但这样的模拟可以帮助我们了解特定样本量下特定人群的抽样分布情况类比:
Let假设有一个1000万人口的国家有一个男人和9999999个女人你期望通过增加样本的大小,你会越来越接近“正常”的比例1:1(1男1女)?
另一个论点-为你的歪斜dis贡品:如果你以整个人口为样本(即非常大的“样本”),然后奇迹般地,你的倾斜人口突然变成了正常人口?第2页- End
免责声明:
本页内容仅代表作者本人意见,若因此产生任何纠纷由作者本人负责,概与琴岛网公司无关。本页内容仅供参考,请您根据自身实际情况谨慎操作。尤其涉及您或第三方利益等事项,请咨询专业人士处理。