统计学三大分布与正态分布的关系.docx
《统计学三大分布与正态分布的关系.docx》由会员分享,可在线阅读,更多相关《统计学三大分布与正态分布的关系.docx(13页珍藏版)》请在冰豆网上搜索。
统计学三大分布与正态分布的关系
统计学三大分布与正态分布的关系[1]
张柏林41060045理实1002班
摘要:
本文首先将介绍分布,分布,分布与正态分布的定义及基本性质,然后用理论说明分布,分布,分布与正态分布的关系,并且利用数学软件MATLAB来验证之、
1、三大分布函数[2]
1、1分布
分布就是一种连续型随机变量的概率分布。
这个分布就是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它就是由正态分布派生出来的,主要用于列联表检验。
定义:
若随机变量相互独立,且都来自正态总体,则称统计量为服从自由度为的分布,记为、
分布的概率密度函数为
其中伽玛函数,分布的密度函数图形就是一个只取非负值的偏态分布,如下图、
卡方分布具有如下基本性质:
性质1:
;
性质2:
若,相互独立,则;
性质3:
;
性质4:
设,对给定的实数称满足条件:
的点为分布的水平的上侧分位数、简称为上侧分位数、对不同的与n,分位数的值已经编制成表供查用、
分布的上分位数
1、2分布
分布也称为学生分布,就是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置、
定义:
设,相互独立,,则称统计量服从自由度为的分布,记为、
分布的密度函数为
分布的密度函数图
分布具有如下一些性质:
性质1:
就是偶函数,;
性质2:
设,对给定的实数称满足条件;的点为分布的水平的上侧分位数、由密度函数的对称性,可得类似地,我们可以给出t分布的双侧分位数
显然有对不同的与,分布的双侧分位数可从附表查得、
分布的上分位数
1、3分布
分布就是随机变量的另一种重要的小样本分布,应用也相当广泛、它可用来检验两个总体的方差就是否相等,多个总体的均值就是否相等、分布还就是方差分析与正交设计的理论基础、
定义:
设,相互独立,令则称统计量服从为第一自由度为,第二自由度为的分布、
分布的密度函数图
分布具有如下一些性质:
性质1:
若;
性质2:
若,则;
性质3:
设,对给定的实数称满足条件;
的点为分布的水平的上侧分位数、
分布的上分位数
分布的上侧分位数的可自附表查得、
性质4:
此式常常用来求分布表中没有列出的某些上侧分位数、
1、4正态分布
正态分布就是数理统计中的一种重要的理论分布,就是许多统计方法的理论基础、高斯(Gauss)在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布、正态分布有两个参数,μ与σ,决定了正态分布的位置与形态、为了应用方便,常将一般的正态变量X通过u变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布、
正态分布的密度函数与分布函数
若连续型随机变量具有概率密度为
其中为常数,则称服从参数为的正态分布,记为、
正态分布的密度函数图
特征1:
正态曲线(normalcurve)在横轴上方均数处最高;
特征2:
正态分布以均数为中心,左右对称;
特征3:
正态分布有两个参数,即均数与标准差、就是位置参数,固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动、就是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭、通常用表示均数为,方差为的正态分布、用表示标准正态分布、
特征4:
正态曲线下面积的分布有一定规律。
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率、正态曲线下一定区间的面积可以通过标准正态分布函数表求得。
对于正态或近似正态分布的资料,已知均数与标准差,就可对其频数分布作出概约估计、
2、三大分布与正态分布的密度函数比较[3]
2、1分布收敛于正态分布
设,则对任意x,有、
证明:
因为分布的
所以由独立同分布中心极限定理得
因为且
所以
因为
所以
=
令,利用Stirling公式:
则上式=
=
=
=
所以分布的极限分布为正态分布、
下面用MATLAB来验证上面结论,首先定义分布函数与相应的正态分布,再依次增大,比较两者关系:
[4]
从上面三个图形可以瞧出,越大,分布密度函数与正态分布度函数越接近,这就与所证结论相符合、
2、2t分布收敛于标准正态分布
若服从自由度为的t分布,
(1)
证法1:
由于自由度为n的t分布的概率密度函数为
因此
(1)式等价于
(2)
先利用Stirling公式:
证明
事实上,利用函数的性质
当时
当时亦可推出同样的结果。
另外,由特殊极限公式可得
综合上诉,即证明
(2)式
所以,分布的极限分布就是正态分布、
下面用MATLAB来验证上面结论,首先定义分布函数与相应的正态分布,再依次增大,比较两者关系:
从上面三个图形可以瞧出,越大,分布密度函数与正态分布度函数越接近,这就与所证结论相符合、
2、3分布收敛于标准正态分布
若服从为第一自由度为,第二自由度为的分布,则、
证明:
所以
因为
所以由中心极限定理,当时
所以分布的极限分布就是正态分布、
下面用MATLAB来验证上面结论,首先定义分布函数与相应的正态分布,再依次增大,比较两者关系:
从上面三个图形可以瞧出,越大,分布密度函数与正态分布度函数越接近,这就与所证结论相符合、
在实际应用中我们往往在取得总体的样本后,通常就是借助样本的统计量对未知的总体分布进行推断,为此须进一步确定相应的统计量所服从的分布,正态分布、分布、分布、分布就是统计学最基本的四种分布,而分布、分布与分布又都收敛于正态分布,可见正态分布在统计学中的地位、实际上,证明分布、分布与分布收敛于正态分布的方法很多,本质上都就是应用了大数定理与中心极限定理、既然三大抽样分布都收敛于正态分布,则当样本容量很大时,就可以用正态分布来近似三大抽样分布、本文主要还利用了计算机软件来验证数学上的理论证明,在现代数学学习中,我们就是离不开计算机的,因此我们也应多学习一些软件的使用、
参考文献:
[1]XX学士学位论文、统计学三大分布与正态分布的差异、扬州大学.2010
[2]范玉妹,汪飞星,王萍,李娜、概率论与数理统计、 机械工业出版社.2007
[3]宗序平,赵俊,陶伟、统计学上三大分布推导方法、2009
[4]王福昌,曹慧荣、分布、分布与分布的近似计算、2008
[5]李贤平,沈崇圣,陈予毅、概率论与数理统计、复旦大学出版社、2005