金融保险省电大开放教育开放本科金融专业Word文件下载.docx
《金融保险省电大开放教育开放本科金融专业Word文件下载.docx》由会员分享,可在线阅读,更多相关《金融保险省电大开放教育开放本科金融专业Word文件下载.docx(8页珍藏版)》请在冰豆网上搜索。
这时就可以按正态分布来进行推断。
当n为小样本时,其分布则不是正态分布,这时就不能按正态分布进行推断。
同样,对于样本比例的分布,我们也需要知道的数学期望和方差。
统计证明,的数学期望等于总体的比例,即:
,而的方差则与抽样方法有关,在重复抽样条件下,有:
,在不重复抽样条件下,则用修正系数加以修正,即:
也就是说,在重复抽样条件下,样本比例的抽样分布为;
在不重复抽样条件下,样本比例的抽样分布为:
与样本均值分布的方差一样,对于无限总体进行不重复抽样时,可以按重复抽样来处理。
此时样本比例的方差仍可按来计算。
对于有限总体,当N很大,而抽样比时,其修正系数趋于1,这时样本比例的方差也可以按来计算。
统计证明,对于来自正态总体的简单随机样本,比值的抽样分布服从自由度为(n-1)的分布,即。
总体方差的区间估计就是用分布来建立的。
在知道了样本统计量的分布后,我们就可以根据其分布来估计总体的参数了。
用样本统计量估计总体参数的方法有点估计和区间估计两种。
点估计就是用样本估计量直接作为总体参数的估计值。
一个优良的估计量应满足无偏性、有效性和一致性三个标准。
但由于点估计没有给出估计的可靠程度,实际中我们更多的使用区间估计,它是在点估计的基础上,给出总体参数估计的一个范围,并指出总体参数落在这一范围的概率是多少。
总体参数所在的区间称为置信区间。
总体均值的区间估计有以下集中情况:
一是正态总体方差已知,或非正态总体方差未知但大样本。
这种情况下,可以根据正态分布建立总体均值的置信区间。
在重复抽样条件下,总体均值在置信水平下的置信区间为:
;
在不重复抽样条件下,总体均值的置信区间为:
如果总体方差未知,即使总体为非正态分布,只要在大样本条件下,则可以用样本方差代替总体方差,这时总体均值在置信水平下的置信区间可以写为:
二是正态总体方差未知,且小样本。
在这种情况下,则需要用样本方差代替,这时,将样本均值标准化后的结果不再服从标准正态分布,而是自由度为n-1的t分布。
在这种情况下,应采用t分布来建立总体均值的置信区间。
根据t分布建立的总体均值在
置信水平下的置信区间为:
对于总体比例的置信区间,当样本容量很大时,即当,就可以认为样本容量足够大,这时样本比例的抽样分布可以用正态分布近似。
这时可以根据正态分布来建立总体比例的置信区间。
总体比例在置信水平下的置信区间为:
在不重复抽样条件下,总体比例在置信水平下的置信区间为:
估计总体方差的置信区间则要用分布。
总体方差的置信区间为。
开方后即得到总体标准差的置信区间。
抽样估计中的另一个问题是如何确定一个适当的样本容量。
增加样本容量可以提高估计的准确性,但样本容量的增加会受到许多限制。
一个合适的样本容量与估计时所要求的估计误差(边际误差)有关。
在一定的边际误差条件下,采用重复抽样估计总体均值时所需的样本容量为:
采用不重复抽样估计总体的均值时所需的样本容量为:
采用重复抽样估计总体比例时多需的样本容量为:
采用不重复抽样的估计总体比例时所需的样本容量为:
(二)学习要求
通过本章的学习,要求掌握以下内容:
(1)理解抽样的含义,掌握抽取样本的具体方法;
(2)理解抽样分布的含义,掌握样本均值和样本比例的抽样分布。
(3)了解点估计的含义,掌握平价估计量的标准;
(4)掌握样本容量的确定方法;
(5)熟练掌握总体均值和总体比例的区间估计方法;
(6)能应用本章所学方法对实际问题进行估计与分析。
1、对抽样推断的理解
抽样推断是从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。
2、对抽样分布的理解,样本统计量的分布与总体分布的关系。
所谓抽样分布,就是指样本统计量的分布。
所有的样本均值形成的分布就是样本均值的抽样分布。
样本均值抽样分布的形状与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。
其分布的数学期望为总体均值,方差为总体方差的1/n,即~N(,/n)。
如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n≥30),根据统计上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。
其分布的数学期望为总体均值,方差为总体方差的1/n。
3、简述评价估计量好坏的标准。
(1)无偏性。
无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为,所选择的估计量为,如果E()=,称为的无偏估计量。
(2)有效性。
一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。
假定有两个用于估计总体参数的无偏估计量,分别用和表示,它们的抽样分布的方差分别用D()和D()表示,如果的方差小于的方差,即D()<
D(),我们就称是比更有效的一个估计量。
在无偏估计的条件下,估计量方差越小估计也就越有效。
(3)一致性。
一致性是指随着样本容量的增大,点估计量的值越来越接近总体的参数。
换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。
4、简述样本容量与置信概率、总体方差、边际误差的关系。
从样本容量的公式可以看出,样本容量与置信概率成正比,在其他条件不变的情况下,置信概率越大,所需的样本容量也就越大;
样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;
样本容量与边际误差的平方成反比,我们可以接受的边际误差越大,所需的样本容量就越小。
4、Z的含义是什么?
Z是估计总体均值时的边际误差(Marginerror),也称为估计误差。
总体均值的置信区间就是由点估计值和描述估计量精度的边际误差两部分组成的。
6、某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。
采取不重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求该小区中赞成该项改革的户数比例的置信区间,置信水平为95﹪。
(2)如果小区管理要求估计时的边际误差不超过10﹪,应抽取多少户进行调查?
解答:
(1)以知N=500,n=50,已知样本比例为:
=赞成的户数/n=32/50=64﹪
样本比例的抽样标准为:
===6.45﹪
由于n=50064﹪=32>
5,所以可以用正态分布建立总体合格率的置信区间。
置信率为95﹪时,Z=1.96。
边际误差为:
E=Z=1.96=12.63﹪
总体比例的置信区间为:
Z=64﹪12.63﹪
即我们可以用95﹪的概念保证,该居民小区赞成改革的户数比例在51.37﹪~76.63﹪之间。
(2)当要求边际误差不超过10﹪时,应抽取的样本容量为:
n=
=
=75.33≈76(户)
7、某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95﹪的置信水平估计每个顾客购物金额的置信区间,要求边际误差不超过20元,应抽取多少个顾客作为样本?
已知=120,边际误差E=20,置信概率为95﹪时,Z=1.96。
应抽取的样本容量为:
n===138.3≈139
8、某大学共有在校本科生8000人,学校想要估计每个学生一个月的生活费支出金额,准备采取不重复抽样方法。
根据前几届的毕业生资料,平均每个学生月生活费支出金额的标准差约为50元,若本次估计确定的置信概率为95﹪,要求边际误差不超过20元,应抽取多少名学生进行调查?
已知N=8000,=50,边际误差E=20,置信概率为95﹪时,Z=1.96。
n===23.94≈24
应抽24个学生作为样本。
9、某种饮料采用自动饮料机进行灌装,其重量的方差对生产厂家来说时非常重要的。
如果方差太大,过度灌装或灌装不足,都会使顾客不满意。
一个可以接受的灌装方差为≤8(灌装重量以克计)。
为对生产过程进行检测,厂家随机抽取了20个样品组成一个样本,测得样本方差为12。
取显著性水平α=0.05,建立该灌装饮料重量方差的置信区间,并说明样本是否表明方差太大,需要对灌装机进行停产检验?
总体方差的置信区间为:
根据显著性水平=0.05和自由度(n-1)=(20-1)=19,查分布表得,。
即6.94≤≤25.6。
即该种灌装饮料总量的方差在6.94~25.6克之间。
由于方差上限超过了可以接受的灌装方差≤8,所以需要停产检查。
第五章检验你所提出的假设
本章主要介绍假设检验的基本原理与方法。
与参数估计一样,假设检验是统计推断的,另一个重要内容。
它与叁数估计的区别是:
在参数估计中,估计之前总体参数是未知的,从总体中抽出一个样本,然后利用样本所提供的信息估计总体参数的值;
在假设检验中,检验之前总体参数也是未知的,但我们先对总体参数提出一个假设,而后抽取样本,利用样本所提供的信息检验这一假设是否成立。
与参数估计一样,在假设检验中,就一个总体而言,我们所关心的总体参数也主要是总体均值、比例和方差;
对于两个总体,所关心的参数主要有两个总体的均值之差、两个总体的比例之差、两个总体的方差等。
本章我们要对这些内容分别介绍。
考虑到学生已经学过假设检验的内容,在写法上注重于方法的应用。
检验的过程大体上为:
对总体参数提出假设;
选择检验的统计量;
根据样本计算统计量的值;
选择显著性水平;
根据统计量的值与显著性水平下的临界值进行比较,作出接受或拒绝原假设的决策。
检验的方法有单侧检验和双侧检验。
采用哪种检验,要看我们所关心的问题以及假设的具体形式。
假设检验所依据的是统计上的小概率原理。
所谓小概率,是指一个概率很小的值。
通常所使用的小概率值主要有0.01、0.05和0.1等。
一个几乎不可能发生的事件在一次实验中发生的概率很小,如果它一旦发生,我们就有理由拒绝原来的假设。
当然,拒绝或接受假设都有可能犯错误。
在假设检验中,这类错误称为第一类错误,也叫错误,也成为风险;
另一类错误是原假设为假,我们却接受了原假设,这类错误称为第二类错误,也称为错误。
在实际应用中,我们主要控制第一类错误。
就一个总体而言,我们要检验的参数主要有总体均值、总体比例和总体方差。
对于两个总体参数的检验,统计量的计算比较复杂。
在学习中,要求使用Excel进行有关的统计检验。
通过本章学习,要求掌握以下内容:
(1)理解假设检验的原理与统计思想,掌握假设检验与参数估计的区别。
(2)理解假设检验中的小概率原理。
(3)理解显著性水平的含义。
(4)掌握假设检验的拒绝准则。
(5)理解并运用P进行检验。
(6)能够利用Excel进行两个总体参数的统计检验。
并对Excel的输出结果进行解释和分析。
(7)能结合实际问题进行假设检验。
1、对原假设和备择假设的理解
原假设是我们要通过样本判断其是否成立的一个命题,用表示;
备择假设是与原假设相反的假设,通常用表示。
在假设检验中,原假设与备择假设是一个完备事件组,两个假设必有一个成立,而且只有一个成立。
2、在双侧检验中,拒绝原假设的规则是什么?
在双侧检验中,原假设为“=”,备侧假设为“≠”,因而拒绝域在分布的两个尾部。
使用正态分布进行检验时,若检验的统计量Z>
或Z<
-时,拒绝原假设。
或者说,若检验的统计量时,拒绝原假设。
当使用t分布进行检验时,若检验的统计量t>
t或t<
-t时,拒绝原假设。
当使用分布进行检验时(对总体方差的检验),若检验的统计量>
t或<
时,拒绝原假设。
3、单侧检验中,拒绝原假设的规则是什么?
单侧检验有左侧检验和右侧检验两种。
左侧检验的原假设为:
参数≥某一数值。
因而其拒绝域在左侧。
如果检验的统计量值小于α水平下的临界值,则拒绝原假设。
右侧检验的原假设为:
参数≤某一数值。
因而其拒绝域在右侧。
如果检验的统计量值大于α水平下的临界值,则拒绝原假设。
4、一种杂志声称25﹪的读者为大学生。
一个由400名读者组成的随机样本表明,其中84名是大学生。
(1)在0.01的显著性水平下,检验该杂志的说法是否成立?
(2)在0.05的显著性水平下,会得出什么样的结论?
(3)在0.1的显著性水平下,会得出什么样的结论?
先计算出样本比例,结果如下:
提出假设:
:
,
计算检验的统计量为:
Z=
(1)当=0.01时,临界值=2.58,由于,不能拒绝:
即该杂志的说法是成立的。
(2)当=0.05时,临界值=1.96,由于,不能拒绝:
(3)当=0.1时,临界值=1.65,由于,应拒绝:
即该杂志的说法是不成立的。
5、一种产品需要人工组装,每个工人组装产品数量的方差为100。
企业准备采用一种新的方法组装产品,以提高产品的数量,但管理人员希望新的方法组装产品的方差保持原有的水平。
由25名工人组成一个随机样本表明,采用新方法组装产品数量的方差为120。
试以显著性水平α=0.05,检验新方法组装产品数量的方差与原来的方法是否相同?
=100:
≠100。
计算检验统计量:
=
由于是双侧检验,拒绝原假设的法则是:
或。
查表得分位数为
=,由=28.8<
39.3641,因而接受原假设,以95﹪的可靠性认为新方法组装产品数量的方差与原来相同。
或者,查表得分位数为,由=28.8>
12.4011,因而接受原假设,以95﹪的可靠性认为新方法组装产品数量的方差与原来相同。
6、某企业管理人员对采用两种方法组装新产品所需的时间(分钟)进行测试,随机抽取6个工人,让他们分别采用两种方法组装同一种产品,采用方法A组装所需的时间和采用方法B组装所需的时间如下表。
假设组装的时间服从正态分布,以α=0.05的显著性水平比较两种方法是否有差别。
方法A方法B
8.29.5
5.38.3
6.57.5
5.110.9
9.711.3
10.89.3
由于总体方差未知,所以应采用t检验。
:
-=0两种方法组装的时间没有差异
-≠0两种方法组装的时间有差异
将A种方法组装时间的数据输入到工作表中的A2:
A7,B种方法组装时间的数据输入到工作表中的数据输入到工作表的B2:
B7。
然后按下列步骤操作:
第一步:
选择“工具”下拉菜单
第二步:
选择“数据分析”选项
第三步:
在分析工具中选择“t检验:
平均值的成对二样本分析”
第四步:
当出现对话框后
在“变量1的区域”方框内键入A2:
A7
在“变量2的区域”方框内键入B2:
B7
在“假设平均差”方框内键入0
在“α”方框内键入0.05
在“输出选项”中选择输出区域
选择“确定”。