经济应用统计习题集new解读文档格式.docx

上传人:b****6 文档编号:19687425 上传时间:2023-01-08 格式:DOCX 页数:40 大小:118.80KB
下载 相关 举报
经济应用统计习题集new解读文档格式.docx_第1页
第1页 / 共40页
经济应用统计习题集new解读文档格式.docx_第2页
第2页 / 共40页
经济应用统计习题集new解读文档格式.docx_第3页
第3页 / 共40页
经济应用统计习题集new解读文档格式.docx_第4页
第4页 / 共40页
经济应用统计习题集new解读文档格式.docx_第5页
第5页 / 共40页
点击查看更多>>
下载资源
资源描述

经济应用统计习题集new解读文档格式.docx

《经济应用统计习题集new解读文档格式.docx》由会员分享,可在线阅读,更多相关《经济应用统计习题集new解读文档格式.docx(40页珍藏版)》请在冰豆网上搜索。

经济应用统计习题集new解读文档格式.docx

5:

方差与标准差

(1)总体方差与标准差

某项心理测试(被试者年龄18—35岁)分数如下表:

测试分数(分)被试者f组中值Xf(X-112)2f

40—601

60—804

80—10012

100—12016

120—1409

140—1605

160—1803

合计5027.2

(2)样本方差与标准差

随机选出15名学院学生,问他们昨晚睡眠的小时数,得到的数据是

5668779548116787

计算样本方差和标准差

(3)标准化系数的应用:

6、离散系数

(1)对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组:

166169172177180170172174168173

幼儿组:

68696870717372737475

(2)

股票A五个星期的平均价格分别为

57、68、64、71、62

股票B五个星期的平均价格分别为

12、17、8、15、13

试评价哪种股票的价格风险更大?

第4章抽样分布课堂练习

抽样分布:

全部可能样本统计量的概率分布叫做抽样分布。

以下是一个极端的例子:

▲案例1:

假定一个实验小组有四人N=4,其写作成绩分别为:

21、20、19、18(分)(25为满分)。

若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、标准差如下表:

●中心极限定理:

●平均数的抽样分布及应用:

▲案例2:

假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?

图1:

总体分布:

σ=2000图2:

抽样分布

P?

15000X15000

▲习题1:

某次年级英语考试,全部考生成绩服从平均数为75分,标准差为8分的正态分布。

从中随机抽取25人,其样本平均数偏离原总体平均数4分以上的可能性有多大?

▲习题2:

某零售集团公司的所有商场资金流转天数为:

50天,标准差为18天,若对这些商场进行样本容量为36家的随机抽样调查,被调查商场资金流转天数平均在48—52天之间的概率是多少?

▲习题3:

从阿根廷、加拿大、美国到货三批玉米,分别为600包、6000包、60000包。

合同规定三批玉米平均每包重量都是80公斤,标准差都是4公斤。

(1)若从每批玉米中都抽取300包为样本,分别计算它们的平均误差。

有何启示?

(要求都使用修正系数)

(2)分别计算三批玉米平均重量少于79.5公斤以上的概率?

●比例的抽样分布:

▲案例3:

据资料记录,二年级的学生中有43%人,阅读某类文章后表示有困难,现随机抽取100人阅读同类文章,问:

感到有困难的学生占五成以下的概率是多少?

习题4:

一家工厂在正常情况下产品次品率为8%,若产品批量比较大,随机抽取100个产品进行检验,求次品率在7%—9%之间的概率。

第五章参数估计复习提纲

◎估计量:

用来估计总体参数的样本统计量。

如:

算术平均数、方差等。

●估计的优良性原则:

数理统计证明,一个“优良”的样本统计量应具备以下特征:

(1)、无偏性。

样本估计量的期望值应等于总体参数。

(2)、有效性。

在多个无偏估计量中,方差最小的估计量最有效。

(3)、一致性。

随着样本容量的增加,可以使估计量越来越靠近总体参数。

●估计的类型包括:

1、点估计:

只有一个取值。

2、区间估计:

给出取值范围(值域)。

两种估计类型哪一种更科学?

二者关系

区间估计的优点在于:

它在给出估计区间时,还可以给予一个“可信程度”。

●区间估计中几个常用概念

1、置信度(置信系数):

它是指与一个估计区间相联系的概率,它表示该区间将包括总体参数的可能程度。

用1-α表示。

2、置信区间:

与一个“置信度”相联系的估计值的取值范围。

3、置信限:

与置信区间相联系的界限,包括上限和下限。

▲思考题:

置信度与置信区间有何关系?

短的区间提供更多的信息,估计更为精确,置信度与精确度的关系?

如何使二者提高?

总体均值的估计

一、大样本条件下的估计方法

(1)、总体标准差σ已知条件下,对总体平均数的区间估计

1、某茶叶进出口公司,准备处理一批库存2年的茶叶,出库之前要进行一次检验。

检验数据如下;

样本容量为64包,样本平均数为每包2公斤,入库记录表明总体标准差为0.2公斤。

经理要求在95%的可信度下,估计一下这批茶叶的平均重量在多大范围内?

(2)、总体标准差σ未知条件下的区间估计

※总体标准差σ未知条件下,一般用样本标准差S代替总体标准差σ。

1、一次等级考试,因急于评估试题质量,教师先随机抽取36份试卷批改,平均分是72分,标准差13.2分,系主任要求在90%的可信度下,对全体考生的平均成绩做一个区间估计。

2、某土产畜产公司收购一批烟草,抽取30箱为样本,平均重量为20公斤,标准差为3公斤。

求:

(1)置信度为95%时,这批烟草的平均重量;

(2)置信度为80%时,这批烟草的平均重量。

二、小样本条件下的估计方法

使用t分布的条件:

当样本容量n<30,总体标准差σ未知时,用样本标准差S代替总体标准差σ。

样本标准差S

计算公式:

1、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为12分钟,样本标准差为4.1分钟,则:

其95%的置信区间是多少?

若样本容量为40,而观测的数据不变,则95%的置信区间又是多少?

2、一批出口商品出库之前从中抽取14箱,其平均重量为40.5公斤,标准差0.5公斤。

主管人员要求在98%的置信系数下,对这批商品的平均重量做个区间估计。

3、某公司共有技术开发和中层管理人员600名,公司十分关心他们的身体健康现状,责成有关部门进行了一次睡眠状况抽样调查,获得资料如下表:

(单位:

小时)

员工每周睡眠员工每周睡眠员工每周睡眠员工每周睡眠

序号时间序号时间序号时间序号时间

15064811541650

24074712561751

33084513501847

43894314481948

542104715482054

试以95%的置信系数对600名技术开发和中层管理人员平均每周的睡眠状况作一个区间估计。

总体比例的区间估计

大样本情形

※中心极限定理证明:

P不接近0或1,且n很大时,其抽样分布趋近于正态分布。

比例抽样分布的平均误差为:

1、某工厂生产电子仪器设备,在一次抽样检查中,从抽出的136件样品中,检验出7件不合格品,试估计该厂电子仪器合格率的95%的置信区间?

2、某西部人才咨询部门收到大批申请去西部工作的信函,人力资源管理部门想了解被录用的比例,从中抽取500人,发现只有76人被录用。

现要求使用95%的可信度,对总体比例做一个区间估计。

3、某私营企业为提高业务人员的业务能力,在拟订一项培训计划之前,对一个由300名员工组成的随机样本进行测试,结果发现参加测试人员中只有75人达到要求。

主管人员要求在置信度为99%的条件下,作一个区间估计。

两个总体参数的区间估计

(一)、两总体均值之差的区间估计

●1、独立样本

(1)大样本情形下的估计

1、某研究所想了解甲乙两地区平均身高的差异,为此在两地独立的抽取两个随机样本,有关数据如下:

n1=50,n2=60,甲地区抽样计算平均身高160cm,总体标准差为10cm,而乙地区抽样计算平均身高为165cm,总体标准差为15cm,试确定两地身高差别在90%的置信区间?

2、某地去调查人员甲与乙,分别在该地东部与西部调查职工月收入。

甲在东部随机抽查200个职工,得样本平均值为800为,样本标准差为200元;

乙在西部随机调查180个职工,得样本均值为620元,样本标准差为150元,试确定东西部地区平均月收入在95%的置信区间。

(2)小样本情形下的估计

前提条件:

两个总体都服从正态分布;

两个总体方差未知;

独立的两个样本

1、为比较甲乙两种型号的步枪子弹的枪口速度,随机抽取甲子胆10发,得到枪口速度的平均值为500米每秒,标准差为1.1米每秒,随机抽乙子弹20发,得到枪口速度的平均值为496米每秒,标准差为1.2米每秒,假设两总体均服从正态分布,且由生产过程中认为他们的方差相等,求两总体均值差的置信度为0.95的置信区间。

2、为了解甲乙两地民工周工资的差异,现分别独立随机的从两地各抽取容量为20样本,计算出甲地平均周工资为200元,标准差为20元,而乙地周平均工资为225元,标准差为50元,若两总体的方差不等,试确定两地工资差异的95%的置信区间。

●2、匹配样本

1、有两台仪器甲、乙,用来测量材料中某种金属的含量,为鉴定为他们的测量结果的差异,制备了9件金属试块进行试验,现分别用两台仪器对每一试块进行测量,结果如下:

试确定测量差异的95%的置信区间。

X%

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Y%

0.1

0.21

0.52

0.32

0.78

0.59

0.68

0.77

0.89

D=x%-y%

0.09

-0.12

0.18

-0.18

0.11

0.12

0.13

(二)、两总体比例之差的区间估计

1、美国一家大型的汽车保险公司抽取了未婚及已婚男性保险单持有人的样本,并记录了以往3年内要求索赔的次数。

其中未婚保单持有人400,要求索赔次数76,已婚保单持有人900,要求索赔次数90,求未婚和已婚保单持有人的索赔率差异,置信度为95%

样本容量的确定

1、估计总体均值时样本容量的确定

(1)某公司要对下一年职工医疗费情况作个预算,通常医疗费的σ为120元。

现要求在95%的置信度下,保证所估计的总体平均数在加减40元范围内。

应该取多大样本?

(2)教研室主任要想知道大二年级英语统考的总体平均分数,并希望以95%的置信度,使估计的实际平均数在加减20分内,问抽取多大样本合适?

(以往经验总体标准差为70分)

(3)某公司为了解市场需求,曾多次进行市场调查,调查方式是与消费者交谈。

交谈时间的标准差一般是6分钟。

假如公司希望平均访谈时间的允许误差为2分钟,则在98%的置信度条件下,需要多大的样本?

(4)为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。

1、试对家庭每天平均看电视时间进行区间估计2、若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将允许误差控制在第一问的水平,问此时需要调查多少户才能满足要求?

2、估计总体比例时,n的确定:

(1):

据某市场调查公司对某市80名随机受访的购房者的调查,得到该市购房者中本地人购房比例p的区间估计,置信水平为0.1时,边际误差为0.08,则:

1、这80名受访者样本中为本地购房者的比例p是多少?

2、若置信水平为0.05时,则要保持同样的精度进行区间估计,需要调查多少名购房者?

第六章假设检验复习提纲

一、假设检验:

利用样本信息判断假设是否成立的过程,分为参数检验和非参数检验。

本章研究参数检验,即先对总体参数提出某种假设,然后利用样本信息判断假设是否成立。

假设检验是逻辑反证法和小概率原理的完美结合。

二、原假设和备择假设:

这是两个互相对立的假设,其中只能有一个成立。

◎原假设:

也称虚拟假设(无效假设、零假设),研究者想要收集数据反对的假设:

◎备择假设:

也称对立假设,研究者想要收集数据证明的假设。

三、显著水平与置信度以及P值

在检验一个假设时,有四种可能结果

(1)

(2)

(3)(4)

※,显著性水平它表示如果假设是真的,在某一界限范围以外样本平均数所占的百分比。

显著水平用α表示(假设检验的基本原理是根据小概率原理,做出是否接受原假设决定的)。

常用的显著水平为:

α=0.1、0.05、0.01。

四、假设检验的类型:

※双侧检验,单侧检验(左侧检验,右侧检验)

五、两种误差类型及选择:

◎Ⅰ型误差:

犯“否定一个真实的零假设”的错误,其概率用α表示

◎Ⅱ型误差:

犯“肯定一个不真实的零假设”的错误,其概率用β表示。

●Ⅰ型误差与Ⅱ型误差的关系

◆思考并讨论:

1、举例说明在经济管理统计中,若增大α或β会产生什么样的不良后果?

2、若要同时减小Ⅰ型误差与Ⅱ型误差,最有效的办法是什么?

六、假设检验的步骤:

1、陈述假设;

2、识别统计量及其分布(z分布或t分布);

3、选择显著水平;

4、陈述决策规则;

5、搜集数据计算结果;

6、做出统计决策;

7、做出经营管理决策。

七、总体平均数假设检验:

(1)、大样本的检验方法

1:

某电视台某个节目其内容是针对18岁青年人的,节目总监关心其节目是否为目标观众所接受。

抽样检验后,若电视节目没有吸引预期观众,则节目将会改变。

现随机抽取100位观众为样本,并计算样本平均数是17.04岁。

另外,从类似的观众形态的研究中得知总体标准差σ=5岁。

现要求在显著水平α=0.05的条件下做个检验。

解:

(1)提出零假设和对立假设:

(2)规定显著水平,划分拒绝区:

(3)计算临界值:

(2)、某次统考年级阅读平均分为50分,标准差10分。

某实验班(41人,用其他阅读教法)平均成绩52分,问该班成绩与全年级平均成绩是否存在显著差异?

设定显著水平为5%。

(若显著水平为10%呢?

如何解释?

(3):

某地铁安装公司需进口一种抗高温工具钢,规格是平均抗高温不低于600度,标准差为80度。

现从新到的货物中随机抽取100件,测得平均抗高温580度。

在显著水平为0.05的条件下,判定是否接受这批货?

(4)、学者认为早期教育对儿童智力发展有影响。

现在从受过良好早期教育的儿童中随机抽取70人进行韦氏智力测验,结果平均数为103.3分。

若总体平均数为100分,总体标准差为15分,能否认为受过良好早期教育的儿童智力高于一般水平?

另外:

要求显著水平为0.05。

(5)、医药保健公司进口一批药物,每包100CC,该药品特点是多服无害,服少达不到效果。

合同规定标准差为2CC。

药检人员随机抽取50包检验平均为99CC。

若允许Ⅰ型误差概率α=0.1,是否接受这批药物?

(2)小样本的检验方法

※总体为正态分布,且总体标准差σ未知时,用t分布检验总体平均数。

1、一批公务员应聘考试,人事部助理询问主考人员情况如何?

主考人员估计“综合成绩平均可达90分”。

随后人事部助理从考卷中随机抽出20份进行复查,结果平均成绩只有84分,且标准差11分。

现要求在0.1的显著水平下,检验一下主考人员所做的推测。

2、 

糖厂用自动打包机打包,每包标准重量是100公斤。

每天开工后需要检验一次打包机工作是否正常。

某日开工后测得9包重量如下:

99.3 

 

98.7100.5101.298.399.799.5102.1100.5已知包重服从正态分布,试检验该日打包机工作是否正常?

(=0.05)

八、总体比例的假设检验

1、我国出口的某种丝绸睡衣畅销某国市场,以往资料表明购买此种服装的约50%为40岁以上的妇女,营销经理关心最近销售情况是否有变化,于是委托咨询公司抽选了400名顾客,结果210名为40岁以上妇女。

若以0.05为显著水平做个检验,能否认为原销售比例已经改变?

2、某校专业英语八级考试通常有30%的学生可达优秀。

新教材试用后,在同类考试中随机抽取200名学生,有68人达到优秀,问使用新教材前后,学生英语成绩是否有明显改变?

(显著水平为1%)

九、两个总体参数的假设检验

1、两个总体均值的检验

(1)独立样本:

大样本下的检验方法

1、为了评价两家旅游服务企业的服务质量,分别在两个企业抽取样本,在A企业随机抽取30名顾客,在B企业随机抽取40名顾客,让他们分别对服务质量进行打分,评分标准是0~100分。

顾客给出的服务质量评分如下表。

企业A

企业B

70

97

85

87

64

73

76

91

57

62

89

82

93

90

83

92

74

80

78

99

59

79

72

94

88

84

75

65

66

(1)假设企业A服务质量评分的方差为64,企业B服务质量评分的方差为100。

检验两个企业的服务质量是否有显著差异?

(2)如果两个企业的服务质量的方差均未知,结论又如何?

2、在某件涉及到男女员工工资歧视的案例中,有5年以上工作经验的男女员工的独立样本提供了如下小时工资资料。

零假设为男员工的平均小时工资小于或等于女员工。

拒绝H0将得出男员工的平均小时工资超过女员工的结论。

在α=0.01下,检验假设。

本案例中有工资歧视吗?

男性雇员

女性雇员

n1=44

1=9.25美元

S1=1.00美元

n2=32

2=8.70美元

S2=0.80美元

小大样本的检验方法

1、方差未知且相等

从两处煤矿各抽取一个样本,分析其含灰率(%)如下:

甲矿:

24.320.823.721.317.4乙矿:

18.216.920.216.7

假定各煤矿含灰率都服从正态分布,且已经检验出两个煤矿含灰率的方差没有差别。

请问甲、乙两个煤矿的含灰率是否有显著的差异?

(=0.05)

2、方差未知且不等,容量相等

为比较某一地区冬季出生的新生婴儿的体重是否明显高于夏季,从2005年冬季和夏季出生的新生婴儿中分别随机抽取了7名和10名婴儿,测得他们的体重如下(单位:

g):

季节

体重(g)

冬季

3520

2960

2570

3780

3250

3960

3660

夏季

3220

3200

3760

3000

2920

3740

3060

已知不同季节新生婴儿的体重服从正态分布,且方差不相等,请在5%的显著性水平下做出判断。

(2)匹配样本

1、某企业管理人员对采用两种方法组装新产品所需的时间(分钟)进行测试,随机抽取6个工人,让他们分别采用两种方法组装同一种产品,采用方法A组装所需的时间和采用方法B组装所需的时间如下表。

假设组装的时间服从正态分布,以0.05的显著性水平比较两种组装方法是否有差别。

方法

组装时间

A

8.2

5.3

6.5

5.1

9.7

10.8

B

9.5

8.3

7.5

10.9

11.3

9.3

2、某制鞋厂为了比较用来做鞋后跟的两种材料的质量,随机选取了15名男子,让他们每人穿一双新鞋,每双鞋中有一只是用材料A作后跟的,另外一只是用材料B作后跟的,其厚度均为10cm,一个月以后再次测量它们的厚度,数据如下:

序号

2

3

4

5

7

9

11

13

14

材料A

6.6

7.0

6.2

7.9

8.5

7.8

6.1

8.9

9.4

9.1

材料B

7.4

5.4

8.8

8.0

6.8

6.3

4.4

7.7

4.2

请根据以上数据判断那种材料耐磨性更好些?

(要求显著性水平为5%)

十、两总体比率的检验

为了研究婚姻状况是否对保险赔偿率有显著的影响,某保险公司取样于单身和已婚的保险客户并记录了他们在过去3年曾经要求过保险赔偿的人数,发现:

单身的300名保险客户中有66人曾经要求过赔偿;

已婚的800名保险客户中有80人曾经要求过保险赔偿,请在5%的显著性水平下作以下判断:

(1)单身的保险客户是否比已婚的保险客户有更高的保险赔偿率?

(1)单身的保险客户比已婚的保险客户保险赔偿率是否高出5%以上?

第七章方差分析

一、方差分析的原理

方差分析的基本原理:

将数据间的总差异进行分解,寻找数据差异来源。

即:

总差异=组内差异+组间差异。

差异可以用方差来度量,即总方差=组内方差+组间方差

(1)组内差异主要是随机因素引起,称为随机误差;

组间差异主要由两种原因引起,一种是随机因素引起的差异,即随机误差,一种是由于因素水平不同引起的差异,称为系统误差。

(2)如果因素的不同水平对数据结果不产生影响,则没有系统误差,那么组间方差与组内方差的比值就会接近于1;

反之,如果因素的不同水平对数据结果产生影响,则组间方差不仅包含随机误差,也包含系统误差,组间方差与组内方差的比值就会显著的大于1许多,当这个比值大到某种程度,超过规定的临界值,就可

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1