统计学A主观题作业.docx

上传人:b****2 文档编号:25948286 上传时间:2023-06-16 格式:DOCX 页数:44 大小:31.92KB
下载 相关 举报
统计学A主观题作业.docx_第1页
第1页 / 共44页
统计学A主观题作业.docx_第2页
第2页 / 共44页
统计学A主观题作业.docx_第3页
第3页 / 共44页
统计学A主观题作业.docx_第4页
第4页 / 共44页
统计学A主观题作业.docx_第5页
第5页 / 共44页
点击查看更多>>
下载资源
资源描述

统计学A主观题作业.docx

《统计学A主观题作业.docx》由会员分享,可在线阅读,更多相关《统计学A主观题作业.docx(44页珍藏版)》请在冰豆网上搜索。

统计学A主观题作业.docx

统计学A主观题作业

《统计学A》第一次作业

二、主观题(共4道小题)

6.      指出下面的数据类型:

(1) 年龄

(2) 性别

(3) 汽车产量

(4) 员工对企业某项改革措施的态度(赞成、中立、反对)

(5) 购买商品时的支付方式(现金、信用卡、支票)

参考答案:

     

(1) 年龄:

离散 数值数据

(2) 性别:

分类数据

(3) 汽车产量:

离散 数值数据

(4) 员工对企业某项改革措施的态度(赞成、中立、反对):

顺序数据

(5) 购买商品时的支付方式(现金、信用卡、支票):

分类数据

7.   某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。

要求:

(1)描述总体和样本。

(2)指出参数和统计量。

参考答案:

(1)

总体:

全市所有职工家庭;

样本:

2000个职工家庭

(2)

参数:

全市所有职工家庭的人均收入;

统计量:

2000个职工家庭的人均收入。

8.    一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。

要求:

(1)这一研究的总体是什么?

(2)月收入是分类变量、顺序变量还是数值型变量?

(3)消费支付方式是分类变量、顺序变量还是数值型变量?

(4)这一研究涉及截面数据还是时间序列数据?

参考答案:

(1)  所有IT从业者。

(2)  月收入十数值型变量

(3)消费支付方式是分类变量(4)  涉及截面数据

9.     一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。

要求:

(1)这一研究的总体是什么?

(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?

(3)研究者所关心的参数是什么?

(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?

 (5)研究者所使用的主要是描述统计方法还是推断统计方法?

 

参考答案:

(1)网上购物的所有消费者 

(2) 分类变量

(3)  所有消费者网上购物的平均花费、所有消费者选择网上购物的主要原因

(4) 统计量

(5)  描述统计

《统计学A》第二次作业

二、主观题(共1道小题)

31.    自填式、面访式、电话式各有什么长处和弱点?

参考答案:

自填式优点:

调查成本最低;适合于大范围的调查;适合于敏感性问题的调查。

自填式缺点:

较低的回收率;不适用于较复杂的问题的调查;调查中回答问题的情况不受控制(比如多人采用相同的回答);调查周期长。

面访式优点:

较高的回答率;调查员可以对回答进行解释、确认、澄清,避免含混不清的回答。

面访式缺点:

调查成本高;不适用于敏感性问题;调查员的素质会影响调查质量。

电话式优点:

速度快;便于调查控制;适合于大范围的调查。

电话式缺点:

受电话安装情况的限制;在涉及复杂问题,或问题较多时,容易被拒绝回答。

《统计学A》第三次作业

(注意:

若有主观题目,请按照题目,离线完成,完成后纸质上交学习中心,记录成绩。

在线只需提交客观题答案。

二、主观题(共5道小题)

16.      为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:

A.好;B.较好;C一般;D.较差;E.差。

调查结果如下:

B

E

C

C

A

D

C

B

A

E

D

A

C

B

C

D

E

C

E

E

A

D

B

C

C

A

E

D

C

B

B

A

C

D

E

A

B

D

D

C

C

B

C

E

D

B

C

C

B

C

D

A

C

B

C

D

E

C

E

B

B

E

C

C

A

D

C

B

A

E

B

A

C

E

E

A

B

D

D

C

A

D

B

C

C

A

E

D

C

B

C

B

C

E

D

B

C

C

B

C

    要求:

(1)指出上面的数据属于什么类型。

(2)用Excel制作一张频数分布表。

(3)绘制一张条形图,反映评价等级的分布。

(4)绘制评价等级的帕累托图。

参考答案:

(1)   顺序数据

(2) 用数据分析——直方图制作:

接收

频率

E

16

D

17

C

32

B

21

A

14

 

(3) 用数据分析——直方图制作:

(4)逆序排序后,制作累计频数分布表:

接收

频数

频率(%)

累计频率(%)

C

32

32

32

B

21

21

53

D

17

17

70

E

16

16

86

A

14

14

100

 

 

 

 

 

 

17.      某行业管理局所属40个企业2002年的产品销售收入数据如下:

152

124

129

116

100

103

92

95

127

104

105

119

114

115

87

103

118

142

135

125

117

108

105

110

107

137

120

136

117

108

97

88

123

115

119

138

112

146

113

126

要求:

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

参考答案:

(1)

1、确定组数:

   ,取k=6

2、确定组距:

   组距=( 最大值 - 最小值)÷ 组数=(114-42)÷6=,取10

3、分组频数表

销售收入

频数

频率%

累计频数

累计频率%

-

2

2

-

3

5

-

9

14

-

12

26

-

7

33

-

4

37

-

2

39

+

1

40

总和

40

 

 

(2)

 

频数

频率%

累计频数

累计频率%

先进企业

10

10

良好企业

12

22

一般企业

9

31

落后企业

9

40

总和

40

 

 

 

18.  一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。

下面是随机抽取的100袋食品,测得的重量数据如下:

   单位:

g

57

46

49

54

55

58

49

61

51

49

51

60

52

54

51

55

60

56

47

47

53

51

48

53

50

52

40

45

57

53

52

51

46

48

47

53

47

53

44

47

50

52

53

47

45

48

54

52

48

46

49

52

59

53

50

43

53

46

57

49

49

44

57

52

42

49

43

47

46

48

51

59

45

45

46

52

55

47

49

50

54

47

48

44

57

47

53

58

52

48

55

53

57

49

56

56

57

53

41

48

要求:

(1)构建这些数据的频数分布表。

(2)绘制频数分布的直方图。

(3)说明数据分布的特征。

参考答案:

解:

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

1、确定组数:

   ,取k=6或7

2、确定组距:

   组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=,取3或者4、5

   组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3,

3、分组频数表

组距3,上限为小于

 

频数

百分比

累计频数

累积百分比

有效

-

3

3

-

9

12

-

24

36

-

19

55

-

24

79

-

14

93

+

7

100

合计

100

 

 

直方图:

组距4,上限为小于等于

 

频数

百分比

累计频数

累积百分比

有效

<=

1

1

-

7

8

-

28

36

-

28

64

-

22

86

-

13

99

+

1

100

合计

100

 

 

直方图:

组距5,上限为小于等于

 

频数

百分比

累计频数

累积百分比

有效

<=

12

-

37

-

34

-

16

+

1

合计

100

 

 

直方图:

分布特征:

左偏钟型。

 

 

 

19. 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:

考试成绩

人数

甲班

乙班

及格

不及格

3

6

18

9

4

6

15

9

8

2

要求:

(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。

(2)比较两个班考试成绩分布的特点。

(3)画出雷达图,比较两个班考试成绩的分布是否相似。

参考答案:

(1)

 

(2)

甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。

(3)

分布不相似。

20.   已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):

   单位:

亿元

年份

国内生产总值

 

第一产业

第二产业

第三产业

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

67884.6

74462.6

78345.2

82067.5

89468.1

97314.8

117390.2

136875.9

11993

14211.2

14552.4

14471.96

14628.2

15411.8

16117.3

16928.1

20768.07

28538

33613

37223

38619

40558

44935

48750

52980

61274

72387

17947

20428

23029

25174

27038

29905

33153

36075

39188

43721

要求:

(1)用Excel绘制国内生产总值的线图。

(2)绘制第一、二、三产业国内生产总值的线图。

(3)根据2004年的国内生产总值及其构成数据绘制饼图。

 

参考答案:

(1)

(2)

(3)

《统计学A》第四次作业

二、主观题(共7道小题)

18. 

 随机抽取25个网络用户,得到他们的年龄数据如下:

                                                               单位:

周岁

19

15

29

25

24

23

21

38

22

18

30

20

19

19

16

23

27

22

34

24

41

20

31

17

23

要求;

(1)计算众数、中位数:

      

(2)根据定义公式计算四分位数。

 

(3)计算平均数和标准差;

(4)计算偏态系数和峰态系数:

(5)对网民年龄的分布特征进行综合分析:

参考答案:

(1)

1、排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄

 

频数

频率

累计频数

累计频率

Valid

15

1

1

16

1

2

17

1

3

18

1

4

19

3

7

20

2

9

21

1

10

22

2

12

23

3

15

24

2

17

25

1

18

27

1

19

29

1

20

30

1

21

31

1

22

34

1

23

38

1

24

41

1

25

Total

25

 

 

从频数看出,众数Mo有两个:

19、23;从累计频数看,中位数Me=23。

(2)Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。

(3)均值=;标准差=

(4)偏度系数SK=;峰度系数K=

(5)分布,均值=24、标准差=、呈右偏分布。

如需看清楚分布形态,需要进行分组。

为分组情况下的直方图:

为分组情况下的概率密度曲线:

分组:

1、确定组数:

   ,取k=6

2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=,取5

3、分组频数表

网络用户的年龄 (Binned)

 

频数

频率

累计频数

累计频率

Valid

<=15

1

1

16-20

8

9

21-25

9

18

26-30

3

21

31-35

2

23

36-40

1

24

41+

1

25

Total

25

 

 

分组后的均值与方差:

均值

标准差

方差

偏度系数Skewness

峰度系数Kurtosis

分组后的直方图:

 

19. 某银行为缩短顾客到银行办理业务等待的时间。

准备采用两种排队方式进行试验:

一种是所有颐客都进入一个等待队列:

另—种是顾客在三千业务窗口处列队3排等待。

为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。

得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。

第二种排队方式的等待时间(单位:

分钟)如下:

5.5    6.6    6.7    6.8    7.1    7.3    7.4   7.8    7.8

要求:

(1)画出第二种排队方式等待时间的茎叶图。

(2)计算第二种排队时间的平均数和标准差。

 

(3)比较两种排队方式等待时间的离散程度。

(4)如果让你选择一种排队方式,你会选择哪—种?

试说明理由。

参考答案:

(1)

   第二种排队方式的等待时间(单位:

分钟)Stem-and-LeafPlot

     频数        茎叶图

                 (=<

                  6.  678

                  7.  134

                  7.  88

 

(2)

(3)第二种排队方式的离散程度小。

(4) 选择第二种,均值小,离散程度小。

均值

7

标准差

方差

 

20. 在某地区抽取120家企业,按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300

300~400

400~500

500~600

600以上

19

30

42

18

11

合    计

120

要求:

(1)计算120家企业利润额的平均数和标准差。

(2)计算分布的偏态系数和峰态系数。

参考答案:

解:

Statistics

企业利润组中值Mi(万元) 

N

有效

120

缺失

0

均值

标准差

偏度系数Skewness

峰度系数Kurtosis

21. 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。

请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?

为什么?

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?

参考答案:

(1)

 女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)

   都是各乘以,男生的平均体重为60kg×=磅,标准差为5kg×=磅;女生的平均体重为50kg×=磅,标准差为5kg×=磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?

 计算标准分数:

   Z1= ==-1;Z2===1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。

(4)

 计算标准分数:

   Z1===-2;Z2===2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。

22. 一条产品生产线平均每天的产量为3700件,标准差为50件。

如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。

下面是一周各天的产量,该生产线哪几天失去了控制?

时间

周一     周二     周三     周四     周五     周六     周日

产量(件)

3850    3670    3690    3720    3610    3590    3700

参考答案:

解:

     时间

周一

周二

周三

周四

周五

周六

周日

产量(件)

3850

3670

3690

3720

3610

3590

3700

日平均产量

3700

日产量标准差

50

标准分数Z

3

0

标准分数界限

-2

-2

-2

-2

-2

-2

-2

2

2

2

2

2

2

2

     周六超出界限,失去控制。

23.  一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。

下面是15个工人分别用三种方法在相同的时间内组装的产品数量:

                                                                   单位:

方法A

方法B

方法C

164

167

168

165

170

165

164

168

164

162

163

166

167

166

165

129

130

129

130

131

]30

129

127

128

128

127

128

128

125

132

125

126

126

127

126

128

127

126

127

127

125

126

116

126

125

要求:

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?

试说明理由。

 

参考答案:

解:

对比均值和离散系数的方法,选择均值大,离散程度小的。

方法A

方法B

方法C

 

 

 

 

 

 

平均

平均

平均

标准差

标准差

标准差

   离散系数:

 VA=,VB=,VC=

均值A方法最大,同时A的离散系数也最小,因此选择A方法。

24.  在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。

预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。

下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。

在股票市场上,高收益率往往伴随着高风险。

但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险?

 

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

 (3)如果进行股票投资,你会选择商业类股票还是高科技类股票?

 

参考答案:

(1)  标准差或者离散系数。

(2)选择离散系数小的股票,则选择商业股票。

(3)考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

《统计学A》第五次作业

二、主观题(共3道小题)

12. 调节一个装瓶机使其对每个瓶子的灌装量均值为 盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。

随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。

试确定样本均值偏离总体均值不超过盎司的概率。

参考答案:

解:

总体方差知道的情况下,均值的抽样分布服从 的正态分布,由正态分布,标准化得到标准正态分布:

z=~,因此,样本均值不超过总体均值的概率P为:

==

  ==2-1,查标准正态分布表得 =

  

因此, =

            

13. ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得

参考答案:

解:

由于卡方分布是由标准正态分布的平方和构成的:

设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量

服从自由度为n的χ2分布,记为χ2~ χ2(n)

因此,令,则,那么由概率,可知:

b=,查概率表得:

b=

14. 在习题中,假定装瓶机对瓶子的灌装量服从方差 的标准正态分布。

假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得

参考答案:

解:

更加样本方差的抽样分布知识可知,样本统计量:

         

此处,n=10, ,所以统计量

根据卡方分布的可知:

又因为:

因此:

 

则:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1