统计学第34章知识点与习题含答案.docx

上传人:b****3 文档编号:5213018 上传时间:2022-12-14 格式:DOCX 页数:14 大小:119.81KB
下载 相关 举报
统计学第34章知识点与习题含答案.docx_第1页
第1页 / 共14页
统计学第34章知识点与习题含答案.docx_第2页
第2页 / 共14页
统计学第34章知识点与习题含答案.docx_第3页
第3页 / 共14页
统计学第34章知识点与习题含答案.docx_第4页
第4页 / 共14页
统计学第34章知识点与习题含答案.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

统计学第34章知识点与习题含答案.docx

《统计学第34章知识点与习题含答案.docx》由会员分享,可在线阅读,更多相关《统计学第34章知识点与习题含答案.docx(14页珍藏版)》请在冰豆网上搜索。

统计学第34章知识点与习题含答案.docx

统计学第34章知识点与习题含答案

第三章数据资料的统计描述:

统计表和统计图

第一节定性资料的统计描述

知识点:

1、统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。

2、定性数据的频数、频率、百分数、累计频数、累积频率的概念及计算。

3、定性数据频数分布表示方法主要有条形图、扇形图。

第二节定量数据的统计描述

知识点:

1、定量数据频数分布表的编制:

(1)整理原始资料;

(2)确定变量数列的形式;(3)编制组距式变量数列。

应注意的问题:

确定组距,确定组限。

考查的区间式分组数据按“上组限不在组内”的原则确定。

2、定量数据的频数、频率、百分数、累积频数、累计频率的概念及计算。

3、定量数据频数分布表示方法主要有直方图、折线图和曲线图三种。

第三节探索性数据分析——茎叶图

知识点:

1、基本茎叶图的理解及编制

第四节相关表与相关图

知识点:

1、相关表,反映定性变量与定量变量之间的相关关系。

2、散点图,反映两个定量变量之间的相关关系。

根据散点图判断两个变量的相关关系。

第四章数据资料的统计描述:

数值计算

第一节集中趋势

知识点:

关于单值式分组和区间式分组数据的

1、平均数的计算,包括算术平均数,几何平均数,调和平均数

2、众数的计算

3、中位数、四分位数的计算

4、(补充知识点)平均数、众数、中位数三者之间的关系

5、百分位数的计算

6、截尾均值的计算

第二节离散测度

知识点:

1、极差的计算

2、关于单值式分组和区间式分组数据的四分位数差的计算

3、关于单值式分组和区间式分组数据的方差、标准差的计算

4、变异系数的计算

5、(补充知识点)偏度、峰度的含义及计算

第三节协方差与相关系数

知识点:

1、样本协方差的含义及计算

2、相关系数的含义及计算

第四节相对位置测度与奇异点

知识点:

1、数据的标准化处理

2、奇异点的诊断:

利用契比雪夫定理和经验规则

第五节探索性分析——5点描述与箱线图

知识点:

1、5点描述法的理解

2、箱线图的理解与运用

第三章习题:

一、填空题

1、在对数据资料进行统计描述时,______反映了各个组中每一项目出现的次数,______反映了各个组中项目发生的比例。

2、用直方图对定性数据作统计描述,一般横轴表示______,纵轴表示______。

3、用扇形图对定性数据做统计描述,以______代表各个属性变量出现的频率。

4、如果样本观察数有20个,按照斯特基的经验公式,可将数据分成______组。

5、如果每个组的观察频数依次为4,8,5,2,1,则各组相应的观察频率为______。

6、如果样本观察数有20个,各组的观察频率依次为0.20.05,0.35,0.15,0.25,则各组相应的观察频数为______。

7、如果每个组的观察频数依次为4,8,5,2,1,则各组相应的累积频率为______。

8、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为______。

9、散点图是以_______轴为自变量,_______轴为因变量的一个图。

10、相关表可用于反映两个______,或两个______,或一个______和一个______之间的相关关系。

二、单选题

1、散点图可用于表述两个______之间的相关关系。

()

A、定性变量与定性变量B、定性变量与定量变量

C、定量变量与定量变量D、定性变量与属性变量

2、已知分组数据各组组限为:

10~14,15~19,20~24,则组距为______。

()

A、4B、5C、6D、3

3、已知分组数据各组组限为:

10~15,15~20,20~25,则组距为______。

()

A、4B、5C、6D、3

4、已知分组数据各组组限为:

10~14,15~19,20~24,则第二组的组中值为______。

()

A、17B、16C、18D、17.5

5、已知分组数据各组组限为:

10~15,15~20,20~25,则第二组的组中值为______。

()

A、17B、16C、18D、17.5

6、分组数据各组的频率之和为______,百分数之和为______。

()

A、1,1B、1,100C、100,100D、100,1

三、判断题

1、相关表和散点图均可表示定性变量之间或定量变量之间的相关关系。

()

2、对于各种形式的区间式分组数据,组距均为组上限减去组下限。

()

3、已知分组数据的各组组限为:

10~15,15~20,20~25,则分组过程遵循“组上限不在组内”的原则。

()

4、给定分组数据,则累积频数或累积频率不一定是递增的。

()

5、若想同时显示两组或多组样本资料,可用扩展茎叶图。

()

6、散点图能揭示随机变量间确定的数学函数关系。

()

四、名词解释

1、频数分布

2、频率

五、简答题

1、简述编制定量数据频数分布的步骤。

第三章习题答案:

一、填空题

1、频数频率

2、属性变量频数(或频率、百分数)

3、扇形面积大小

4、5(或6)组

5、0.2,0.4,0.25,0.1,0.05

6、4,1,7,3,5

7、0.2,0.6,0.85,0.95,1

8、20,5,35,15,25

9、横纵

10、定性,定量,定性(或定量),定量(或定性)

二、单选题

1、C2、B3、B4、A5、D6、B

三、判断题

1、F2、F3、T4、T5、F6、F

四、名词解释

1、频数分布:

在统计分组的基础上,将总体中所有单位按一定标志进行分组整理,形成总体中各单位数在各组间的分布,称为频数分布。

2、频率:

各组次数与总次数之比称为频率。

五、简答题

1、编制定量数据频数分布,需经过以下几个步骤:

(1)确定分组组数;

(2)确定组距(3)确定组限;(4)将观察资料按组别进行归类,记录各个组中数据资料总共发生的次数。

商务经济统计学第四章复习思考题1、3、5、8、11、12

第四章习题:

一、填空题

1、一个由100人组成的群体,无论它有51个女人(和49个男人)或者99个女人(和一个男人),其性别变量的众数都是________。

2、中位数是位于数列________的那个标志值,众数则是观察值中出现次数________的某一标志值。

3、四分位差排除了数列两端各单位标志值的影响。

4、当一组数据属于左偏分布时,平均数、中位数与众数的大小关系为________。

5、已知4个水果店苹果的单价和销售额,要求计算4店的平均单价,应用________平均数。

二、单选题

1、两个总体的平均数不相等,标准差相等,则()

A.平均数大,代表性大B.平均数小,代表性大

C.两个总体的平均数代表性相同D.无法判断

2、两个总体的平均数相等,则()

A.两个总体的平均数代表性相同B.标准差大的平均数代表性大

C.离散系数大的平均数代表性大D.标准差小的平均数代表性大

3、下列指标中,反映数据组中所有数值平均水平大小的指标有()

A四分位差B平均数C标准差D极差

4、加权算术平均数的大小()

A.和各组次数分布多少无关B.仅受各组标志值大小的影响

C.受各组标志值和次数共同影响D.不受各组标志值大小的影响

5、()时,加权算术平均数等于简单算术平均数

A.当各组次数相等B.当各组次数不等C.仅当各组次数都等于1D.当各组变量值不等

6、四分位数实际上是一种

A算术平均数B几何平均数C位置平均数D数值平均数

7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用________

A简单算术平均法B加权算术平均法C加权调和平均法D几何平均法

8、某公司下属5个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是

A计划产值B实际产值C工人数D企业数

9、中位数和众数是一种

A代表值B常见值C典型值D实际值

10、离散趋势指标中,最容易受极端值影响的是

A极差B平均差C标准差D四分位差

三、判断题

1、如果权数都相等,则加权算术平均数等于简单算术平均数。

()

2、在评价两组数列的平均数的代表性时,可采用变异系数。

()

3、若一组数据的偏度系数是-0.25,则数据的极端值在右边,数据分配曲线向右延伸。

()

4、当峰度系数β的数值越大于3,则次数分配曲线的顶端越尖峭。

()

5、极差反映所有变量值差异的大小,最大的缺点是受极端值的影响。

()

四、名词解释

1、中位数

2、极差

3、离散系数

4、偏度

五、简答题

1、反映总体集中趋势的指标有哪几种?

2、反映总体离散趋势的指标有哪几种?

3、反映次数分布曲线的分布特征指标有哪几种?

六、计算题

1、2006年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:

品种

价格(元/斤)

甲市场成交额(万元)

乙市场成交量(万斤)

1.2

1.4

1.5

1.2

2.8

1.5

2

1

1

合计

5.5

4

试问哪一个市场农产品的平均价格高?

并说明原因。

2、某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。

根据资料计算三道生产工序的平均合格率。

3、某高校某系男生的体重资料如下:

按体重分组(公斤)

学生人数(人)

52以下

52~55

55~58

58~61

61以上

28

39

68

53

24

合计

212

试根据所给资料计算这212名男生体重的算术平均数、中位数、众数,四分位数,四分位差。

4、已知某公司职工的月工资收入为965元的人数最多,其中位于全公司职工月工资收入中间位置的职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。

并指出该公司职工月工资收入变量数列属于何种偏态?

5、对成年组和青少年组共500人身高资料分组,分组资料列表如下:

成年组

青少年组

按身高分组(cm)

人数(人)

按身高分组(cm)

人数(人)

150~155

155~160

160~165

165~170

170以上

22

108

95

43

32

70~75

75~80

80~85

85~90

90以上

26

83

39

28

24

合计

300

合计

200

要求:

(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数,偏度系数和峰度系数。

(2)说明成年组和青少年组平均身高的代表性哪个大?

为什么?

6、工人日产量数据单位:

日产量(件/人)

A工艺产量

A工艺人数

B工艺产量

B工艺人数

30

15

4

10

40

30

7

20

50

15

10

10

合计

根据离散系数分析哪种工艺的生产水平整齐?

商务经济统计学第四章复习思考题答案

1、

(1)年平均初始工资为30757(美元)。

(2)样本中位数为30550(美元)。

(3)第一个四分位数为30125(美元)。

(4)第三个四分位数为31650(美元)

3、

(1)样本的均值为39.25,样本的众数为29。

(2)在家办公的人的年龄并不趋于年青化。

(3)第一个四分位数为29.75,第三个四分位数为46.75.

(4)第32个百分位数为31。

5、

(1)美国本土、加拿大和欧洲组,均值为115.13,中位数为111.56;亚洲和非洲组,均值为36.62,中位数为36.695.

(2)美国本土、加拿大和欧洲组,极差为86.24,标准差为26.82,变异系数为0.233;亚洲和非洲组,极差为42.97,标准差为11.4,变异系数为0.3113.

(3)从以上两组游客资料的比较中,可以看出第一组平均到达海滩的人数多于第二组,而且,第一组中各个地方到达海滩的人数的差别较第二组小。

8、

(1)-0.953

(2)3.897

11、

(1)5点数依次为:

608,1872,4019,8305,14138

(2)上限为11521.5,下限为-7777.5.

(3)有异常点为14138

(4)

12、

(1)

(2)从散点图上可以看出,GPA与SAT大致呈正相关的关系,GPA为学生的平均学分积,与成绩呈正相关的关系。

(3)样本协方差为28.6.

(4)样本相关系数为0.8713。

相关系数的绝对值越大说明相关性越强,该值说明GPA与SAT有较强的相关性。

第四章习题答案:

一、填空题

1、女

2、中间位置,最多

3、25%

4、平均数<中位数<众数

5、加权调和平均数

二、单选题

1、A2、D3、B4、C5、A6、C7、C8、B9、A10、A

三、判断题

1、T2、T3、F4、T5、F

四、名词解释

1、中位数:

是一种按其在数列中的特殊位置而决定的平均数。

2、极差:

是指一个数列中两个极端值即最大值与最小值之间的差异。

3、离散系数:

是测定总体中各单位标志值变异的相对量指标,以消除不同总体之间在计量单位、平均水平方面的不可比因素。

4、偏度:

是用来反映变量数列分布偏斜(或对称)程度的指标。

五、简答题

1、反映总体集中趋势的指标有算术平均数、调和平均数、几何平均数、中位数和众数。

2、反映总体离散趋势的指标有极差、四分位差、平均差、方差、标准差和离散系数。

3、反映次数分布曲线分布特征的指标有偏度和峰度。

偏度是用来反映变量数列分布偏斜程度的指标。

峰度就是用来反映变量数列曲线顶端尖峭或扁平程度的指标。

六、计算题

1.解:

成交额单位:

万元,成交量单位:

万斤

品种

价格(

元/斤)

甲市场

乙市场成交量

成交额(

成交量(m/x)

成交量(f)

成交额(xf)

1.2

1.4

1.5

1.2

2.8

1.5

1

2

1

2

1

1

2.4

1.4

1.5

合计

──

5.5

4

4

5.3

甲市场平均价格

乙市场平均价格

说明:

两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。

甲市场销售价格较高的乙产品量最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。

这就是权数在平均数形成中所起的权衡轻重的作用,如果将两个市场的各级成交量占总成交量的比重计算出来,则更能看出权数的作用。

2.解:

三道工序的平均合格率

3.解:

先列表计算有关资料如下:

按体重分组(公斤)

组中值(x)

学生人数(人)(f)

(xf)

向上累计次数

52以下

52~55

55~58

58~61

61以上

50.5

53.5

56.5

59.5

62.5

28

39

68

53

24

1414.0

2086.5

3842.0

3153.5

1500.0

28

67

135

188

212

合计

——

212

11996.0

——

解:

(1)学生平均体重:

(2)学生体重中位数:

(3)学生体重众数:

四分位差=

4.解:

由题意可得,

则月平均工资为:

因为:

,则该分布为左偏分布。

5.解:

(1)求成人组和青少年组的身高的均值、标准差、标准差系数、偏度系数和峰度系数。

成人组

身高(cm)

频率

组中值

150~155

0.073

152.8

11.15

5.89

-52.86

474.71

155~160

0.360

157.5

56.70

6.59

-28.22

120.80

160~165

0.317

162.5

51.51

0.16

0.12

0.09

165~170

0.143

167.5

23.95

4.68

26.76

153.08

170以上

0.107

172.5

18.46

12.30

131.82

1413.07

合计

1

——

161.78

29.62

77.61

2161.75

成人组的平均身高为161.78cm,标准差为5.44cm,标准差系数为3.36%。

它的分布曲线的偏度系数为0.48,峰度系数为2.47,即呈正偏分布,其顶部曲线较正态分布曲线的顶部要平坦。

青少年组

身高(cm)

频率

组中值

150~155

0.13

152.8

19.86

8.87

-73.26

605.15

155~160

0.415

157.5

65.36

5.26

-18.72

66.66

160~165

0.195

162.5

31.69

0.40

0.58

0.84

165~170

0.14

167.5

23.45

5.81

37.39

240.81

170以上

0.12

172.5

20.70

15.70

179.66

2055.35

合计

1

——

161.06

36.04

125.65

2968.80

成人组的平均身高为161.068cm,标准差为6.00cm,标准差系数为3.73%。

它的分布曲线的偏度系数为0.582,峰度系数为2.29,即呈正偏分布,其顶部曲线较正态分布曲线的顶部要平坦。

(2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。

6、解:

则可计算得

则A工艺生产水平整齐

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1