统计学名词解释及公式.docx

上传人:b****8 文档编号:9522195 上传时间:2023-02-05 格式:DOCX 页数:37 大小:83.03KB
下载 相关 举报
统计学名词解释及公式.docx_第1页
第1页 / 共37页
统计学名词解释及公式.docx_第2页
第2页 / 共37页
统计学名词解释及公式.docx_第3页
第3页 / 共37页
统计学名词解释及公式.docx_第4页
第4页 / 共37页
统计学名词解释及公式.docx_第5页
第5页 / 共37页
点击查看更多>>
下载资源
资源描述

统计学名词解释及公式.docx

《统计学名词解释及公式.docx》由会员分享,可在线阅读,更多相关《统计学名词解释及公式.docx(37页珍藏版)》请在冰豆网上搜索。

统计学名词解释及公式.docx

统计学名词解释及公式

第1章统计与统计数据

一、学习指导

统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。

本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。

本章各节的主要内容和学习要点如下表所示。

早节

主要内容

学习要点

统计及其应用领域

什么是统计学

概念:

统计学,描述统计,推断统计。

统计的应用领域

统计在工商管理中的应用。

统计的其他应用领域。

数据的类型

分类数据、顺序数据、数值型数据

概念:

分类数据,顺序数据,数值型数据。

不同数据的特点。

观测数据和实验数据

概念:

观测数据,实验数据。

截面数据和时间序列数据

概念:

截面数据,时间序列数据。

数据来源

数据的间接来源

统计数据的间接来源。

二手数据的特点。

数据的直接来源

概念:

抽样调查,普查。

数据的间接来源。

数据的收集方法。

调查方案设计

调查方案的内容。

数据质量

概念。

抽样误差,非抽样误差。

统计数据的质量。

统计中的几

个基本概念

总体和样本

概念:

总体,样本。

参数和统计量

概念:

参数,统计量。

变量

概念:

变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。

、主要术语

1.统计学:

收集、处理、分析、解释数据并从数据中得出结论的科学。

2.描述统计:

研究数据收集、处理和描述的统计学分支。

3.推断统计:

研究如何利用样本数据来推断总体特征的统计学分支。

4.分类数据:

只能归于某一类别的非数字型数据。

5.顺序数据:

只能归于某一有序类别的非数字型数据。

6.数值型数据:

按数字尺度测量的观察值。

7.观测数据:

通过调查或观测而收集到的数据。

8.实验数据:

在实验中控制实验对象而收集到的数据。

9.截面数据:

在相同或近似相同的时间点上收集的数据。

10.时间序列数据:

在不同时间上收集到的数据。

11.抽样调查:

从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。

12.普查:

为特定目的而专门组织的全面调查。

13•总体:

包含所研究的全部个体(数据)的集合。

14.样本:

从总体中抽取的一部分元素的集合。

15.样本容量:

也称样本量,是构成样本的元素数目。

16.参数:

用来描述总体特征的概括性数字度量。

17.统计量:

用来描述样本特征的概括性数字度量。

18.变量:

说明现象某种特征的概念。

19.分类变量:

说明事物类别的一个名称。

20.顺序变量:

说明事物有序类别的一个名称。

21.数值型变量:

说明事物数字特征的一个名称。

22.离散型变量:

只能取可数值的变量。

23.连续型变量:

可以在一个或多个区间中取任何值的变量。

四、习题答案

1.

D

12.C

23.C

34.A

45.A

2.

D

13.B

24.B

35.A

46.B

3.

A

14.A

25.D

36.A

47.C

4.

B

15.C

26.C

37.D

48.A

5.

A

16.D

27.B

38.B

49.C

6.

D

17.C

28.D

39.B

50.D

7.

C

18.A

29.A

40.C

51.A

8.

B

19.C

30.D

41.C

52.C

9.

A

20.D

31.A

42.D

53.D

10.

A

21.A

32.B

43.C

54.A

11.

C、

22.C

33.C

44.D

55.B

第2章数据的图表展示

一、学习指导

数据的图表展示是应用统计的基本技能。

本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。

本章各节的主要内容和学习要点如下表所示。

早节

主要内容

学习要点

数据的预处理

数据审核

数据审核的目的。

原始数据和二手数据的审核内容。

数据排序

数据排序的目的。

分类数据和数值型数据的排序方法。

数据筛选

数据筛选的目的。

用Excel进行数据筛选。

数据透视表

数据透视表的用途。

用Excel进行数据透视。

品质数据的整理与

展示

分类数据的整理与图示

概念:

频数,频数分布,比例,百分比,比率。

用Excel制作分类数据的频数分布表。

分类数据的图示:

条形图,帕累托图,对比条形图,饼图。

顺序数据的整理与图示

概念:

累积频数,累积频率。

累积频数分布图。

数值型数据的整理与展示

数据分组

概念:

数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。

频数分布表的制作步骤。

用Excel制作频数分布表。

数值型数据的图示

直方图的绘制。

茎叶图的绘制。

箱线图的绘制。

直方图与条形图的区别。

茎叶图与直方图的区别。

线图的绘制。

散点图的绘制。

气泡图的绘制。

雷达图的绘制。

合理使用图表

鉴别图形优劣的准则

图形应包括的基本特征。

鉴别图形优劣的准则。

统计表的设计

统计表的结构。

统计表的设计。

、主要术语

24.频数:

落在某一特定类别(或组)中的数据个数。

25.频数分布:

数据在各类别(或组)中的分配。

26.比例:

一个样本(或总体)中各个部分的数据与全部数据之比。

27.比率:

样本(或总体)中各不同类别数值之间的比值。

28.累积频数:

将各有序类别或组的频数逐级累加起来得到的频数。

29.数据分组:

根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。

30.组距分组:

将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。

31.组距:

一个组的上限与下限的差。

32.组中值:

每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。

33.直方图:

用矩形的宽度和高度(即面积)来表示频数分布的图形。

34.茎叶图:

由“茎”和“叶”两部分组成的、反应原始数据分布的图形。

35.箱线图:

由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应

原始数据分布的图形。

四、习题答案

1.

C

8.

B

15.C

22.

D

29.D

2.

A

9.

B

16.B

23.

D

30.C

3.

B

10.

C

17.D

24.

B

31.B

4.

C

11.

A

18.D

25.

D

32.C

5.

D

12.

B

19.C

26.

B

33.C

6.

B

13.

B

20.B

27.

B

34.A

7.

C

14.

C

21.C

28.

D

35.B

第3章数据的概括性度量

一、学习指导

数据分布的特征可以从三个方面进行描述:

一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。

本章各节的主要内容和学习要点如下表所示。

早节

主要内容

学习要点

集中趋势的度量

众数

概念:

众数。

众数的特点。

中位数和分位数

概念:

中位数,四分位数。

中位数和四分位数的特点。

中位数和四分位数的计算。

平均数

概念:

平均数,简单平均数,加权平均数,几何平均数。

简单平均数和加权平均数的计算。

平均数的性质。

几何平均数的计算和应用场合。

众数、中位数和平均数的比较

众数、中位数和平均数在分布上的关系。

众数、中位数和平均数的特点及应用场合。

离散程度的

度量

异众比率

概念:

异众比率。

异众比率的计算和应用场合。

四分位差

概念:

四分位差。

四分位差的计算和应用场合。

方差和标准差

概念:

极差,平均差,方差,标准差。

极差的计算和特点。

平均差的计算和特点。

样本方差和标准差的计算。

总体方差和标准差的计算。

相对位置的度量

概念:

标准分数。

标准分数的计算和应用。

经验法则。

切比雪夫不等式。

离散系数

概念:

离散系数。

离散系数的计算。

离散系数的用途。

偏态及其测度

概念:

偏态,偏态系数。

偏态系数的计算。

偏态系数数值的意义。

偏态与峰态

的度量

峰态及其测度

概念:

峰态,峰态系数。

峰态系数的计算。

峰态系数数值的意义。

用Excel计算描述统计量。

Excel统计函数的应用。

、主要术语和公式

(一)主要术语

1.众数:

一组数据中出现频数最多的变量值,用M。

表示。

2.中位数:

一组数据排序后处于中间位置上的变量值,用Me表示。

3.四分位数:

一组数据排序后处于25%和75%位置上的值。

4.平均数:

一组数据相加后除以数据的个数而得到的结果。

5.几何平均数:

n个变量值乘积的n次方根,用Gm表示。

6.异众比率:

非众数组的频数占总频数的比率。

7.四分位差:

也称为内距或四分间距,上四分位数与下四分位数之差。

8.极差:

也称全距,一组数据的最大值与最小值之差。

9.平均差:

也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。

10.方差:

各变量值与其平均数离差平方的平均数。

11.标准差:

方差的平方根。

12.标准分数:

变量值与其平均数的离差除以标准差后的值。

13.离散系数:

也称为变异系数,一组数据的标准差与其相应的平均数之比。

14.偏态:

数据分布的不对称性。

15.偏态系数:

对数据分布不对称性的度量值。

16.峰态:

数据分布的平峰或尖峰程度。

17.峰态系数:

对数据分布峰态的度量值。

(二)主要公式

名称

公式

中位数

简单样本平均数

加权样本平均数

几何平均数

异众比率

四分位差

极差

简单平均差

加权平均差

简单样本方差

简单样本标准方差

加权样本方差

加权样本标准差

标准分数

离散系数

未分组数据的偏态系数

分组数据的偏态系数

未分组数据的峰态系数

分组数据的峰态系数

 

四、习题答案

1.

A

19.

C

37.A

55.

B

73.

D

2.

C

20.

A

38.C

56.

A

74.

C

3.

B

21.

B

39.B

57.

B

75.

A

4.

C

22.

C

40.A

58.

D

76.

D

5.

D

23.

C

41.A

59.

A

77.

D

6.

B

24.

C

42.B

60.

B

78.

A

7.

D

25.

C

43.B

61.

C

79.

A

8.

A

26.

D

44.A

62.

D

80.

C

9.

A

27.

A

45.B

63.

A

81.

D

10.

C

28.

A

46.A

64.

C

82.

D

11.

B

29.

B

47.C

65.

D

83.

A

12.

C

30.

B

48.D

66.

D

84.

A

13.

A

31.

A

49.B

67.

C

85.

A

14.

B

32.

A

50.A

68.

B

86.

D

15.

A

33.

B

51.C

69.

D

16.

B

34.

B

52.D

70.

D

17.

A

35.

A

53.B

71.

A

18.

B

36.

B

54.D

72.

B

第4章

抽样与参数估计

一、学习指导

参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。

本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。

本章各节的主要内容和学习要点如下表所示。

早节

主要内容

学习要点

抽样与抽样分

概率抽样方法

概念:

简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统抽样,整群抽样。

用Excel抽取简单随机样本。

抽样分布

概念:

抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。

中心极限定理。

样本均值抽样分布的特征。

样本均值的抽样分布与总体分布的关系。

样本比例抽样分布的形式和特征。

样本方差抽样分布的形式。

参数估计的一

般问题

估计量与估计值

概念:

估计量,估计值。

点估计与区间估计

概念:

点估计,区间估计,置信区间,置信水平。

置信区间构建的原理。

置信区间的解释。

评价估计量的标准

概念:

无偏性,有效性,一致性。

总体均值的区

间估计

正态总体、方差已知,或非正态总体、大样本

正态总体、方差已知时的置信区间。

非正态总体、大样本时的置信区间。

用Exce1计算给定的正态分布的临界值。

正态总体、方差未知、小样本

正态总体、方差已知时的小样本置信区间。

正态总体、方差未知时的小样本置信区间。

用Exce1计算给定的t分布的临界值。

总体比例的区

间估计

总体比例的区间估计

总体比例的置信区间。

总体方差的区

间估计

总体方差的区间估计

总体方差的置信区间。

2

用Exce1计算给定的分布的临界值。

样本容量的确

估计总体均值时样本容量的确定

样本容量的计算方法。

估计总体比例时样本容量的确定

样本容量的计算方法。

、主要术语和公式

(一)主要术语

36.简单随机抽样:

也称纯随机抽样,它是从含有N个元素的总体中,抽取n个元素作为样本,使得

总体中的每一个元素都有相同的机会(概率)被抽中。

37.简单随机样本:

从含有N个元素的总体中,抽取n个元素作为样本,使得总体中每一个样本量为

n的样本都有相同的机会(概率)被抽中。

38.重复抽样:

从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n

个元素为止。

39.不重复抽样:

一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取n

个元素为止。

40.分层抽样:

也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。

41.系统抽样:

也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则

确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。

42.整群抽样:

先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。

43.抽样分布:

在重复选取样本量为n的样本时,由样本统计量的所有可能取值形成的相对频数分

布。

44.样本均值的抽样分布:

在重复选取样本量为n的样本时,由样本均值的所有可能取值形成的相对

频数分布。

45.样本比例抽样分布:

在重复选取样本量为n的样本时,由样本比例的所有可能取值形成的相对频

数分布。

46.标准误差:

也称为标准误,它是样本统计量的抽样分布的标准差。

47.估计标准误差:

若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。

48.估计量:

用来估计总体参数的统计量的名称,用符号?

表示。

49.估计值:

用来估计总体参数时计算岀来的估计量的具体数值。

50.点估计:

用样本统计量?

的某个取值直接作为总体参数的估计值。

51.区间估计:

在点估计的基础上,给出总体参数估计的一个范围。

52.置信区间:

由样本统计量所构造的总体参数的估计区间。

53.置信水平:

也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。

(二)主要公式

名称

公式

总体均值的置信区间(正态总体,已知)

总体均值的置信区间(未知,大样本)

总体均值的置信区间(正态总体,未知,小样本)

总体比例的置信区间

总体方差的置信区间

估计总体均值时的样本容量

估计总体比例时的样本容量

四、习题答案

87.A

121.B

155.A

189.C

223.B

88.B

122.A

156.B

190.A

224.A

89.A

123.B

157.C

191.B

225.A

90.B

124.D

158.C

192.C

226.D

91.B

125.B

159.D

193.A

227.C

92.C

126.A

160.B

194.D

228.B

93.D

127.C

161.D

195.A

229.A

94.C

128.A

162.D

196.B

230.A

95.A

129.B

163.C

197.C

231.B

96.C

130.A

164.C

198.A

232.B

97.A

131.C

165.B

199.A

233.B

98.A

132.D

166.C

200.A

234.C

99.C

133.C

167.D

201.A

235.B

100.A

134.B

168.D

202.A

236.B

101.D

135.D

169.A

203.C

237.D

102.B

136.C

170.B

204.B

238.A

103.D

137.A

171.C

205.B

239.B

104.B

138.A

172.A

206.A

240.B

105.B

139.D

173.A

207.C

241.C

106.B

140.A

174.C

208.C

242.D

107.A

141.B

175.C

209.B

108.A

142.C

176.C

210.C

109.A

143.A

177.B

211.C

110.D

144.C

178.A

212.B

111.D

145.B

179.B

213.C

112.B

146.A

180.B

214.B

113.C

147.A

181.A

215.A

114.C

148.A

182.D

216.B

115.B

149.A

183.C

217.A

116.B

150.A

184.A

218.A

117.B

151.A

185.B

219.A

118.D

152.A

186.B

220.C

119.D

153.B

187.C

221.C

120.C

154.A

188.B

222.D

第5章假设检验

一、学习指导

假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。

本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。

本章各节的主要内容和学习要点如下表所。

早节

主要内容

学习要点

假设检验的

基本问题

假设的陈述

概念:

假设,假设检验,原假设,备择假设,单侧检验,双侧检验。

针对具体的实际问题,建立合理的原假设和备择假设。

两类错误与显着性水平

概念:

第I类错误,第n类错误,显着性水平。

两类错误的控制。

两类错误的关系。

检验统计量与拒绝域

概念:

检验统计量,标准化检验统计量,拒绝域,临界值。

统计量检验的原理。

利用统计量检验的决策准则。

利用P值进行决策

概念:

P值。

P值决策的原理,P值的计算。

P值检验与统计量检验的异同。

P值决策的准则。

小结

假设检验的步骤。

假设检验结果的表述。

总体均值的

检验

大样本的检验方法

2

总体方差已知时,均值检验的统计量和程序。

2

总体方差未知时,均值检验的统计量和程序。

用Excel计算P值。

小样本的检验方法

2

总体方差已知时,均值检验的统计量和程序。

2

总体方差未知时,均值检验的统计量和程序。

用Excel计算P值。

总体比例的

检验

总体比例的检验

检验的统计量。

检验的程序。

用Excel计算P值。

总体方差的

检验

总体方差的检验

检验的统计量。

检验的程序。

用Excel计算P值。

、主要术语和公式

(一)主要术语

18.假设:

对总体参数的具体数值所做的陈述。

19.假设检验:

先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。

20.备择假设:

也称研究假设,是研究者想收集证据予以支持的假设,用H,或Ha表示。

21.原假设:

也称零假设,是研究者想收集证据予以反对的假设,用H。

表示。

22.单侧检验:

也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“的假

设检验。

23.双侧检验:

也称双尾检验,是指备择假设没有特定的方向性,并含有符号“”的假设检验。

24.第I类错误:

当原假设为正确时拒绝原假设,犯第I类错误的概率记为。

25.第H类错误:

当原假设为错误时没有拒绝原假设,犯第H类错误的概率通常记为。

26.显着性水平:

假设检验中发生第I类错误的概率,记为。

27.检验统计量:

根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。

28.拒绝域:

能够拒绝原假设的检验统计量的所有可能取值的集合。

29.临界值:

根据给定的显着性水平确定的拒绝域的边界值。

30.P值:

也称观察到的显着性水平,如果原假设Ho是正确的,那么所得的样本结果出现实际观

测结果那么极端的概率。

(二)主要公式

名称

公式

总体均值检验的统计量(正态总体,已知)

总体均值检验的统计量(未知,大样本)

总体均值检验的统计量(正态总体,未知,小样

本)

总体比例检验的统计量

总体方差检验的统计量

四、习题答案

1.

A

34.

A

66.

D

99.A

2.

D

35.

C

67.

D

100.B

3.

C

36.

B

68.

A

101.D

4.

A

37.

A

69.

C

102.C

5.

B

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 医学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1