统计学名词解释归纳.docx

资源描述

统计学名词解释归纳.docx

《统计学名词解释归纳.docx》由会员分享，可在线阅读，更多相关《统计学名词解释归纳.docx（7页珍藏版）》请在冰豆网上搜索。

统计学名词解释归纳.docx

统计学名词解释归纳

1什么就是统计学？

统计方法可分为哪两大类？

统计学就是收集、处理、分析、解释数据并从数据中得出结论得科学。

方法有描述统计与推断统计两类

2统计数据可分为哪几种类型?

不同类型数据各有什么特点？

按采取计量尺度，分类、顺序、数值型数据；按统计数据收集方法,观测、实验数据；按被描述对象与时间关系，截面、时间序列数据

统计数据;按所采用得计量尺度不同分；

（定性数据）分类数据：

只能归于某一类别得非数字型数据,它就是对事物进行分类得结果，数据表现为类别,用文字来表述;

（定性数据）顺序数据：

只能归于某一有序类别得非数字型数据.它也就是有类别得,但这些类别就是有序得。

（定量数据）数值型数据:

按数字尺度测量得观察值，其结果表现为具体得数值.

统计数据；按统计数据都收集方法分；

观测数据:

就是通过调查或观测而收集到得数据,这类数据就是在没有对事物人为控制得条件下得到得。

实验数据：

在实验中控制实验对象而收集到得数据。

统计数据;按被描述得现象与实践得关系分；

截面数据:

在相同或相似得时间点收集到得数据,也叫静态数据。

时间序列数据：

按时间顺序收集到得，用于描述现象随时间变化得情况，也叫动态数据。

3举例说明总体、样本、参数、统计量、变量这几个概念：

对一千灯泡进行寿命测试，那么这千个灯泡就就是总体，从中抽取一百个进行检测，这一百个灯泡得集合就就是样本，这一千个灯泡得寿命得平均值与标准差还有合格率等描述特征得数值就就是参数，这一百个灯泡得寿命得平均值与标准差还有合格率等描述特征得数值就就是统计量，变量就就是说明现象某种特征得概念，比如说灯泡得寿命。

4什么就是有限总体与无限总体？

举例说明

有限总体指总体得范围能够明确确定,而且元素得数目就是有限可数得,如若干个企业构成得总体,一批待检查得灯泡.无限总体指总体包括得元素就是无限不可数得,如科学实验中每个试验数据可瞧做就是一个总体得一个元素，而试验可无限进行下去,因此由试验数据构成得总体就是无限总体

５变量可分为哪几类?

变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量与非随机变量。

经验变量与理论变量。

6举例说明离散型变量与连续型变量

离散型变量，只能取有限个值，取值以整数位断开,比如“企业数”

连续型变量,取之连续不断，不能一一列举,比如“温度”。

1数据得预处理包括哪些内容？

数据审核（完整性与准确性；适用性与实效性），数据筛选与数据排序。

2直方图与条形图有什么区别?

①条形图使用图形得长度表示各类别频数得多少,其宽度固定,直方图用面积表示各组频数，矩形得高度表示每一组得频数或频率，宽度表示组距，②直方图各矩形连续排列，条形图分开排列,③条形图主要展示分类数据，直方图主要展示数值型数据.

３饼图与环形图有什么不同？

饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体得数据系列,其图形中间有个“空洞”，每个样本或总体得数据系类为一个环。

４茎叶图与直方图相比有什么优点？

茎叶图既能给出数据得分布情况，又能给出每一个原始数据,即保留了原始数据得信息.在应用方面,直方图通常适用于大批量数据，茎叶图适用于小批量数据。

5使用图标应注意哪些问题?

①合理安排统计表结构②表头一般包括表号,总标题与表中数据得单位等内容③表中得上下两条横线一般用粗线,中间得其她用细线④在使用统计表时，必要时可在下方加注释，注明数据来源。

1、一组数据得分布特征可以从哪几方面进行测度.

一就是分布得集中趋势,反映数据向其中心靠拢或聚集得程度；二就是分布得离散程度,反映各数据远离其中心值得趋势；三就是分布得形状,反映数据分布偏斜程度与峰度。

2、简述四分位数得计算方法:

首先对数据进行排序,然后确定四分位数所在得位置，该位置上得数值就就是四分位数。

（设２5%得四分位数为Q25％，７５％四分位数为Ｑ7５％，根据四分位数定义有：

Q25%位置=n/4，Q7５％位置＝3n/4。

３、对于比率数据为什么采用几何平均。

在实际应用中，对于比率数据得平均采用几何平均要比算数平均更合理.从公式中也可瞧出，G就就是平均增长率.

4、简述众数、中位数、与平均数得特点与应用场合。

众数就是一组数据分布得峰值，不受极端值得影响,缺点就是具有不唯一性.众数主要作为分类数据得集中趋势测度值.

中位数就是一组数据中间位置上得代表值，不受数据极端值得影响。

中位数以及其她分位数主要适合于作为顺序数据得集中趋势测度值。

均值就是就数值型数据计算得,具有优良得数学性质，缺点就是易受数据极端值得影响。

均值主要适合于作为数值型数据得集中趋势测度值。

5、为什么要计算离散系数。

第一,极差、平均差、方差与标准差等都就是反映数据分散程度得绝对值，其数值得大小取决于原变量值本身水平高低得影响.第二,它们与原变量值得计量单位相同,采用不同计量单位计量得变量值,其离散程度得测度值也就不同。

因此,为消除变量值水平高低与计量单位不同对离散程度得测度值得影响，需要计算离散系数。

６、简述异众比率、四分位差、方差或标准差得适用场合

对于顺序数据，但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率与四分位差，但主要使用方差或标准差来测量其离散程度。

7、　标准分数有哪些用途？

标准分数给出了一组数据中各数值得相对位置。

在对多个具有不同量纲得变量进行处理时,常需要对各变量进行标准化处理.它还可以用来判断一组数据就是否有离群数据。

１、抽样推断得含义：

就是在根据随机原则从总体中抽取部分实际数据得基础上,运用数理统计方法，对总体某一现象得数量性作出具有一定可靠程度得估计判断。

2、简单随机抽样：

①含义：

从含有Ｎ个元素得总体中，抽取n个元素作为样本,使得每一个容量为n得样本都有相同得机会被抽中,这样得方式称为简单随机抽样。

②特点：

简单随机抽样就是其她抽样方法得基础。

有两种抽取元素得方式：

重复臭氧与不重复抽样.

分层抽样：

①含义：

在抽样之前先将总体得元素划分为若干层,然后从各个层中抽取一定数量得元素组成一个样本,这样得样本抽样方式称为分层抽样，也成分类抽样。

②特点：

⑴除了可以对总体进行评估外，还可以对各层得子总体进行评估。

⑵可以按自然区域或行政区域进行分层，使抽样得组织与实施都比较方便.⑶分层抽样得样本分布在各个层内,从而使样本在总体中得分布比较均匀.⑷可以提高估计得精度。

系统抽样：

①含义：

先将总体个元素按照某种顺序排列,并按某种规则确定一个随机起点，然后，每隔一定得间隔抽取一个元素，直至抽取n个元素形成一个样本。

②特点:

⑴简单易行⑵在总体中得分布一般也比较均匀，由此估计得误差通常要小于简单随机抽样。

整群抽样：

①含义:

先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中得各个群中所包含得所有元素进行观察。

②特点：

不需要有总体元素得具体名单而只要有群得名单就可以进行抽样.整群抽样时群内各元素比较集中,对样本进行调查比较方便，节约费用。

在群内各元素存在差异时,整群抽样可以提供较好得结果,理想得情况就是每一群都就是整个总体得一个缩影.

3、重复抽样：

从总体中抽取一个元素后，把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。

不重复抽样：

一个元素被抽中后不再放回总体，然后再从所剩下得元素中抽取第二个元素,直到抽取n个元素为止。

４、抽样分布:

重复选取容量为n得样本时，由每一个样本算出得统计量数值得相对频数分布或概率分布，称为样本统计量得抽样分布。

5、样本统计量得分布与总体分布得关系？

由于现实中我们不可能将所有得样本都抽出来，因此，统计量得抽样分布实际上就是一种理论分布，但它与总体分布存在着密切得关系，以均值ｘ得抽样分布为例，其抽样分布与原有总体得分布有关，如果原有总体就是正态分布，那么，无论样本容量得大小，样本均值也服从正态分布。

其分布得数学期望为总体均值,方差为总体方差得1／n，即０0。

如果原有总体得分布不就是正态分布，就要瞧样本容量得大小了,当ｎ为大样本时（n≥３０），根据统计上得中心极限定理可知,当样本容量n增大时，不论原来得总体就是否服从正态分布，样本均值得抽样分布都将趋于服从正态分布。

其分布得数学期望为总体均值,方差为总体方差得1/n。

6、　Zα/2得含义：

就是估计误差。

Zα/2得值与样本量n共同确定了估计误差得大小,一旦确定了置信水平1－α,Zα/2得值就确定了.对于给定得Zα/2得值与总体标准差σ。

可以确定任一允许得估计误差所需要得样本量。

7、样本均值抽样分布得两个主要特征值:

与总体参数得关系：

1、理解原假设与备择假设得含义:

原假设:

通常将研究者想收集证据予以反对得假设称为原假设或零假设，用H０表示;备择假设：

通常将研究者想收集证据予以支持得假设称为备择假设或研究假设，用Ｈ1表示.

２、统计检验量:

根据样本观测结果计算得到得，并据以对原假设与备择假设作出决策得某个样本统计量，称为检验统计量.

标准化检验统计量：

就是将统计检验量标准化,标准化得统计检验量=（点估计量—假设值）／点估计量得抽样标准差。

3、第Ⅰ类错误：

当原假设为真时拒绝原假设，所犯得错误称为Ⅰ类错误.犯第Ⅰ类错误得概率通常记为α。

第Ⅱ类错误：

当原假设为假时没有拒绝原假设,所犯得错误称为第Ⅱ类错误,又称取伪错误。

犯第Ⅱ类错误得概率通常记为β。

它们发生概率之间得关系:

在样本量不变得情况下，要减小α就会使β增大,而要增大α就会使β减小，这两类错误此消彼长。

4、显著性水平：

假设检验中犯得第Ⅰ类错误得概率,称为显著性水平,记为α。

它对于假设检验决策得意义：

显著性水平就是人们事先制定得犯第Ⅰ类错误得概率α得最大允许值,在实际应用中,显著性水平往往就是人们事先给出得一个值。

5、Ｐ值:

在原假设为真得条件下,检验统计量得观察值大于或等于其计算值得概率,称为P值，也称为观察到得显著性水平。

利用P值决策得准则:

如果P值<α,拒绝Ｈ0;如果P值＞α,不拒绝H０、

6、单侧检验与双侧检验得区别:

单侧检验中，P值位于抽样分布得一侧,而双侧检验Ｐ值位于分布得两侧，每一侧得P值为1/2、

7、大样本情形下总体均值左侧检验得拒绝域:

Ｚ〈﹣Zα；右侧检验得拒绝域:

Ｚ＞Z;双侧检验得拒绝域：

｜Z｜＞Zα/2。

８、小样本情形下总体均值检验应该构造得检验统计量t应用前提：

服从正态分布

9、小样本情形下总体均值左侧检验拒绝域：

t〈﹣tα（n－1）；右侧检验拒绝域：

t＞tα（n－1）;双侧检验得拒绝域：

|t｜＞tα/2（ｎ-１）

10、假设检验得一般步骤:

①依照题意建立原假设H0与备择假设H1②判断样本大小并计算检验统计量③根据显著水平进行判断原假设就是否成立.

1、相关关系：

变量之间存在得不确定得数量关系。