统计学复习提纲.docx

上传人:b****7 文档编号:9053598 上传时间:2023-02-03 格式:DOCX 页数:7 大小:19.48KB
下载 相关 举报
统计学复习提纲.docx_第1页
第1页 / 共7页
统计学复习提纲.docx_第2页
第2页 / 共7页
统计学复习提纲.docx_第3页
第3页 / 共7页
统计学复习提纲.docx_第4页
第4页 / 共7页
统计学复习提纲.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

统计学复习提纲.docx

《统计学复习提纲.docx》由会员分享,可在线阅读,更多相关《统计学复习提纲.docx(7页珍藏版)》请在冰豆网上搜索。

统计学复习提纲.docx

统计学复习提纲

第一章导论

1.什么是统计学?

统计方法可以分为哪两大类?

统计学是收集、分析、表述和解释数据的科学。

统计方法可分为:

1.描述统计是研究数据收集、整理和描述的统计学分支,是用图、表、统计量等方式对已有数据的特征进展描述,是指利用这种概率关系,由样本统计量推估总体参数。

内容包括:

参数估计、假设检验。

目的:

对总体特征作出推断。

2.统计数据可分为哪几种类型?

不同数据的类型各有什么特点?

按计量尺度分:

1.分类数据:

对事物进展分类的结果,数据表现为类别,用文字来表述。

2.顺序数据:

对事物类别顺序的测度,数据表现为类别,用文字来表述。

3.数值型数据:

对事物的准确测度,结果表现为具体的数值。

按收集方法分:

1.观测的数据:

通过调查或观测而收集到的数据。

2.试验的数据:

在试验中控制试验对象而收集到的数据,在没有对事物人为控制的条件下而得到的。

按时间状况分:

1.截面数据:

在一样或近似一样的时间点上收集的数据,描述现象在某一时刻的变化情况。

2.时间序列数据:

在不同时间上收集到的数据,描述现象随时间变化的情况。

3.总体、样本、参数、统计量、变量的概念。

总体:

所研究的全部元素的集合。

样本:

从总体中抽取的一局部元素的集合。

构成样本的元素的数目称为样本容量。

参数:

用来描述总体特征的概括性数字度量。

统计量:

用来描述样本特征的概括性数字度量。

变量:

说明现象某种特征的概念。

4.变量的类型、特点及应用。

类型和特点:

1.分类变量的取值只有类别属性之分,无大小。

2.顺序变量的取值除类别属性之外,还有等级、次序的差异。

3.数值变量的取值:

数值。

应用:

分类数据和数值数据都可以计算众数,但数值数据还能计算平均数,前者却不能。

第二章数据的收集

1.简述普查和抽样调查的特点。

普查:

1.为特定目的专门组织的非经常性全面调查。

2.通常是一次性或周期性的。

3.一般需要规定统一的标准调查时间。

4.数据的标准化程度较高。

5.应用范围比拟狭窄。

抽样调查:

1.从总体中随机抽取一局部单位(样本)进展调查。

2.目的是推断总体的未知数字特征。

3.最常用的调查方式。

4.具有经济性、时效性强、适应面广、准确性高等特点。

2.统计数据的具体收集方法有哪些?

数据的搜集方法:

1.询问调查:

访问调查、邮寄调查、调查、电脑辅助调查、座谈会、个别深度访问。

2.观察实验:

观察法、实验法。

3.调查方案包括那几个方面的内容?

调查方案的内容包括:

调查目的、调查对象和调查单位、调查工程和调查表等。

调查目的应说明调查所要到达的具体目标是什么;调查对象和调查单位是确定要向谁调查;调查工程和调查表说明的是调查的具体内容。

4.什么是问卷?

它由哪几局部组成?

设计问卷的提问工程应注意哪些问题?

封闭型问题答案的设计主要有哪些方法?

问卷中问题顺序的设计应注意哪些问题?

问卷是用来搜集调查数据的一种工具。

一般由开头局部、甄别局部、主体局部和背景局部组成。

设计问卷的提问工程应注意:

提问的内容尽可能短、用词要确切通俗、一项提问只包含一项内容、防止诱导性提问和否认形式的提问、防止敏感性问题等。

封闭型问题答案的设计方法有:

两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种。

问卷中问题顺序的设计应注意:

问题的安排应具有逻辑性、问题的顺序应先易后难、能引起被调查者兴趣的问题放在前面、开放性问题放在后面、版面格式的设计等。

5.统计数据的误差种类。

1.抽样误差:

所有样本可能的结果及总体真值之间的平均性差异。

在利用样本数据推断时所产生的随机误差。

2.非抽样误差:

除抽样误差之外的,由于其他原因造成的样本观察结果及总体真值之间的差异。

6.统计数据的质量要求是什么?

1.精度:

最低的抽样误差或随机误差。

2.准确性:

最小的非抽样误差或偏差。

3.关联性:

满足用户决策、管理和研究的需要。

4.及时性:

在最短的时间里取得并公布数据。

5.一致性:

保持时间序列的可比性。

6.最低本钱:

以最经济的方式取得数据。

第三章数据整理及展示

1.数据的预处理包括哪些内容?

数据的预处理:

1.数据的检查数据中的错误。

2.数据的筛选:

找出符合条件的数据。

3.数据排序:

升序和降序,寻找数据的根本特征。

2.分类数据和顺序数据的整理和图示方法各有哪些?

分类数据和顺序数据的结果均表现为类别,这类数据本身就是分了类的,因此整理时主要是在分类的根底上计算各类别的频数、比例、比率以及百分比等,同时给出频数分布。

常用的图示方法有条形图和圆形图等。

3.数值型数据的分组方法有哪些?

简述组距分组的步骤。

数据分组的方法有单变量值分组和组距分组两种。

组距分组的步骤:

1.确定组数:

组数确实定应以能够显示数据的分布特征和规律为目的。

在实际分组时,可以按提出的经历公式来确定组数K,即:

组数=1+[(n)

(2)]。

2.确定组距:

组距是一个组的上限及下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:

组距=(最大值-最小值)/组数。

3.统计出各组的频数并整理成频数分布表。

4.直方图及条形图有何区别?

直方图及条形图的区别:

1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)那么是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度那么表示各组的组距,其高度及宽度均有意义。

2.直方图的各矩形通常是连续排列;条形图那么是分开排列。

3.条形图主要用于展示分类数据;直方图那么主要用于展示数值型数据。

第四章数据分布特征的测度

1.一组数据的分布特征可以从哪几个方面进展测度?

数据特征的测度:

1.集中趋势:

众数、中位数、均值。

2.离散程度:

异众比率、四分位差、方差和标准差、离散系数。

3.分布的形状:

偏态、峰态。

2.怎样理解均值在统计学中的地位?

均值在统计学中具有重要的地位,是集中趋势的最主要测度值,其缺点是易受极端值的影响。

它主要适用于数值型数据,而不适用于分类数据和顺序数据。

3.简述众数、中位数和均值的特点和应用场合。

1.众数:

不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用。

2.中位数:

不受极端值影响,数据分布偏斜程度较大时应用。

3.平均数:

易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用。

4.简述异众比率、四分位差、方差或标准差的适用场合。

1.异众比率:

用于测度分类数据的离散程度,衡量众数对一组数据的代表程度。

2.四分位差:

用于测度顺序数据的离散程度,衡量中位数对一组数据的代表程度。

3.方差或标准差:

用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。

第五章抽样及参数估计

1.什么是抽样分布?

在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。

2.抽样均值抽样分布的两个主要特征值是什么?

他们及总体参数有什么关系?

特征值是:

数学期望和方差。

这两个特征一方面及总体分布的均值和方差有关,另一方面也及抽样方法是重复抽样,还是不重复抽样有关,无论是重复抽样,还是不重复抽样,样本均值的数学期望始终等于总体均值,而样本均值的方差那么及抽样方法有关,在重复抽样下,样本均值的方差为总体方差的1,在不重复抽样的条件下,样本均值的方差那么需要用修正系数()/

(1)去修正重复抽样时样本均值的方差。

3.样本统计量的分布及总体分布的关系是什么?

如果原有总体是正态分布,无论样本容量大小,样本统计量也服从正态分布。

如果原有总体是非正态分布,当n为大样本时〔n>=30〕,由中心极限定理可知,当样本容量n增大时,不管原来的总体是否服从正态分布,样本统计量的抽样分布都将服从于正态分布。

当n为小样本时,其分布那么不是正态分布,这时就不能按正态分布进展推断。

4.什么是置信度?

将构造置区间的步骤重复很屡次,置信区间包含总体参数真值的次数所占的比例〔概率〕称为置信度。

如抽取了100个样本,根据每一个样本均构造了一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间那么没有包含。

这里,95%这个值被称为置信水平〔或置信度〕。

5.什么是参数区间估计?

参数区间估计的含义:

估计总体参数的区间范围,并给出区间估计成立的概率值。

P(θ1£θ£θ2)=1-α。

其中:

1-α(0<α<1)称为置信度;α是总体参数未在区间内的比例,其取值大小由实际问题确定,经常取1%、5%和10%。

置信区间是[θ1,θ2],样本容量一定时置信度越大〔估计的可靠性越大〕相应置信区间也越宽〔总体参数的取值范围越大,估计越不准确〕。

第六章假设检验

1.什么是检验统计量?

什么是标准化检验统计量?

根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

标准化检验统计量=〔点估计量-假设值〕/点估计量的抽样标准差。

2.什么是显著性水平?

它对于假设检验决策的意义是什么?

在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。

一般是在原假设成立条件下,所规定的小概率的数量界限。

对应拒绝域的面积大小。

该面积对应的底边代表z的取值区间。

也就是统计量处于该区间,那么否认H0。

3.统计学中是如何表述假设检验的?

统计学中表述假设检验思想为:

对某总体抽样,如果根据样本计算的某个统计量说明在原假设H0成立的条件下是几乎不可能发生的,就否认H0,并承受其对立面H1。

反之,如果在H0成立的条件下,根据样本所计算的某个统计量发生的可能性并非很小,那么承受原假设。

4.简述假设检验的一般步骤。

H0和备择假设H1α,并计算出其临界值,指定拒绝域。

5.将统计量的值及临界值进展比拟,作出决策:

假设统计量的值落在拒绝域内,拒绝原假设H0,否那么不拒绝原假设H0。

双侧检验:

|统计量|>临界值,拒绝H0;左侧检验:

统计量<-临界值,拒绝H0;右侧检验:

统计量>临界值,拒绝H0。

第七章相关及回归分析

1.解释相关关系的含义,说明相关关系的特点。

相关关系是指变量之间存在的不确定的数量关系。

其特点是:

1.变量间关系不能用函数关系准确表达。

2.一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个,各观测点分布在直线周围。

3.可以用散点图粗略判断相关,用相关系数定量判断相关程度。

2.简述相关系数的取值及其意义。

取值及其意义:

相关系数r:

对变量之间线性关系强度的度量1的取值范围是[-1,1]。

21,为完全相关〔1,为完全正相关,1,为完全负相关〕。

30,不存在线性相关关系相关。

41£r<0,为负相关。

5.0

6越趋于1表示关系越密切;越趋于0表示关系越不密切。

3.解释回归模型、回归方程、估计的回归方程的含义及回归方程的作用。

1.描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。

2.描述因变量y的平均值或期望值如何依赖于自变量x的方程称为回归方程。

3.利用最小二乘法,根据样本数据球出的回归方程的估计称为估计的回归方程。

回归方程的作用:

对未知情况进展估计和预测。

如果已经根据样本数据建立了回归方程,并且该方程通过了各种检验,可以用它预测从现有样本数据中找不到的值。

4.什么是回归分析?

回归分析及相关分析区别。

回归分析:

1.根据样本数据,确定变量之间的数学关系式。

2.对这些关系式的可信程度进展各种统计检验,并从影响某一特定变量的诸多因素中找出哪些因素的影响显著,哪些不显著。

3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的准确程度。

回归分析及相关分析区别:

1.相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。

2.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机确实定变量。

3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以提醒变量x对变量y的影响大小,还可以由回归方程进展预测和控制。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 信息与通信

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1