统计学 2.docx
《统计学 2.docx》由会员分享,可在线阅读,更多相关《统计学 2.docx(31页珍藏版)》请在冰豆网上搜索。
统计学2
一、名词解释
1、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据。
(定类数据是对事物进行分类的结果,表现为类别,由定类尺度计量而成。
定序数据是对事物按照一定的排序进行分类的结果,表现为有顺序的类别,由定序尺度计量而成。
)
2、定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。
(定距数据是一种不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间数量差距的数据,由定距尺度计量而成。
定比数据是一种不仅能体现事物之间数量差距,还能通过对比运算,即计算两个测度值之间的比值来体现相对程度的数据,由定比尺度计量而成。
)
3、长期趋势是指时间数列中指标值在较长一段时间内,由于受普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向持续向上或向下发展或持续不变的基本态势。
4、季节变动是指数列中各期指标值随着季节交替而出现周期性的、有规则的重复变动,这里的时间通常指一年。
5、循环变动是指时间数列中各项指标值随着时间变动发生周期性的重复变化,但循环变动所需的时间更长,重复变动的规律性、变动周期和时间也不像季节变动来得稳定、可以预测。
6、不规则变动是由未能得到解释的一些短期波动所组成的,常指时间数列由于受偶然因素或意外条件影响,在一段时间内(通常指短期内)呈现不规则的或自然不可预测的变动。
7、相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。
8、点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确定值的估计,也就是用一个样本的具体统计值去估计总体的未知参数。
9、区间估计,就是指用一个具有一定可靠程度的区间范围来估计总体参数,即对于未知的总体参数θ,想办法找出两个数值θ1和θ2(θ1<θ2),使θ处于区间(θ1,θ2)内的概率为1-α,即π(θ1<θ<θ2)=1-α。
区间(θ1,θ2)为总体参数的估计区间或置信区间,θ1为估计下限或置信下限,θ2为估计上限或置信上限。
10、统计调查方式,就是运用合适的统计调查手段去收集统计调查对象总体的全部或部分个体的原始数据,也就是通过对调查对象总体的全部或部分个体的有关标志特征,进行调查或观测的方式来获取统计数据。
11、普查是根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料(总体中的所有个体都是观测单位)。
12、抽样调查是一种非全面调查,它从总体中抽取样本,以样本推断总体。
重点调查也是一种非全面调查,是对数据收集对象总和中的部分重点个体进行观测的统计调查方式。
13、统计推算是以已掌握的各种统计数据为基础,根据事物之间的内在联系或发展规律,对被研究现象数量特征做出估算或测算的一种间接统计调查方式。
二、判断题
1、统计学是一门关于统计数据的搜集、整理和分析的方法论科学。
T
2、统计学起源于德国的国势学派。
F
3、描述统计与推断统计的区别在于前者简单,后者复杂。
F
4、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来。
F
5、任何统计数据都可以归类于绝对数、相对数或平均数中的一种。
T
6、统计学可以被理解为关于样本的科学。
T
7、从广义上讲,可变标志、指标都是变量。
F
8、无论数量指标与质量指标,其数值大小都与总体容量(或样本容量)有关。
F
9、任何总体,其所包含的个体必须至少具备一个可变标志和一个不变标志。
F
10、电话号码是数量标志。
F
11、观测单位就是统计数据的提供单位。
F
12、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确。
F
13、无论是概率抽样还是非概率抽样,误差都是可以计算的。
F
14、偶然性误差只存在于抽样调查,观测性误差则可能存在于任何统计调查。
T
15、为了尽可能多地收集统计数据信息,所以问卷应尽可能地长。
F
16、统计分组应使组间差距尽量小。
F
17、凡是离散型变量都适合编制单向式数列。
F
18、各组的频数或频率都可以直接比较。
F
19、对于定义变量,不能确定平均数。
F
20、根据组距式数列计算的平均数、标准差等,都是近似值。
T
21、任何平均数都受变量数列中的极端值的影响。
F
22、中位数把变量数列分成了两半,一半数值比它大,另一半数值比它小。
F
23、任何变量数列都存在众数。
F
24、如果
<me<m0,则变量分布为右偏。
F
25、若比较两个变量分布平均数代表性的高低,则方差或标准差大者平均数的代表性差。
F
26、只要变量分布聚义厅相同的标准差,就会有相同的分布形状。
F
27、变量分布的集中趋势就是众数组的频数占总频数的比重,离中趋势则是非众数组的频数占总频数的比重。
T
28、在实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的。
T
29、抽样估计的目的是用以说明总体特征。
T
30、抽样分布就是样本分布。
F
31、对于既定总体,当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布就唯一确定。
T
32、样本容量就是样本个数。
F
33、在抽样中,样本容量是越大越好。
F
34、抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。
F
35、当估计值有偏时,我们应该弃之不用。
F
36、对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。
T
37、抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。
F
38、非抽样误差会随着样本容量的扩大而下降。
F
39、正相关是指自变量和因变量的数量变动方向都是上升的。
F
40、回归系数b和相关系数r都可以用来判断现象之间相关的密切程度。
F
41、在相关分析中,要求两个变量都是随机的;在回归分析中,要求两个变量都不是随机的。
F
42、判定系数越大,估计标准误就越大;判定系数越小,估计标准误就越小。
F
43、利用最小二乘法拟合的直线回归方程,要求所有观测点和回归直线的距离平方和为零。
F
44、两个总量指标时间数列相对比得到的时间数列一定是相对时间数列。
F
45、构成时间数列的两个基本要素是时间和指标数值。
T
46、所谓序时平均数就是将同一总体的不同时期的平均数按时间先后顺序排列起来。
F
47、间隔相等的时期数列计算平均发展水平时,应用首尾折半的方法。
F
48、累计增长量除以时间数列的项数等于平均增长量。
F
三、单选题
1、统计学的研究对象是(B)
A.各种现象的内在规律B.各种现象的数量方面
C.统计活动过程D.总体与样本的关系
2、某班3名男生的身高分别为172厘米、176厘米和178厘米,这三个数是(C)
A.标志B.变量C.变量值D.指标
3、以一、二、三等来表示产品质量的优劣,那么产品等级是(B)
A.质量指标B.品质标志C.数量标志D.数量指标
4、下列哪个指标不属于质量指标(D)
A.企业职工平均工资B.企业利润率
C.企业产品合格率D.企业增加值
5、要了解某市30所中学的学生视力状况,则个体是(C)
A.每所中学B.全部中学C.每名学生D.每名学生的视力
6、最常用的统计调查方式是(C)
A.普查B.重点调查C.抽样调查D.科学推算
7、调查小学男生的身高,则身高是(A)
A.观测标志B.观测单位C.调查对象D.变量值
8、抽样调查中不可避免的误差是(B)
A.系统性误差B.偶然性误差C.观测性误差D.登记性误差
9、在组距式数列中,对组限制的处理原则是(A)
A.上组限不在内、下组限在内B.下组限不在内、上组限在内
C.上下组限均不在内D.上下组限均在内
10、最常见的变量分布类型是(C)
A.正J形分布B.U形分布C.钟形分布D.反J形分布
11、由相对数计算平均数时,如果已知该相对数的子项数值,则应该采用(B)
A.算术平均数B.调和平均数C.几何平均数D.位置平均数
12、如果计算算术平均数的所有变量值都增加100,则方差(C)
A.增加100B.增加1000C.不变D.不能确定如何变化
13、如果计算加权算术平均数的各组频数都减少为原来的4/5,则算术平均数(C)
A.减少4/5B.减少为原来的4/5C.不变D.不能确定如何变化14、某企业有A、B两个车间,去年A车间人均产量3.6万件,B车间人均产量3.5万件。
今年A车间生产人数增加6%,B车间生产人数增加8%。
如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比(B)
A.上升B.下降C.不变D.不能确定如何变化
15、已知某变量分布属于钟形分布且m0=900,me=930,则(C)
A.
<900B.900<
<930C.
>930D.
=915
16、对某一变量数列计算数学意义上的数值平均数,得
=390,则(D)
A.H≥390,G≥390B.G≥390,H≤390
C.G≤390,H≥390D.G≤390,H≤G
17、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则(A)
A.平均数大者代表性强B.平均数小者代表性强
C.两个平均数的代表性一样D.无法判断哪个平均数的代表性强
18、离散指标中受极端值影响最大的是(C)
A.平均差B.标准差C.全距D.方差
19、统计学中最重要的离散指标是(C)
A.平均差B.全距C.标准差D.变异系数
20、根据动差的定义,方差属于(D)
A.一阶原点动差B.二阶原点动差C.一阶中心动差D.二阶中心动差
21、动差法峰度系数大于尖顶还是平顶的判断值是(D)
A.0B.1C.1.8D.3
22、我们想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则(C)
A.观测单位是学校B.观测单位是班级
C.观测单位是学生D.前三者都可以
23、下列误差中属于非一致性的有(D)
A.估计量偏差B.偶然性误差C.抽样标准误D.非抽样误差
24、抽样估计中最常用的分布理论是(C)
A.t分布理论B.二项分布理论C.正态分布理论D.超几何分布理论
25、抽样标准误大小与下列哪个因素无关?
(C)
A.样本容量B.抽样方式、方法C.概率保证程度D.估计量
26、下列关于抽样标准误的叙述哪个是错误的?
(C)
A.抽样标准误是抽样分布的标准差
B.抽样标准误的理论值是唯一的,与所抽样本无关
C.抽样标准误比抽样极限误差小
D.抽样标准误只能衡量抽样中的偶然性误差的大小
27、某企业2002年1~4月初的商品库存额如下:
(单位:
万元)
月份(月)1234
月初库存额20241822
则第一季度的平均库存额为(C)
A.(20+24+18+22)/4B.(20+24+18)/3
C.(10+24+18+11)/3D.(10+24+9)/3
28、上题中若干把月初库存额指标换成企业利润额,则第一季度的平均利润额为(B)
A.(20+24+18+22)/4B.(20+24+18)/3
C.(10+24+18+11)/3D.(10+24+9)/3
29、某企业1998年的产值比1994年增长了200%,则年平均增长速度为(C)
A.50%B.13.89%C.31.61%D.29.73%
30、1990年某市年末人口为120万人,2000年末达到153万人,则年平均增长量为(A)
A.3.3万人B.3万人C.33万人D.30万人
31、上题中人口的平均发展速度是(D)
A.2.46%B.2.23%C.102.23%D.102.46%
32、当时期数列分析的目的侧重于研究某现象在各时期发展水平的累计总和时,应采用(C)
A.算术平均法B.调和平均法C.方程式法D.几何平均法
33、如果时间数列逐期增长量大体相等,则宜拟合(A)
A.直线模型B.抛物线模型C.曲线模型D.指数曲线模型
34、当时间数列逐期增长速度基本不变时,宜拟合(C)
A.直线模型B.二次曲线模型C.逻辑曲线模型D.指数曲线模型
35、当一个时间数列是以年为时间单位排列时,则其中没有(B)
A.长期趋势B.季节变动C.循环变动D.不规则变动
36、若无季节变动,则季节指数应该是(B)
A.等于零B.等于1C.大于1D.小于零
37、某一时间数列,当时间变量t=1,2,3,…,n时,得到趋势方程为y=38+72t,那么若取t=0,2,4,6,8,…时,方程中的b将为(B)
A.144B.36C.110D.34
38、上题中,a的取值应为多少?
(38)
三、计算题
(1)回归分析
1、估计模型:
2、最小平方法
或公式求解:
a=
3、
4、回归方程判定系数
总变差=回归变差+剩余变差
(2)区间统计
【例题】从某高校的14500名学生中随机不重复抽取100名学生进行月生活费支出调查,经计算样本均值为
=546元,样本方差为s2=45568元,要求以95%的概率保证估计该校全体学生的人均月生活费支出额。
由题意知,N=14500,n=100,f=n/N=0.69%<5%;由1-α=95%可知,zα/2=1.96。
因为f<5%,所以可用重复抽样公式,可估计抽样标准误差为:
se(
)=根号下S2/n=根号下(45568/100)=21.35元
抽样极限误差为△=zα/2se(
)=1.96×21.35=41.85元。
由此可得,全校学生人均月生活费支出额95%概率保证的区间估计为(546-41.85,546+41.85)=(504.15,587.85)元
(3)长期趋势
第一章 总论
本章对统计学的学科性质、统计数据类型及其研究方法和统计学中的有关基本概念进行介绍,具体要求:
①理解统计的含义与本质;②对统计学产生与发展的简要历史,特别是对主要学派有所了解;③比较全面地认识统计学的学科性质和作用;④熟知统计数据的各种类型、特征以及计量尺度,掌握统计数据的研究过程和基本方法;⑤对总体、个体、样本、标志、变量、指标和指标体系等统计学的基本概念有比较系统、全面的掌握。
第一节 什么是统计学
一、统计的含义与本质
“统计学”是统计一词的三个含义之一。
统计泛指:
统计数据、统计活动和统计学。
统计数据是统计活动的成果,统计学则是统计活动经验的科学总结和理论概括。
统计的本质:
关于为何统计,统计什么和如何统计的思想。
二、统计学的产生和发展
从统计学的发展过程看,经历了古典统计学、近代统计学和现代统计学三个阶段,主要的学派有政治算术学派,国势学派(记述学派),数理统计学派,社会经济统计学派等。
三、统计学的学科性质
统计学是一门以现象的数量方面作为研究对象的独立的方法论科学。
四、统计学的作用
第二节 统计数据类型与研究方法
一、统计数据类型
可以分为定性数据与定量数据;绝对数、相对数和平均数;观测数据与实验数据;原始数据与次级数据;时序数据与截面数据。
二、统计数据研究过程
包括以下四个基本环节:
统计设计,数据搜集,数据整理和数据分析与解释。
三、统计数据研究方法
基本方法有大量观察法、统计分组法、综合指标法、统计推断法和统计模型法。
第三节 统计学的基本概念
一、总体与样本
(一)总体
总体是有许多具有某种共同性质的个别事物所组成的有机整体,具有大量性、同质性和差异性三个特征。
构成总体的个别事物称为个体,也叫总体单位。
总体的种类分为有限总体与无限总体;具体总体和抽象总体;可相加总体和不可相加总体;个体可自然确定的总体与个体是人为划定的总体。
总体和个体的关系表现在三个方面。
(二)样本
样本是从总体中抽取的一部分个体所组成的集合,也称子样。
样本容量是指样本所包含的个体数。
样本与总体的关系表现在三个方面。
二、标志和变量
(一)标志
标志是说明总体单位(个体)特征的名称。
(二)变量
狭义的变量是指可变的数量标志。
广义讲,变量不仅指可变的数量标志,也包括可变的品质标志。
变量有确定性变量和随机性变量;连续变量和离散变量之分。
第四节 统计指标与指标体系
一、统计指标
(一)、统计指标的概念,指标是说明总体数量特征的概念或范畴。
统计指标具有数量性、综合性、具体性的特点。
(二)指标与标志的关系
(三)统计指标的种类
1、分为总量指标(总体标志总量和总体单位总量;时期指标和时点指标),相对指标(结构相对指标、比例相对指标、比较相对指标、强度相对指标、计划完成相对指标和动态相对指标),平均指标(第三章介绍);
2、分为数量指标和质量指标;
3、分为静态指标和动态指标;
(四)统计指标的设计
确定指标的名称和涵义;计算范围和计算方法,计量单位;确定指标的资料搜集方法和统计量化尺度等。
二、统计指标体系
(一)统计指标体系的概念及表现形式,反映同总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的体系称统计指标体系。
表现形式有:
数学等式关系;相互补充关系;原因、条件与结果关系等。
(二)统计指标体系的设计原则
目的性原则、科学性原则、可行性原则、灵活性原则、层次性原则、联系性原则、协调性原则等。
第二章 统计数据的收集、整理与显示
本章阐述统计数据收集、整理与显示的理论与方法,具体要求:
①理解统计数据收集的含义与要求,掌握统计数据收集方案设计;②熟悉统计数据收集的各种方式、方法并能加以应用;③基本掌握调查问卷设计技能;④理解统计数据整理的含义、要求与步骤;⑤理解统计分组的意义,正确掌握统计分组方法;⑥掌握分布数列、尤其是变量数列的编制方法;⑦了解统计表的结构、种类和编制方法;⑧了解统计图的意义,掌握常用统计图的绘制方法。
第一节 统计数据的收集
一、统计数据收集的含义和要求
统计数据收集也称为统计调查阶段。
基本要求是准确性、及时性和完整性。
二、统计数据收集方案设计
确定数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点、数据收集的组织。
三、统计数据收集方式
有两种:
统计调查方式和实验方式。
(一)统计调查方式
统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观对象搜集资料的过程。
1、普查
普查的概念和特点;普查的组织方式;普查的组织原则。
2、抽样调查
抽样调查可分为概率抽样和非概率抽样两类。
(1)概率抽样
概率抽样按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来,它有五个特点。
概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。
概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。
(2)非概率抽样
是非随机抽样调查,有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。
3、重点调查
重点调查的含义和特点。
重点调查目的是掌握总体基本情况,关键是选好重点单位。
4、统计推算
统计推算的概念和特点;统计推算方法。
(二)实验方式
含义和原则;常用的实验设计。
(三)数据收集误差
存在两种误差:
观测性误差和代表性误差。
观测性误差也叫登记性误差或调查性误差,在全面调查和非全面调查中都会产生,是一种非一致性误差;代表性误差是指在抽样调查中,因样本不能完全代表总体而产生,又分为系统性代表性误差和偶然性代表性误差两种。
四、统计数据收集方法
统计数据收集方法,是指获取被调查对象数据的渠道或途径,常用的方法有直接观察法、通讯法、采访法、登记法等几种。
五、问卷设计
问卷一般由引言、被调查者基本情况、问题和答案、结语四个部分组成。
设计时应考虑三个方面问题:
问题的编排顺序;提问方式和措辞要点;问卷调查说明等。
第二节 统计数据的整理
一、统计整理的含义与要求
二、统计整理的内容和步骤
分组、汇总、编表(图),其中汇总是中心内容。
三、统计分组
(一)含义和性质
统计分组是根据事物内在的特点和统计研究的任务,按一定的标志,将统计总体划分为若干个不同的类型或部分(组)的一种统计方法。
分组之后应保持组内资料的同质性和组间资料的差异性。
(二)统计分组的种类:
简单分组和复合分组;品质分组和数量分组
四、分布数列
(一)分布数列的概念与种类
当总体按一个或几个标志分成若干个不同的组之后,形成了按一定顺序排列的总体单位数在各组间的分布,即为次数分配或分配数列。
分配数列的基本要素:
组别、次数(频数)或比重(频率)
分布数列的种类有品质分布数列和数量分布数列(又称变量数列)。
变量数列有单项式数列和组距式数列两种,组距式数列还有等距数列和异距数列之分。
(二)分布数列的编制
1、单项数列的编制
2、组距数列的编制
在编制组距数列时,应考虑以下问题:
(1)组距和组数。
各组上限与下限之差,称为组距。
所划分的区间数,则称为组数。
组距与组数呈反比关系。
单项式与组距式的定义与适用条件。
(2)组限与组中值
(三)频率分布
1、频率分布的性质:
:
一是各组频率都是一个介于0与1之间的分数,即大于0而小于1;二是各组频率之和等于1。
2、累计频率分布
各组累计频数与总频数之比,就形成累计频率分布。
累计分布有向上累计分布与向下累计分布两种。
第三节 统计图表
一、统计表
(一)统计表的概念和作用
经过统计整理、汇总所得的统计资料,按一定的次序和格式列在一定的表格上,就形成了统计表。
(二)统计表的结构
统计表从形式上看,包括总标题、横行标题,纵栏标题及数字资料。
统计表从内容上看,包括主词和宾词两部分。
(三)统计表的种类
按主词是否分组及分组的程度,分为简单表、分组表、复合表。
(四)宾词指标的设计
(五)编制统计表应注意的问题。
二、统计图
了解直方图、折线图、曲线图、累计曲线图(介绍洛仑兹曲线和基尼系数)、茎叶图和箱形图。
第三章 变量分布特征的描述
本章介绍如何对变量分布的特征进行描述,具体要求:
①理解变量分布三大特征的含义;②理解平均指标、离散指标和形状指标的意义与作用;③熟练掌握各种平均数的计算方法并加以正确的应用,科学理解加权平均数中权数的意义,正确认识算术平均数与调和平均数之间的应用关系,以及算术平均数、中位数和众数三者之间的数量关系;④熟练掌握各种离散指标的计算方法并加以正确的应用,尤其是要深刻理解方差、标准差和离散系数的内涵;⑤熟练掌握偏度系数和峰度系数的计算方法并加以正确的应用。
第一节 集中趋势的描述
一、集中趋势与平均指标
集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。
平均指标是将变量的各变量值差异抽象化、以反映变量值一般水平或