统计总复习.docx
《统计总复习.docx》由会员分享,可在线阅读,更多相关《统计总复习.docx(5页珍藏版)》请在冰豆网上搜索。
统计总复习
统计总复习
以下是为大家整理的统计总复习的相关范文,本文关键词为统计,复习,第一章,统计,三种,解释,统计工作,人们,客观,,您可以从右上方搜索框检索更多相关文章,如果您觉得有用,请继续关注我们并推荐给您的好友,您可以在教育文库中查看更多范文。
第一章
①对统计的三种解释
1.统计工作:
是人们对客观事物数量方面进行调查研究的认识活动,包括数据资料的收集、整理和分析。
2.统计资料:
是统计工作的成果,包括调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料。
3.统计学:
是一门收集、整理和分析统计数据的方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
②统计数据的分类
按计量尺度:
分类数据、顺序数据、数值型数据
(1)分类数据是只能归于某一类别的非数字型数据。
如,人口的性别:
男和女;产品类别:
食品、衣着、家电等;
(2)顺序数据是只能归于某一有序类别的非数字型数据。
如产品的质量等级:
一等品、二等品等;(3)数值型数据是按数量尺度测量的数据。
一般可直接进行加减乘除运算,且使用自然、物理、货币等单位计量。
分类数据和顺序数据说明是事物的品质特征-----品质数据或定性数据;数值型数据是说明事物的数量特征----定量数据。
按收集方法:
观测数据和实验数据
观测数据:
通过调查或观察而收集到的统计数据。
如有关社会经济数据均为观测数据。
试验数据:
在实验中,通过控制实验对象而收集到的统计数据。
如对医药疗效试验数据;生物成长的试验数据等。
注意:
观测数据一般不能再生,只能通过观察得到;大多数试验数据来源于科学实验,一般可以重复取得。
按被描述现象与时间的关系:
截面数据、时间序列数据和混合数据截面数据
–对不同单位在同一个时间点上收集的数据;–描述多个现象在某一时刻的变化情况;
–比如,20XX年我国各地区的国内生产总值数据。
时序数据
–对同一个单位的一个或者多个变量在不同时间上收集到的数据;–描述一个现象随时间变化的情况;
–比如,1996年至20XX年国内生产总值数据。
混合数据
---
在数据集中含有时间序列和截面数据成分的数据;描述多个现象随时间变化的情况;
比如,1996年到20XX年我国各地区的国内生产总值数据。
③统计学研究的对象是客观现象的数量方面。
④描述统计学和推断统计学
?
(一)描述统计学(Descriptivestatistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。
?
(二)推断统计学(Inferentialstatistics)则是研究如何根据样本数据去推断总体数量
特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。
⑤总体和总体单位(见练习册上的具体例子)
?
统计总体就是根据一定目的确定的所要研究事物的全体。
它是由客观存在的、具有某种共同性质
的许多个别事物构成的整体,简称为总体。
?
构成统计总体的个别事物则称为总体单位。
⑥标志和标志表现
?
标志
----是指总体单位所具有的属性和特征。
----在总体单位之间各有一定的具体表现,有的相同,有的不同。
----有品质标志和数量标志之分。
?
标志表现
----各种属性和特征在总体单位身上的具体体现。
⑦指标统计指标
----反映统计总体数量特征的概念和数值。
----由两项基本要素构成的,即指标的概念(名称)和指标的取值.----可以分为数量指标(如人口总数、企业总数、职工总数、工资总额等)和质量指标(粮食平均亩产量、职工平均工资、人口密度、出生率、死亡率等)。
统计指标按其所反映的数量特点不同,可以分为数量指标和质量指标。
凡是反映现象总规模、总水平和工作总量的统计指标均称为数量指标。
数量指标也称为总量指标,用绝对数来表示。
凡是反映现象相对水平和工作质量的统计指标称为质量指标。
质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系和对比关系。
第二章
①间接数据的来源和直接数据的来源
间接数据主要是从公开渠道获得的数据,如公开出版的报纸、书籍及相关网站中的数据,有些未公开的数据在获得数据所有者允许的情况下也可以使用。
直接统计数据的来源渠道主要有两个:
一是专门组织的调查;二是科学试验。
前者是社会经济数据的主要来源,后者是自然科学数据的主要来源。
本书着重讨论取得社会经济数据的方式和方法。
②统计调查方式
常用的统计调查方式主要有普查、统计报表调查、抽样调查、重点调查和典型调查。
普查我国每隔10年进行一次,抽样调查要遵循随机原则。
③数据的搜集方法
访问调查法、问卷调查法、德尔菲法、电脑辅助调查法、实验法和网络调查法
④调查对象(总体)就是根据调查目的确定的、在某种性质上相同的许多个体单位所组成的集合。
调查单位(总体单位)就是调查对象范围内的各个个体单位。
调查项目(标志)就是反映调查单位特征的变量。
(具体填的是标志值)
⑤在设计问题时要注意:
提问的内容应该尽可能地短;用词要通俗、准确;避免诱导性提问、否定式提问、对敏感性问题的直接提问;一项提问一般只能围绕一个问题进行,不能涉及多个问题等。
⑥调查问卷问题顺序安排的规则:
(1)逻辑性;
(2)兴趣性;(3)先易后难;
(4)开放性问题一般放在最后。
⑦回答项目的设计
按照答案之间的关系,可把提问分为开放性问题和封闭性问题两大类。
开放性问题属于自由回答型;封闭性问题属于选择回答型,其回答的方法又可分为两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等。
⑧统计数据整理的基本程序
(一)审核;
(二)分类或分组;(三)编表作图。
⑨累计频数和累计频率
累计频数是指将顺序数据中各组的次数按一定的方向逐级累计所得的结果。
它又可分为向上累计和向下累计两种。
从顺序数据的最低一组逐级向最高一组累计频数,称为向上累计。
从顺序数据的最高一组逐级向最低一组累计频数,称为向下累计。
⑩确定组距
一般情况下,用两个变量值组成的一个区间作为一个组时,该组的较小变量值叫下限,较大变量值叫上限,下限与上限之间的距离叫组距。
如果相邻两个组的组限不相等,则有
某组组距=本组上限—前组上限(2.2)
如果相邻两个组的组限相等,即本组下限等于前组上限时,可按式(2.3)计算组距,即某组组距=本组上限-本组下限(2.3)“上组限不在内”原则组中值的计算
组中值是各组的下限与上限之间的中点数值。
计算组中值的常用方法是取上限和下限的简单平均数,即:
数值型数据的图示
用来反映分类数据和顺序数据的图表,一般都能够用于反映数值型数据的分布,但有些反映数值型数据分布的图表却不能应用于另外两个数据类型。
对于已经分组的数值型数据,一般采用直方图反映其数据特征;对于未分组的数值型数据,一般采用茎叶图和箱线图反映其数据特征。
另外,对于时间序列数据,一般采用线图反映其发展变化的趋势和规律性。
第三章
①集中趋势——数值平均数一、算术平均数(计算公式)算术平均数的性质:
1.各变量值与其算术平均数的离差之和等于零2.各变量值与其算术平均数的离差平方和最小算术平均数(均值)特征:
1.集中趋势的最常用测度值;2.一组数据的均衡点所在;3.易受极端值的影响;
4.由组距分组资料计算的均值有近似值性质;5、用于数值型数据,不能用于分类数据和顺序数据二、调和平均数
三、几何平均数(计算公式)②集中趋势—位置平均数一、众数mo二、中位数me
三、四分位数Qu、QL
③四分位数是通过3个点将全部数据等分为四个部分,其中每部分包含25%的数据。
④众数、中位数和算术平均数的关系
在数据分布呈完全对称的正态分布时,算术平均数、众数和中位数三者相等。
在次数分布非对称时,算术平均数、众数和中位数三者不相等,但具有相对固定的关系。
在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大。
(算术平均数往左偏则为左偏分布)⑤全距
全距也称为极差,是指一组数据的最大值与最小值之差,用R表示。
即:
R=最大变量值-最小变量值
没有开口组的组距分布数列计算全距,可以用最大组的上限值减去最小组的下限值,得到全距的近似值。
全距可以反映一组数据的差异范围。
⑥异众比率
1.非众数组的频数占总频数的比率2.计算公式为
3.用于对分类数据离散程度的测度
4.用于衡量众数的代表性
异众比率主要用于衡量众数对一组数据的代表程度。
异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。
异众比率适合测度分类数据、测度顺序数据和数值型数据的离散程度。
第四章
①常用的概率抽样方法
?
(1)简单随机抽样,又称纯随机抽样,它是抽样前对总体不加任何分组、划类、
排队等处理,完全随机地抽取样本单位的方法。
?
(2)等距抽样,又称机械抽样或系统抽样,它是抽样前将总体各单位按一定标志
或次序排队,然后按相等的距离抽取样本单位的方法。
?
(3)类型抽样,又称分类抽样或分层抽样,它是抽样前将总体单位按其属性特征
分成若干类型或层,然后在各类型或层中随机抽取样本单位的方法。
?
(4)整群抽样,又称集团抽样,它是抽样前将总体各单位按一定标准分成若干群
或组,再从总体中随机抽取一定数量的群或组,对抽中的群或组的所有单位进行全面调查的方法。
?
(5)多阶段抽样,又称多级抽样,它是将调查分成两个或两个以上的阶段进行抽
样的方法。
第一阶段先将总体按照一定的规范分成若干抽样单位,称之为一级抽样单位,再把抽中的一级抽样单位分成若干更小的二级抽样单位,从抽中的二级抽样单位再分三级抽样单位,…,这样就形成一个多阶段抽样过程。
一般在一次抽样不能得到样本单位而总体又超大、复杂时使用。
③抽样分布的含义
④三个常用的统计量分布
第五章
①点估计量的评价标准
(1)无偏性
(2)有效性
(3)一致性(相合性)
②区间估计的含义,两个基本要求,neyman原则
③1.正态总体方差已知;或非正态总体但有大样本;或正态总体方差未知但有大样本2.正态总体方差未知且小样本④样本容量的确定?
一、问题的提出
从推断来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;但从抽样来看,增大样本
最后,小编希望文章对您有所帮助,如果有不周到的地方请多谅解,更多相关的文章正在创作中,希望您定期关注。
谢谢支持!