社会统计学简答题答案.docx
《社会统计学简答题答案.docx》由会员分享,可在线阅读,更多相关《社会统计学简答题答案.docx(7页珍藏版)》请在冰豆网上搜索。
社会统计学简答题答案
社会统计学简答题答案
1.答:
大量观察法,就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。
大量观察法是统计调查阶段的重要方法。
大数规律是随机现象出现的基本规律,它的一般意义是:
观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。
2.答:
社会统计学与经济统计学都是社会经济统计学的有机组成部分。
但从实际上看,它们所司的领域、研究对象以及内容和方法,都各具有特点。
就研究对象而言,经济统计主要是从研究和反映生产力关系方面去认识社会;社会统计则主要是从研究和反映一定经济基础之上的上层建筑方面去认识社会。
就研究内容而言,经济统计侧重于研究和反映物质资料的生产、分配、交换和消费过程,经常使用度量衡单位、货币单位和劳动时间单位等;社会统计也使用这些计量单位,但在社会研究的许多领域,经常需要对人们的态度、观念、行为进行度量,测量这些社会现象目前还没有一个精确而统一的尺度,只能以近似估算或词语表达等方式来代替。
就调查方法而言,在经济统计中,由于其研究对象所具有的特征,全面调查、经常性调查较常用,特别是统计报表这种调查组织形式,可以定期取系统的资料;在社会统计中,由于其研究对象(如社会行为等)所具有的特征,抽样调查更为常用。
即使是经济统计和社会统计都采用抽样调查方法,前者常常重视抽样推断的方法,以达到从部分到全体的认识,后者则常常是依据社会研究的目的建立假设,然后再应用抽样法来检定假设是否成立。
3.答:
总体作为统计研究的对象,具有三个基本特征:
大量性、同质性和变异性。
总
体必须由足够多的单位所组成,各别或少数几个单位不足以构成总体。
大量性是统计运用大数定律得前提,也是统计与其他数学分析方法的一个基本区别。
总体的同质性是构成总体的另一个必要条件。
同质性是相对研究目的而言的,当研究目的确定之后,同质性的界限也就确定了。
变异性是构成总体的第三个条件,如果个体之间没有差异,也就没有必要进行统计研究了。
4.答:
现实总体是由一些看得见、摸得着的各题所构成的。
如工厂中的职工。
想象总体只存在于我们的想象之中,例如手中有十枚硬币,做掷硬币的试验,看看有六枚硬币面朝上的这种结果实现的机会是多少。
通过想象,我们可以做无数次试验,每一次试验得到一个结果,看看六枚硬币面朝上的可能性有多大。
这就是想象总体
5.答:
凡能用数量的多少来表示的标志,称为数量标志,如年龄。
凡不能用数量的多少来表示而只能用文字表述的标志,称为品质标志,如性别。
6.答:
数量指标说明总体在外延上的数量特征,如人口总数、居民收入、产品产量等,一般都以总量指标的形式出现。
质量指标说明总体在内涵上的数量特征,如人口密度、劳动生产率、产品价格等,一般
都以相对指标或平均指标的形式出现。
7.答:
推论统计有两个基本内容:
(1)参数估计,即由样本的指标数值推断总体的相应指标数值,它包括点估计和区间估计;
(2)假设检验,即就社会研究中提出的某种假设应用抽样方法来加以统计检验。
8.答:
统计指标和标志都是质的规定性和量的规定性的结合,它们之间有联系也有区
别。
主要区别是:
(1)指标是说明总体特征的,标志是说明总体中各单位特征的;
(2)指标只能用数值表示,而标志中有不用数值而用文字表示的品质标志这种情况。
主要联系是:
(1)、指标名称和标志名称具有对应关系,在统计研究中两者往往是同一概念;
(2)、指标数值是由总体单位的个数和数量标志的标志值汇总而来的。
9.答:
(1)制定计划
(2)统计调查
(3)统计整理
(4)统计分析
(5)统计报告
10.答:
抽样调查是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分
样本单位来进行调查、观察,然后用所得到的调查结果来推断总体。
抽样调查的最大优点是省时、省力和节省经费。
此外,由于抽样调查的范围较小,调查工作可能做得更加深入细致。
错误发生的机会减少,资料的可信程度提高,这也是抽样调查的一个优点。
11.答:
分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。
整群抽样是从总体中成群地抽取调查单位。
也就是说,要先将总体单位分为若干群,再在其中随机地抽取部分群,整群抽样并不以抽样框的获得为前提。
(6分)
整群抽样与分层抽样确实有相似之处,即它们的第一步都是根据某种标准将总体划分为若干群或层。
但两者的主要差别在于过程后一步。
对于整群抽样,抽中群的全部个体都是样本单位,未抽中群的样本单位都不在调查之列。
分层抽样则要在所有层中均抽取一个小样本,它们合起来构成总体样本。
也就是说,对于分层抽样,调查对象来自所有层,调查结果的代表性自然比较高。
分层抽样和整群抽样在适用上的基本差别是:
分层抽样时,层间差异尽可能大,层内差异尽可能小;整群抽样时,群间差异尽可能小,群内差异尽可能大。
12.
(1)各变量值与算术平均数的离差之和等于0,
(2)各变量值对算术平均数的离差的平方和,小于它们对任何其他数(
’)偏差的平方和。
也就是说,各变量值与算术平均数的离差的平方和为最小值。
(3)算术平均数受抽样变动影响微小,通常它是反映总体分布集中趋势的最佳指标。
(4)算术平均数受极端值的影响颇大,遇到这种情况时,就不宜用它来代表集中趋势了。
(5)分组资料如通有开放组距时,不经特殊处理,算术平均数将无法得到。
13.
(1)各变量值对中位数之差的绝对值总和,小于它们对任何其他数(X’)之差的绝对值总和。
(2)中位数不受极端值的影响。
(3)分组资料有不确定组距时,仍可求得中位数。
(4)中位数受抽样变动的影响较算术平均数略大,因此中位数作为表示总体资料集中趋势的指标,使用也很广泛。
14.
(1)在分组资料中,众数仅受上下相邻两组频数大小的影响。
而不受极端值的影响,因而对开口组资料,仍可计算众数。
(2)受抽样变动影响大。
(3)对于给定资料,其反映集中趋势的指标,只有众数不唯一确定。
有的资料只有一个众数,有的资料没有众数,有的资料则存在好几个众数。
(4)在频数分布中,众数标示为其“峰”值所对应的变量值,它的优点是帮助我们很容易区分出偏态以及单峰分布和多峰分布。
15.①Z分数之和等于0
②Z分数的算术平均数等于0
③Z分数的标准差等于1,Z分数的方差也等于1
16.平均差以及接下来要讨论的标准差,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。
所以,平均差在受抽样变动影响、受极端值影响和处理不确定组距这三方面,它的性质均同于算术平均数。
与此同时,平均差由于计算时采用了取绝对值来消除正负号的影响的方法,它不便于代数运算,而且平均差的意义在理论上也不容易作出阐述。
所以,平均差作为变异指标,其运用比下面的标准差要少得多
17.简述中心极限定理。
中心极限定理的具体内容是:
如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值
的抽样分布接近正态,并具有均值μ和方差
。
18.试述正态分布的性质与特点。
(1)正态曲线以X=μ呈钟形对称,其均值、中位数和众数三者必定相等。
(2)
(X=x)在X=μ处取极大值。
X离μ越远,
(X=x)值越小。
这表明对于同样长度的区间,当区间离μ越远,X落在这个区间的概率越小。
正态曲线以X铀为渐近线,即
(X=x)在|X|无限增大时趋于零,即
(x)=0或
(x)=0。
(3)对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置(参见图7.3)。
(4)对于固定的μ值,改变σ值,σ值越小,正态曲线越陡峭;σ值越大,正态曲线越低平(参见图7.4)。
19.答:
首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设。
但是,数据少如果否定了零假设,这一否定的可靠性是很大的。
其次,当试验规模极大而得到否定零假设的结果时,需要进一步(使用区间估计等方法)考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事。
反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持。
20.答:
当
被用于研究定距—定距变量之间的关系时,不仅可以作为线性相关的量度,也可以作为非线性相关的量度。
对线性相关,相关比率
与r2(积差系数之平方)有相同的PRE性质。
R2可以看做
的特例(定距—定距变量)。
对于定距—定距变量,曲线相关要用R来测量。
同一资料通过相关指数R与积差系数r计算的比较,可以判断确定两定距变量的关系是不是直线。
如果同时求出r与R,r等于或略大于R,可说明两变量关系是直线的,用r去测量是合适的;如果r<R,则说明两变量关系可能是曲线的。
21.答:
配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本,也称关联样本。
例如单一实验组实验,在社会调查研究中是一种简单的“前—后”对比类型,它比较同一个个体在引进实验变量前后的情况。
显然,这样的样本不具有相互独立性,因为知道了每对数据中的一个就有助于预测另一个。
事实上,匹配的全部目的就在于尽可能对实验变量以外的其他独立变量进行控制,使两个样本尽可能在其他方面相同,使得后测不同于前测的变化,就是由于实验刺激所造成。
22.答:
在一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法如下:
(1)前测:
对实验组与控制组分别度量;
(2)实验刺激:
只对实验组实行实验刺激;
(3)后测:
对实验组与控制组分别度量;
(4)求算消除了额外变量影响之后的di
后测实验组―前测实验组=前测后测差实验组
后测控制组―前测控制组=前测后测差控制组
实验效应di=前测后测差实验组―前测后测差控制组
23.简述统计量成为总体参数的合理估计的三个标准。
估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。
(1)无偏性
如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是无偏估计。
(2)一致性
虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。
(3)有效性
估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。
如果估计是无偏的,就可以用估计量的标准差来量度这种集中程度。
标准差越小,估计量的有效性越高。
总而言之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳估计量。
数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总能满足上述三个标准,所以可以认为这是质量很高的点估计。
24.简述在参数估计中准确性和可靠性的辨正统一的关系。
精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。
两者的对立统一,停留在经验描述水平上是无法真正讲清楚的。
这就要从参数估计的角度(而不仅仅是从假设检验的角度)来运用概率论。
粗略地讲,效度和信度是成反比的。
当精确程度达到最大而可信程度达到最小时,就过渡到了点估计。
但若仔细分析不难发现,在参数估计中对效度和信度的要求并不是并重的。
由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估计,即使这时估计区间为零,但估计对总体仍有一定的代表性。
我们却不可以将估计区间任意放大,这样获得的可靠性对统计推论将没有任何意义。
所以就此而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。
25.答:
(1)
恒为正值,且
=1(
(2)
分布的期望值是自由度k,方差值为自由度的2倍,即对
(
)有
E(
)=k,D(
)=2k
对k<2,
分布呈L形。
分布随自由度k的增加而渐趋对称。
当k→∞时,
分布以正态分布为极限。
26.答:
(1)随机变量F和随机变量
一样,恒取正值,F分布密度曲线下总面积亦为1。
(2)F分布也是一个连续的非对称分布。
当
≤2时.F分布呈L形;当
>2时,F分布则为钟形,当
→∞时,F分布趋于对称。
(3)具有一定程度的反对称性,即F1-α和1/Fα交换,同时
也和
交换,这不影响相应的概率:
F1-α(
,
)=
27.离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数列;离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则要编制组距数列。
连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只能编制组距数列。
与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重合。