社会统计学复习题有答案Word文件下载.docx

资源描述

社会统计学复习题有答案Word文件下载.docx

《社会统计学复习题有答案Word文件下载.docx》由会员分享，可在线阅读，更多相关《社会统计学复习题有答案Word文件下载.docx（21页珍藏版）》请在冰豆网上搜索。

社会统计学复习题有答案Word文件下载.docx

4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。

（√）

5、统计调查按调查范围划分可以分为全面调查和非全面调查。

6、用移动平均法修匀时间数列时，如果移动项数为偶数项，只要进行一次移动平均；

如果移动项数为奇数项，则要进行二次移动平均。

用移动平均法修匀时间数列时，如果移动项数为奇数项，只要进行一次移动平均；

如果移动项数为偶数项，则要进行二次移动平均。

7、对人们收入的测量可采用定距尺度，对人们智商水平的测量可采用定比尺度。

对人们收入的测量可采用定比尺度，对人们智商水平的测量可采用定距尺度。

8、若按月平均计算，则各季度季节比率之和为400%。

若按月平均计算，则各季度季节比率之和为1200%。

9、判定系数值越大，则估计标准误差值越小，从而在简单线性回归分析中一元直线回归方程的精确性越高；

相反，判定系数值越小，则估计标准误差值越大，从而在简单线性回归分析中一元直线回归方程的精确性越低。

（√）

10、在平均指标的两因素分析中，

称为结构影响指数，

称为固定构成指数。

在平均指标的两因素分析中，

称为固定构成指数，

称为结构影响指数。

11、在抽样推断中，总体是确定的，总体参数的值是不变的；

而样本总体是不确定的，样本统计量的值是变化的。

12、商品库存额和职工人数属于时期指标，而商品销售额和职工工资总额属于时点指标。

商品库存额和职工人数属于时点指标，而商品销售额和职工工资总额属于时期指标。

三、单项选择题

1、统计调查按调查登记的时间是否连续划分，可以分为（D）。

A全面调查和非全面调查B一般调查和专项调查

C抽样调查和普遍调查D经常性调查和一次性调查

2、在回归分析中，估计值

与各实际观测值的平均数

的离差平方和称为（A）。

A回归变差B剩余变差C判定变差D总变差

3、若某总体次数分布呈轻微右偏分布，则有（C）式成立。

＜

4、若某总体次数分布呈轻微左偏分布，则有（B）式成立。

5、某城市居民家庭按年收入水平分为六组：

10000元以下，10000~20000元；

20000~30000元；

30000~40000元；

40000~50000元；

50000元以上。

则第一组和第六组的组中值分别为（D；

）。

A15000和45000B15000和55000C5000和45000D5000和55000

6、（C）是现象各期环比发展速度的平均数，其计算方法是各期环比发展速度连乘积开n次方根。

A平均发展水平B平均增长水平C平均发展速度D平均增长速度

7、家庭月收入x（元）和家庭月支出y（元）之间的回归方程为

=1+2x，这意味着家庭月收入每提高1元时，家庭月支出平均（B）。

A减少2元B增加2元C减少3元D增加3元

8、异众比率越大，各变量值相对于众数越（A）。

A离散B集中C离散或集中D无法判断

9、（B）是在遵守随机原则的条件下，用样本指标代表总体指标不可避免存在的误差。

A登记性误差B随机误差C系统性误差D非随机误差

10、如掌握的是分组资料中各组标志总量而缺少各组次数的资料，则可以采用（C）公式计算平均数。

A位置平均数B算术平均数C调和平均数D几何平均数

11、若按季平均计算，则各季度季节比率之和为（A）。

A400%B800%C1200%D1600%

四、简答题

1、指标和标志有何联系和区别？

参阅教材P.14－P.15

2、简述定基发展速度和环比发展速度的含义及其关系。

参阅教材P.143—P.144

3、试述相关分析和回归分析的联系和区别。

参阅教材P.231—P.233

4、何谓等距抽样？

等距抽样的基本步骤有哪些？

参阅教材P.246

5、何谓整群抽样？

整群抽样有何优缺点？

参阅教材P.247—P.248

五、计算题（计算结果保留两位小数）

1、某农贸市场青菜价格11月份比10月份下跌10%，12月份比11月份上涨5％，则该农贸市场12月份青菜价格与10月份相比的变化程度如何？

解：

设该农贸市场10月、11月和12月的青菜价格分别为a0、a1和a2

根据题意可知

因为

所以该农贸市场12月份青菜价格与10月份相比的增长速度=94.5%—100%=—5.5%

答：

该农贸市场12月份青菜价格与10月份相比下降了5.5%。

2、调查某社区60户居民，获得其家庭人口资料如下表所示，试用两种方法计算该社区平均每户的家庭人口数。

某社区60户家庭人口统计表

按家庭人口数分组（人）

户数（户）

各组户数占总户数比重（％）

合计

100

2、

该地区平均每户的家庭人口数约为4人。

3、某社区家庭人口资料如下，试计算该社区平均每户的家庭人口数。

家庭人口总数（人）

135

301

3、

该社区平均每户的家庭人口数约为3人。

4、某甲、乙两乡青年农民操办婚事的消费资料如下表所示:

地区

青年操办婚事平均消费额（元）

婚事支出的标准差σ（元）

甲乡

乙乡

3200

4100

850

950

要求：

比较甲、乙两乡哪一个青年操办婚事平均消费额的代表性高？

4、

乙乡青年操办婚事平均消费额的代表性高。

5、某福利企业上年年底和今年第一季度各月总产值和工人数资料如下表所示，试求该企业第一季度月平均劳动生产率。

时间

总产值（万元）

月末工人数（人）

上年12月

1月

2月

3月

220

240

300

360

110

120

5、

该企业第一季度月平均劳动生产率为2.90万元/人。

6、某福利单位今年第一季度职工工资和职工人数资料如下表所示，试求该单位第一季度月人均工资。

工资支出额（元）

月初职工人数（人）

4月

289784

295146

288640

293760

356

342

352

362

7、关于三种产品甲、乙、丙产品的价格和产值的资料如下表所示：

产品种类

计量单位

产值（万元）

2011年价格比2010年价格变动

幅度（％）

2010年

2011年

甲

乙

丙

吨

件

箱

－5

（1）三种产品的产值总指数；

（2）三种产品的价格总指数及价格变动对产值变动影响的绝对额；

（3）利用指数体系推算三种产品的产量总指数。

7、解：

甲、乙、丙三种产品产值两因素分析计算表

产品

名称

计量

单位

（％）

（万元）

102

93.1372

21.0526

—

170

235

234.1898

三种产品的产值总指数约为138.24%％；

三种产品的价格总指数为100.35％，由于价格水平的下降使得产值减少0.8102元；

三种产品的产量总指数约为137.76％。

8、关于某超市三种商品的销售量和销售额资料如下表所示：

某超市商品销售量及销售额情况表

商品名称

2011年价格比2010年

销售量变动幅度（％）

销售额（元）

毛巾

瓷碗

尼龙布

条

个

米

10000

3600

5600

9900

4500

（1）三种商品的销售额总指数；

（2）三种商品的销售量总指数及销售量变动对销售额变动影响的绝对额；

（3）利用指数体系推算三种商品销售价格总指数。

8、解：

某超市商品销售量总指数两因素分析计算表

商品

125

114

11000

6400

19200

20000

21900

三种商品的销售额总指数为104.17.%；

三种商品的销售量总指数为114.06%，销售量变动对销售额变动影响的绝对额为2700元；

三种商品销售价格总指数为91.33%。

9、某福利企业1996－2005年的产值资料如下表所示：

年度

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

产值

113

128

121

136

152

189

184

190

212

（1）以最小平方法拟合直线趋势方程，并估计2006年的产值。

（2）以半数平均法拟合直线趋势方程，并估计2006年的产值。

9、

（1）解①：

某福利企业1996～2005年产值趋势分析计算表

年份

226

384

484

680

912

1323

1472

1710

2120

1500

9386

385

＝74.2667＋13.7697×

11≈225.73（万元）

以最小平方法拟合直线趋势方程为；

2006年的产值约为225.73万元。

解②：

—9

—7

—5

—3

—1

－675

－791

－640

－363

－136

567

920

1330

1908

2272

330

＝150＋5.5455×

11＝225.73（万元）

以最小平方法拟合直线趋势方程为

（2）解：

时间编号t

产值（万元）

573

927

以半数平均法拟合直线趋势方程为；

2006年的产值约为227.88万元。

统计学问答题

1.什么是统计学？

怎样理解统计学与统计数据的关系？

统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。

统计学与统计数据存在密切关系，统计学阐述的统计方法来源于对统计数据的研究，目的也在于对统计数据的研究，离开了统计数据，统计方法乃至统计学就失去了其存在意义。

3.简要说明抽样误差和非抽样误差

统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各有关环节工作失误造成的，从理论上看，这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差，它是不可避免的，但可以计量和控制的。

4（先分为集中趋势与分散程度，再继续细分，即综述7、8）

一组数据的分布特征可以从哪几个方面进行测度？

数据分布特征一般可从集中趋势、离散程度、分布形状（偏态和峰度）几方面来测度。

分布集中趋势的测度有众数、中位数、分位数、均值、几何平均数、切尾均值；

分布离散程度的测度有极差、内距、方差和标准差、离散系数。

7.简述众数、中位数和均值的特点和应用场合。

众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形状及位置角度来考虑的，而均值是对所有数据计算后得到的。

众数一组数据分布的峰值，容易计算，但不是总是存在，众数只有在数据量较多时才有意义，数据量较少时不宜使用。

主要适合作为分类数据的集中趋势测度值，应用场合较少；

中位数是一组数据中间位置上的代表值，直观，不受极端数据的影响，但数据信息利用不够充分，当数据的分布偏斜较大时，使用中位数也许不错。

主要适合作为顺序数据的集中趋势测度值。

均值数据对数值型数据计算的，而且利用了全部数据信息，提取的信息最充分，当数据呈对称分布或近似对称分布时，三个代表值相等或相近，此时应选择平均数。

但受极端数据的影响，对于偏态分布的数据，平均数的代表性较差，此时应考虑中位数或众数。

8.标准差和方差反映数据的什么特征

反映数据离散程度的特征.

标准差反应数据的变化幅度，即上下左右波动的剧烈程度。

在统计中可以用来计算某变量值的区间范围（即置信区间）。

方差：

即标准差的平方。

所以，标准差和方差两者没有本质区别。

5怎样理解均值在统计中的地位？

均值是对所有数据平均后计算的一般水平的代表值，数据信息提取得最充分，具有良好的数学性质，是数据误差相互抵消后的客观事物必然性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到非常重要的基础地位。

受极端数值的影响是其使用时存在的问题。

10为什么要计算离散系数？

在比较二组数据的差异程度时，由于方差和标准差是以均值为中心计算出来的，有时直接比较标准差是不准确的，需要剔除均值大小不等的影响，计算并比较离散系数

1怎样理解频率与概率的关系？

频率的极限是概率吗？

频率在一定程度上反映了事件发生的可能性大小.尽管每进行一连串（n次）试验，所得到的频率可以各不相同，但只要n相当大，频率与概率是会非常接近的.因此，概率是可以通过频率来“测量”的,频率是概率的一个近似.概率是频率稳定性的依据，是随机事件规律的一个体现.实际中，当概率不易求出时，人们常通过作大量试验，用事件出现的频率去近似概率.当实验次数趋向于无穷时，频率的极限就是概率。

2概率的三种定义各有什么应用场合和局限性

1古典概率

实验的基本事件总数有限，每个基本事件出现的可能性相同；

要求样本空间是有限并且是已知的。

机会游戏的很多问题可以满足这些条件；

但现实生活的实际问题样本空间或者出现的结果无限或者未知，因此具有较强的局限性

2统计概率

历史上同类事物发生的稳定频率。

在日常生活与工作中，应用较为普遍；

统计概率通常是计算大量重复试验中该事件出现次数的频率，但有些试验是不能重复的

3主观概率

随机事件发生的可能性既不能通过等可能事件个数来计算，也不能根据大量重复试验的频率来估计，但决策者又必须对其进行估计从而做出相应决策。

具有主观随意性

3概率密度函数和分布函数的联系与区别表现在哪些方面

一元函数下.

概率分布函数是概率密度函数的变上限积分,就是原函数.

概率密度函数是概率分布函数的一阶导函数.

多元函数下.

联合分布函数是联合密度函数的重积分.

联合密度函数是联合分布函数关于每个变量的偏导.

6随机变量的数学期望和方差与第二章所讲的均值和方差有何区别，联系

数学期望又称均值，实质上是随机变量所有可能取值的一个加权平均，其权数就是取值的概率，方差一样

12解释总体分布、样本分布和抽样分布的含义

总体分布：

所有元素出现概率的分布

样本分布：

样本n个观察值的概率分布。

抽样分布：

由样本n个观察值计算的统计量的概率分布

1．简述评价估计量好坏的标准

1、无偏性：

估计量抽样分布的数学期望等于被估计的总体参数

2、有效性：

对同一总体参数的两个无偏点估计量，有更小标准差的估计量更有效

3、一致性：

随着样本量的增大时，点估计量的值越来越接近被估总体的参数。

举例

2.说明区间估计的基本原理

总体参数的区间估计是在一定的置信水平下，根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间。

3解释置信水平的含义

（画图）

置信区间中包含总体参数真值的次数所占的比率称为置信水平；

而置信区间是指由样本统计量所构成的总体参数的估计区间。

置信区间越大，置信水平越高。

4．解释置信水平为95％的置信区间的含义

总体参数是固定的，未知的，置信区间是一个随机区间。

置信水平为95％的置信区间的含义是指，在相同条件下多次抽样下，在所有构造的置信区间里大约有95％包含总体参数的真值。

5．简述样本容量与置信水平、总体方差、允许误差的关系

以估计总体均值时样本容量的确定公式为例：

样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

附加题：

简（综）述述置信区间和显著性水平的关系

显著性水平为a检验的拒绝域，与置信水平为1-a的置信区间互为补集的，也即：

求接受域就是求置信区间，所以假设检验和区间估计本质是一回事。

1．理解原假设与备择假设的含义，并归纳常见的几种建立原假设与备择假设的原则.

原假设通常是研究者想收集证据予以反对的假设；

而备择假设通常是研究者想收集证据予以支持的假设。

建立两个假设的原则有：

（1）原假设和备择假设是一个完备事件组,而且相互对立。

（2）一般先确定备择假设。

再确定原假设。

（3）等号“＝”总是放在原假设上。

（4）假设的确定带有一定的主观色彩。

（5）假设检验的目的主要是收集证据来拒绝原假设。

3．什么是显著性水平？

它对于假设检验决策的意义是什么？

假设检验中犯第一类错误的概率被称为显著性水平。

显著性水平通常是人们事先给出的一个值，用于检验结果的可靠性度量，但确定了显著性水平等于控制了犯第一错误的概率，对检验结果的可靠性起一种度量作用

4．什么是p值？

p值检验和统计量检验有什么不同？

p值是当原假设为真时，检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。

P值常常作为观察到的数据与原假设不一致程度的度量。

统计量检验采用事先确定显著性水平，来控制犯第一类错误的上限，p值可以有效地补充提供地关于检验可靠性的有限信息。

p值检验的优点在于，它提供了更多的信息，让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

6比较单侧检验和双侧检验的区别

（1）问题的提法不同，双侧检验研究的是新方法与旧方法是否有差异；

单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。

2建立假设的形式不同，双侧检验的假设是H0:

u=u0H1:

u≠u0；

单侧检验的假设是H0:

u≤u0H1:

u0或H0:

u0H1:

u≤u0。

（3）否定的区域不同，双侧检验的否定区域是|Z|>

Za/2；

单侧检验的否定区域是Z<

-Za或Z>

1什么是方差分析？

它研究的是什么？

方差分析是检验多个总体均值是否相等的统计方法，来判断分类型自变量对数值型因变量是否有显著影响。

它所研究的是分类型自变量对数值型因变量的影响。

2方差分析中有哪些基本假定

每个总体都应服从正态分布；

每个总体的方差必须相同；

观测值是独立的

3简述方差分析的基本思想

通过分析研究不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小

7解释水平项平

展开阅读全文