新疆财经大学统计学考试题型.docx

上传人:b****7 文档编号:8811525 上传时间:2023-02-01 格式:DOCX 页数:17 大小:262.02KB
下载 相关 举报
新疆财经大学统计学考试题型.docx_第1页
第1页 / 共17页
新疆财经大学统计学考试题型.docx_第2页
第2页 / 共17页
新疆财经大学统计学考试题型.docx_第3页
第3页 / 共17页
新疆财经大学统计学考试题型.docx_第4页
第4页 / 共17页
新疆财经大学统计学考试题型.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

新疆财经大学统计学考试题型.docx

《新疆财经大学统计学考试题型.docx》由会员分享,可在线阅读,更多相关《新疆财经大学统计学考试题型.docx(17页珍藏版)》请在冰豆网上搜索。

新疆财经大学统计学考试题型.docx

新疆财经大学统计学考试题型

《统计学》考试复习题型

一、单项选择题(共10分)

1、变量X的中位数小于平均数,其分布是(B)

A对称分布B右偏态分布C左偏态分布D不能确定分布形态

2、组中值(B)

A、一个组的上限和下限之差B、一个组的上限与下限之间的中点值

C、一个组的最小值D、一个组的最大值

3、组距是(A)

A、一个组的上限和下限之差B、一个组的上限与下限之间的中点值

C、一个组的最小值D、一个组的最大值

4、下面中是连续变量的是(A)

A产值B设备台数C存栏头数D职工人数

5、下面那些分析不是统计方法(B)

A平均B混合C分类D排序

6、若已知众数

中位数

与均值之间的关系相等,

=

=

,这数据发布为(C)

A、左偏态B、右偏态C、对称D、U发布

7、下列哪个统计方法具有预测功能(C)

A、标准差B、分位数C、回归模型D、频数发布、

8、了解居民家庭的经济状况,从两万户家庭中抽取1000户进行调查,样本是(B)

A、2万户家庭的收入B、1000户家庭的收入C、2万户D、1000户

9、当分布为左偏时(B)

A、

B

C、

D、

10、某批产品的合格率为80%,则其方差为(A)比例的方差为p(1-p)

A、0.16B、0.8C、0.4D、0.2

11若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)

A、无相关B、存在正相关C、存在负相关D、无法判断

12、对于无限总体,只能用(C)

A、只能用全面调查B、只能用非全面调查

C、全面非全面均可D、以全面为主、非全面为辅

13、某纺织车间第二小组10名工人看管机器设备台数资料如下:

4、5、4、3、6、5、5、6、3,对此数据分组时,应采用(C)

A、等距分组B、不等距分组C、单项式分组D、以上均可

14、、下面哪一个是统计分析常用软件(A)

A、EXCELB、QQC、AORDD、WINDOWS

二、填空题(共10分)

1、变量X经过标准化得分Z的平均值(),标准差()

2、某研究部门准备抽取2000个家庭推断该城市所有职工家庭人均收入。

参数是:

该市真是的家庭人均收入

统计量是:

2000个家庭的人均收入

3、统计数据预处理包括数据的审核、筛选和排序。

4、一组数据的分布特征可以从集中趋势、离散程度和分布的形态三个方面进行测度。

5、在参数估计中、用来估计总体参数的统计量名称称为估计量。

而根据一个具体的样本计算出来的统计量的数值成为估计值。

6、人们在实践中发现,变量之间的关系可以分为两类,即相关和函数关系。

7、统计数据的来源有直接来源和间接来源。

8、统计总体分为有限总体和无限总体。

9、四分位数是一组数据排序后处于四分之一和四分之三位置的值。

增长率是时间序列中报告期观测值与基期观测值之比减去1后的结果。

由于对比基期不同,增长率可以分为环比增长率和定基增长率。

10、数值型数据的分组可以分为组距分组和单变量值分组。

11、参数估计的方法有点估计和区间估计。

12、数据展示的两种方法是统计图和统计表。

13、统计数据按照时间状态可以分为时间序列数据和截面数据。

三、简答题(共15分)参考各章思考题

1、什么是统计学?

谈谈你对统计学的认识?

书本第二页

2、描述统计包括哪些内容?

第四章所有的指标指标。

3、什么是截面数据?

同一时间点或同一时期内同一指标不同空间范围的的一组数据叫做截面数据,其特点是时间相同,空间不同。

4、简述数值型数据的分组方法

数值型数据的分组方法有单变量值分组和组距分组,组距分组根据组距是否相等,可以分为等距分组和异距分组。

5、简述评价估计量好坏的标准?

1无偏性,2、有效性3、一致性

4、某班有40名学生,期末统计学成绩的茎叶图和直方图如下:

问题:

对比分析条形图和茎叶图有什么优点,它们的应用场合是什么/

直方图能够反映组距分组的结果,且频数发布形态比较明显,茎叶图能够反映原始数据。

直方图主要应用到数据数量较多地方,而茎叶图则主要分析数据个数较少的情况。

5、有关少数民族就业状况的调查资料如下:

各民族中就业所占比重单位:

%

汉族

其他少数民族

维吾尔族

总计

就业

83

11.11

48.48

47.71

无就业

17

88.89

51.52

58.29

根据上述资料对不同民族的就业状态进行分析。

答案,自己描述,看表说话题

6、一种产品需要人工组装,现有三种可供选择的组装方法。

为检验那种方法更好,随机抽取15名工人组装,让他们分别用三种方法组装,15名工人用三种方法组装的产品数量进行描述统计分析的结果如下:

 

观测数

Min

Max

均值

标准差

方法A

15

162

170

165.6

2.131

方法B

15

125

132

128.73

1.751

方法C

15

116

128

125.53

2.774

答案,用离散系数最小的一种方法,自己计算离散系数,计算方法是标准差除以平均值

那个最小选哪个,原因是离散系数是一组数据相对离散程度的测度指标,离散系数越小,说明这组数据越稳定,故选择。

7、说明下列散点图形变量X与Y间关系。

,随着变量x的增大,变量y总体减小,且两者之间的变动关系可以用一条直线近似反应,故两者之间存在负线性相关关系。

8、某班数学成绩和统计学成绩的箱线图如下:

(1)指数上面数据属于上面类型?

数值型数据

(2)根据上表写出一个简短的统计分析,

看图说话题,主要从四个方面回答,1、统计学平均成绩大于数学平均成绩。

2、统计学成绩相对比较集中,数学成绩相对比较离散。

3、统计学成绩成正态分布,数学成绩为左偏分布。

4、统计学成绩极差小于数学成绩极差。

9、甲乙两企业生产产品的成本产量和总成本如下:

产品名称

单位成本

产量

总成本

甲企业

乙企业

甲企业

乙企业

A

15

140

215

2100

3225

B

20

150

75

3000

1500

C

30

50

50

1500

1500

合计

340

340

6600

6225

比价那个企业的总平均成本高,并分析原因。

本题主要考加权算术平均数

甲企业的总平均成本为6600/340

乙企业的总平均成本为6225/340

甲企业高,原因在于B产品的单位成本高,且甲企业B产品的产量是乙企业的二倍,即甲企业B产品的产量的权重大于乙企业。

四、计算题(共16分)

1、下面茎叶图是随机抽取的17个员工完成任务的时间资料:

(1)求众数

72

(2)求中位数

72

(3)求平均数

2、已知从总体N=100中抽取容量n=16的样本,用EXCEL软件计算结果如下:

平均

9.38

标准误差

1.03

标准差

4.11

方差

16.92

最小值

2

最大值

16

求和

150

观察数

16

置信度(95.0%)

2.19

(1)计算总体均值的置信区间为95%的估计区间?

(9.38-2.19,9.38+2.19)

(2)计算总体总量的置信区间为95%的估计区间?

[(9.38-2.19)×100,(9.38+2.19)×100]

3、1995-2010年新疆总人口数据如下:

年份

年末总人口

年份

年末总人口

1995

1661.35

2003

1945.97

1996

1698.96

2004

1978.16

1997

1736.57

2005

2010.35

1998

1774.19

2006

2050

1999

1811.8

2007

2095.19

2000

1849.41

2008

2130.81

2001

1881.6

2009

2158.63

2002

1913.79

2010

2181.33

(1)已知平均增长量为34.67,根据平均增长量预测2011年末总人口?

(2)已知平均增长率为1.83%,根据平均增长率预测2011年总人口?

4、中共十八大报告中提出2020年“实现国内生产总值和城乡居民人均收入比2010年翻一番,”。

若平均增长速度不变,2010年的GDP为399759.5亿元,2011年的环比增长9.6%,2012年环比增长7.5%

(1)求2010-2020平均增长速度是多少?

平均增长速度=

(2)2013-2020各年的平均增长速度是多少?

5、看2011-2012年第一学期考试题。

6、对10名成年人的身高(单位:

cm)进行抽样调查,结果见

身高:

166

169

172

177

180

170

172

172

168

172

(1)根据资料计算集中趋势指标

(2)根据资料计算离散趋势指标

(3)根据资料计算频数和频率

7、从一个正态总体中随机抽取样本量为8的样本,各样本值见。

样本值

10

8

12

15

6

13

5

11

求总体均值95%的置信区间。

8、某地区1981-1987年粮食单位面积产量

年份

1981

1982

1983

1984

1985

1986

1987

单位面积产量

1451

1372

1168

1232

1245

1200

1260

(1)增长量与平均增长量

(2)发展速度与平均发展速度

(3)增长量与平均增长量

(4)时间序列的预测

五、结果分析题(共40分)

1、一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。

调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,

就将这一饮料的品牌名字记录一次。

记录的原始数据做的饼图如下:

根据上图进行统计分析,并做结论。

2、一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,

让他们分别用三种方法组装。

15个工人分别用三种方法在相同的时间内组装的产品数量(单位:

个)。

方法A

方法B

方法C

164

129

125

167

130

126

168

129

126

165

130

127

170

131

126

165

130

128

164

129

127

168

127

126

164

128

127

162

128

127

163

127

125

166

128

126

167

128

116

166

125

126

165

132

125

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?

试说明理由

3、说明下列散点图形变量X与Y间关系。

4、根据下面Excel输出的回归结果

回归统计

MultipleR(相关系数r)

0.842407

RSquare(判定系数

0.709650

AdjustedRSquare(调整后判定系数)

0.630463

标准误差

109.429596

观测值

15

方差分析

 

df

SS

MS

F

SignificanceF

回归

3(k)

321946.8018回归平方和SSR

107315.6006平均回归平方和MSR

8.961759

0.002724

残差

11(n-k-1)

131723.1982残差平方和SSE

11974.84平均残差平方和MSE

总计

14(n-1)

453670总离差平方和SST

 

 

 

 

Coefficients

标准误差

tStat

P-value

 

Intercept

657.0534

167.459539

3.923655

0.002378

XVariable1

5.710311

1.791836

3.186849

0.008655

XVariable2

-0.416917

0.322193

-1.293998

0.222174

XVariable3

-3.471481

1.442935

-2.405847

0.034870

 

上面表格内容关系:

判定系数=相关系数的平方

调整后的判定系数

SSR+SSE=SST

第三个表格中:

对计算结果进行回归分析

可以考试的题型

(1)写出回归模型

(2)解释回归模型系数

比如:

不变时,

每变动一个单位,因变量会平均变动5.710311个单位。

(3)X系数检验(a=0.05)

总共三个,用第一个变量作为例子

第一个自变量的T=3.186849,相应的P=0.008655<0.05,故第一个自变量系数通过检验,第一个自变量系数是显著的。

(4)有多少个样本

观测值+1=15+1=16

(5)预测第一个自变量为5,第二个自变量为10,第三个自变量为8的时候,因变量的值

(6)求判定系数,解释其含义

(数字带进去,如果给出数据,直接签写)

判定系数越高,说明方程回归的拟合优度越好,方程可以解释变差的百分之多少

(7)判断因变量和自变量之间相关关系和方向,

因变量和自变量之间是线性相关关系,方向根据自变量前面的符号判断是正相关还是负相关。

(8)计算自变量系数的标准误差

,数字带进去

(9)自变量对因变量变化的影响程度有多少?

就是自变量前面的系数

(10)回归模型的参数是用什么方法估计的得到的?

最小二乘估计法估计得到

(11)看书本上第十一章倒数第二页的残差图,以及异常值的判断

(12)相关系数的含义,比如-0.6和0.5的相关关系那个更大。

(13)将表格中的部分内容挖空,要求填写。

根据上面公式计算

(14)模型检验,(F检验)

F=8.961759,相对应的SignificanceF=0.002724<0.05,故方程通过显著性检验,回归模型是显著的。

5、时间序列结果分析

对上图进行统计分析,列出可以进行预测的方法

看图说话题

6、

(1)判定时间序列的类型

平稳时间序列(时间序列有平稳和非平稳时间序列,其中非平稳时间序列有趋势、季节和周期性时间序列,也有复合型时间序列)另外,时间序列的组成成分有趋势(T),周期或循环(C),季节(S)和不规则因素(I)组成。

(2)适合的预测方法有哪些

平稳时间序列的预测方法有平均数预测法,移动平均预测法和指数平滑预测法

非平稳时间序列的预测法有增长率预测,发展速度预测,增长量预测,模型预测等。

六、论述题(共9分)

1、统计学的认识(第一章第三页,结合领域自己写)、统计方法的应用、

2、分析两个变量间关系的统计分析方法有哪些?

第十一章的相关分析和回归分析

3、举例说明三种概率形式在社会、经济、生活中的应用

4、论述标准化系数的重要应用

判定离群点(考点)

5、统计实验

上面图、书本上数据筛选的第三个图和书本数据透视表的图的得到的步骤,功能,空缺处的地址。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1