人大统计学专业课考研历年初试题1998文档格式.docx

上传人:b****8 文档编号:22867079 上传时间:2023-02-05 格式:DOCX 页数:29 大小:312.90KB
下载 相关 举报
人大统计学专业课考研历年初试题1998文档格式.docx_第1页
第1页 / 共29页
人大统计学专业课考研历年初试题1998文档格式.docx_第2页
第2页 / 共29页
人大统计学专业课考研历年初试题1998文档格式.docx_第3页
第3页 / 共29页
人大统计学专业课考研历年初试题1998文档格式.docx_第4页
第4页 / 共29页
人大统计学专业课考研历年初试题1998文档格式.docx_第5页
第5页 / 共29页
点击查看更多>>
下载资源
资源描述

人大统计学专业课考研历年初试题1998文档格式.docx

《人大统计学专业课考研历年初试题1998文档格式.docx》由会员分享,可在线阅读,更多相关《人大统计学专业课考研历年初试题1998文档格式.docx(29页珍藏版)》请在冰豆网上搜索。

人大统计学专业课考研历年初试题1998文档格式.docx

是一个在区间[-π,π]上服从均匀分布的随机变量。

问{

}是否平稳?

说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。

待估计的参数为总体比例。

如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。

(假设各层总体单位数量

都充分大,忽略“有限总体校正系数”)

总体权重

预估的层内总体比例

1

0.5

2

0.3

0.7

3

0.2

0.6

五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。

六、若有线性回归模型

其中

,则

(1)该模型是否违背古典线性回归模型的假定?

请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?

请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。

第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;

第二组10对白鼠中每一对的两只关在同一个笼中喂养。

每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:

吃药后立即记录,吃药后一小时记录,吃药后两小时记录。

对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。

假定40只白鼠的初始活动状态相同。

请详细阐述你用何种方法分析安眠药的效果?

八、某大学从教师中抽取一个随机样本进行满意度调查。

1分表示非常不满意,100分表示非常满意。

数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则

(1)你会选择什么分析方法?

简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用该分析方法,数据必须满足哪些几本假定?

请加以说明。

职称

调查人数

满意度

教授

30

88

82

副教授

83

80

讲师

74

75

2008年人大统计学专业课初试题

一、(10分)07年香港一则报道说:

“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。

”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?

请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?

请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:

净含量是每袋不低于250g。

但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?

并说明理由;

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?

(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?

p值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?

五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用;

(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。

(1)以大坝为例,概略说明需考虑的主要因素;

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。

(画出框图,并尽量避免过多使用文字)

2007年人大统计学专业课初试题

一、(20分)下面是一种零件误差的数据(单位:

克):

6.14.76.56.27.7

6.45.57.16.15.3

5.76.15.34.04.8

3.23.91.94.93.8

5.32.65.35.55.8

2.76.87.45.63.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。

请问,若使该置信区间有意义,需要对总体进行何等假定?

这种假定能不能用数据证明?

是不是该区间以0.95的概率覆盖真实总体均值?

如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:

零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。

如果进行t检验,需要假定哪些条件?

t检验结果为p值等于0.0807。

能不能说“在显著性水平为0.05时,接受零假设”?

你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。

请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?

随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?

如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。

但一家研究机构则认为自驾车上班的人数比例达不到这一水平。

为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。

对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?

一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。

请问,这样做是否有道理?

什么样的数据不适宜于主成分分析?

选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βpxp+ε中的ε一定是随机误差吗?

如果回答是否定的,讨论在何种情况下,答案是肯定的?

此外,最小二乘回归是不是需要对误差项作出假定?

如果不是,那么在什么情况下需要对误差项作出假定?

作什么假定?

七、(25分)对于聚类分析,请回答以下问题:

(1)分层聚类前,需要对什么进行选择?

(2)描述分层聚类分析的详细步骤;

(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βpxp+ε,如果一个SPSS回归分析的结果如下表所示:

ANOVA

Model

SumofSquares

df

MeanSquare

F

Sig.

Regression

Residual

Total

106831048750.124

31085446686.216

137916495436.340

1

472

473

65858997.217

1622.118

.000a

111136313278.118

26780182158.221

2

471

55568156639.059

56858136.217

997.312

.000b

a.Predictors:

(Constant),BeginningSalary

b.Predictors:

(Constant),BeginningSalary,EmploymentCategory

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?

意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大统计专业课初试题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:

一种是所有顾客都进入一个等待队列;

另一种是顾客在三个业务窗口处列队三排等待。

为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:

分钟)如下:

5.56.66.76.87.17.37.47.87.8

(1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?

试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。

现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:

克)如下:

每包重量/g

包数

96-98

98-100

100-102

102-104

104-106

3

34

7

4

合计

50

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。

为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。

根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源

SS

MS

P-value

Fcrit

误差

总计

1.55

3.48

0.14

5.17

8

14

0.39

1.74

0.02

21.72

97.68

0.000236

0.000002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?

(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型

X=AF+ε

的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:

单位:

元/人

2003年

2004年

人均国内生产总值

城镇居民人均可支配收入

农村居民人均纯收入

9111

8472

2622

10561

9422

2936

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;

(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:

(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

工业总产值(亿元)

工业增加值(亿元)

企业单位数(个)

资产总计(亿元)

流动资产年平均余额(亿元)

固定资产净值年平均余额(亿元)

负债合计(亿元)

产品销售收入(亿元)

产品销售成本(亿元)

产品销售税金及附加(亿元)

利润总额(亿元)

本年应缴增值税(亿元)

全部从业人员年平均人数(万人)

142271

41990

196222

168808

71488

66008

73414

143172

118638

2049

8337

5488

5749

187221

54805

219463

195262

86885

73849

115529

187815

157071

2467

11342

6396

6099

2005年人大统计专业课初试题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:

1519222430

1619222431

1720232534

1820232738

1921232941

(1)画出该组数据的茎叶图;

(2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:

μ1,μ2,μ3。

要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:

μ1=μ2,H0:

μ1=μ3,H0:

μ2=μ3,,然后分别进行检验,而是采用方差分析的方法?

三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:

吨),经过初步计算得到样本数据的部分描述统计量如下:

平均107

标准误差4.99

样本标准差29.96

样本方差897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?

请说明原因;

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?

请谈谈拒绝和不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?

请简要解释这一定理。

四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。

为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

方差分析

SignificanceF

回归

70090029.08

23363343.03

48.62

0.00

残差

11

5285944.25

480540.39

14

75375973.33

Coefficient

标准误差

tStat

Intercept

207.9037

617.0486

0.3369

0.7425

XVariable1

1.4378

0.5645

2.5472

0.0271

XVariable2

0.8545

0.2663

3.2091

0.0083

XVariable3

0.0626

0.0656

0.9538

0.3607

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著;

(3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义;

(5)计算估计标准误差sy,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

编号

123456789

9.31.81.91.71.51.31.42.01.9

(1)绘出散点图;

(2)如果根据

的数值将总体分成两个子总体,最好的分发是什么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出

的总体均值

和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:

“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。

A地区有11%的人年收入900元,9%的人年收入200元;

B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;

(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;

(4分)

(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?

如果不能,应当如何改进?

(3分)

九、(15分)下面是某国某核算年度的国际收支平衡表(单位:

亿元):

一、经常账户

差额

A、货物与服务

B、收益

C、经常转移

二、资本与金融账户

A、资本账户

B、金融账户

三、储备资产

四、误差与遗漏

205

230

()

-65

-40

-125

-10

(1)在表中括号内填上适当的数字;

(2)请解释储备资产所对应的-125亿元的含义;

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系;

(6分)

(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?

2004年人大统计专业课初试题

本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

55766685756279739376

67857461787192796583

73577770907563817396

B班:

34715690664881589671

55856244795795685484

613973579468518261100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;

(2)两个班考试成绩的描述统计量如下,试进行比较分析:

A班

B班

平均75

中位数75

众数73

标准偏差10.44

样本方差108.90

峰值-0.35

偏斜度0.11

极差41

最小值55

最大值96

平均68

中位数67

众数57

标准偏差17.64

样本方差311.10

峰值-0.76

极差66

最小值34

最大值100

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。

通过Excel进行方差分析得到下面的部分结果:

方差分析表

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 少儿英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1