统计分析与SPSS课后习题课后习题汇总.docx

上传人:b****6 文档编号:9007363 上传时间:2023-02-02 格式:DOCX 页数:41 大小:32.84KB
下载 相关 举报
统计分析与SPSS课后习题课后习题汇总.docx_第1页
第1页 / 共41页
统计分析与SPSS课后习题课后习题汇总.docx_第2页
第2页 / 共41页
统计分析与SPSS课后习题课后习题汇总.docx_第3页
第3页 / 共41页
统计分析与SPSS课后习题课后习题汇总.docx_第4页
第4页 / 共41页
统计分析与SPSS课后习题课后习题汇总.docx_第5页
第5页 / 共41页
点击查看更多>>
下载资源
资源描述

统计分析与SPSS课后习题课后习题汇总.docx

《统计分析与SPSS课后习题课后习题汇总.docx》由会员分享,可在线阅读,更多相关《统计分析与SPSS课后习题课后习题汇总.docx(41页珍藏版)》请在冰豆网上搜索。

统计分析与SPSS课后习题课后习题汇总.docx

统计分析与SPSS课后习题课后习题汇总

 

《统计剖析与SPSS的应用(第五版)》课后练习答案

 

第一章练习题答案

1、SPSS的中文全名是:

社会科学统计软件包(后更名为:

统计产品与服务解决方案)

英文全名是:

StatisticalPackagefortheSocialScience.(Statistical

ProductandServiceSolutions)

2、SPSS的两个主要窗口是数据编写器窗口和结果查察器窗口。

数据编写器窗口的主要功能是定义SPSS数据的结构、录入编写和管理待剖析的数据;

结果查察器窗口的主要功能是现实管理SPSS统计剖析结果、报表及图形。

3、SPSS的数据集:

SPSS运转时可同时翻开多个数据编写器窗口。

每个数据编写器窗口分别显示不一样的数据会合(简称数据集)。

活动数据集:

此中只有一个数据集为目前数据集。

SPSS只对某时辰的目前数据集中的数据进行剖析。

4、SPSS的三种基本运转方式:

完好窗口菜单方式、程序运转方式、混淆运转方式。

完好窗口菜单方式:

是指在使用SPSS的过程中,所有的剖析操作都经过菜单、按

钮、输入对话框等方式来达成,是一种最常有和最广泛的使用方式,最大长处是简短和直观。

程序运转方式:

是指在使用SPSS的过程中,统计剖析人员依据自己的需要,手工编写SPSS命令程序,而后将编写好的程序一次性提交给计算机履行。

该方式合用于大规模的统计剖析工作。

混淆运转方式:

是前二者的综合。

5、.sav是数据编写器窗口中的SPSS数据文件的扩展名

.spv是结果查察器窗口中的SPSS剖析结果文件的扩展名

.sps是语法窗口中的SPSS程序

6、SPSS的数据加工和管理功能主要集中在编写、数据等菜单中;统计剖析和画图功能主

要集中在剖析、图形等菜单中。

7、概率抽样(probabilitysampling):

也称随机抽样,是指按必定的概率以随机原则抽取

样本,抽取样本时每个单位都有必定的时机被抽中,每个单位被抽中的概率是已知的,或是

能够计算出来的。

概率抽样包含简单随机抽样、系统抽样(等距抽样)、分层抽样(种类抽

样)、整群抽样、多阶段抽样等。

简单随机抽样(simplerandomsampling):

从包含整体N个单位的抽样框中随机地

抽取n个单位作为样本,每个单位抽入样本的概率是相等的。

是最基本的抽样方法,

是其余抽样方法的基础。

长处:

简单、直观,在抽样框完好时,可直接从中抽取样

本,用样本统计量对整体参数进行预计比较方便。

限制性:

当N很大时,不易结构

抽样框,抽出的单位很分别,给实行检查增添了困难。

分层抽样(stratifiedsampling):

将抽样单位按某种特点或某种规则区分为不一样

的层,而后从不一样的层中独立、随机地抽取样本。

长处:

保证样本的结构与整体的

结构比较邻近,进而提升预计的精度,组织实行检查方便(当层是以行业或行政区

区分时),既能够对整体参数进行预计,也能够对各层的参数进行预计。

整群抽样(clustersampling):

将整体中若干个单位归并为组(群),抽样时直接抽

取群,而后对选中群中的所有单位所有实行检查。

长处:

抽样时只要群的抽样框,

可简化工作量;检查的地址相对集中,节俭检查花费,方便检查的实行。

弊端:

 

的精度差。

系抽(systematicsampling)

将体中的所有位

(抽位)按必定序排

列,在定的范内随机地抽取一个位作初始位,

而后按预先定好的

确立其余本位,先从数字1

到k之随机抽取一个数字

r作初始位,此后

挨次取r+k,r+2k⋯等位。

点:

操作便,可提升估的精度。

弊端:

量方差的估困。

多段抽(multi-stagesampling)

先抽取群,但其实不是群内的所有位,

而是再行一步抽,从中的群中抽拿出若干个位行。

群是初抽

位,第二段抽取的是最抽位。

将方法推行,使抽的段数增加,

就称

多段抽。

点:

拥有整群抽的点,保真相集中,用。

大模的抽中,常被采纳的方法。

非概率抽是指抽取本不是依照随机原,

而是依据研究目的数据的要求,

采纳

某种方式从体中抽出部分位其施,包含方便抽、自发抽、

配抽、判断

抽和雪球抽等。

方便抽:

本限于体中易于抽到的一部分。

最常的方便抽是偶遇抽,

研究者将在某一和境中所碰到的每一体位均作本成。

“街人

法”就是一种偶遇抽。

方便抽是非随机抽中最的方法,

省省,但

本代表性因受有时要素的影响太大而得不到保。

自发抽:

某些被者来是不快乐的、

麻的,方便起就采纳

以自发被者本的方法。

判断抽:

研究人从体中那些被判断最能代表体的位作本的抽

方法。

当研究者自己的研究域十分熟习,

研究体比认识采纳种抽

方法,可代表性高的本。

种抽方法多用于体小而内部差别大的状况,

以及在体界没法确立或因研究者的与人力、物力有限采纳。

雪球抽:

以若干个拥有所需特点的人最先的象,

而后依赖他供给

的合格的象,再由些人供给第三批象,

⋯⋯挨次推,本好像

雪球般由小大。

雪球抽多用于体位的信息不足或察性研究的状况。

种抽中有些分子最后仍没法找到,

有些分子被供给者漏而不提,

二者都可能造

成差。

配抽也称定抽,是将体依某种准分(群)

;而后依照各本数与

体数成比率的原主抽取本。

配抽与分概率抽很靠近,

最大的

不一样是分概率抽的各本是随机抽取的,而配抽的各本是非随机

的。

体也可依照多种准的合分

(群),比如,在研究自,考到婚

姻与性都可能自有影响,

可将研究象分未婚男性、

已婚男性、未婚女性

和已婚女性四个,而后从各群非随机地抽。

配抽是往常使用的非概率抽

方法,本除所外没法保代表性。

8、利用SPSS行数据剖析的一般步:

数据的准--数据的加工理--数据的剖析--剖析果的和解。

 

第二章答案

1、SPSS中两个基本的数据方式:

原始数据的方式和数数据的方式。

原始数据的方式:

待剖析的数据是一些原始的卷数据,或是一些基本的指。

 

数数据的方式:

所收集的数据不是原始的卷数据,而是分

 

后的数据。

2、个案:

在原始数据的组织方式中,数据编写器窗口中的一行称为一个个案或观察。

变量:

数据编写器窗口中的一列。

3、默认的变量名:

VAR------;默认的变量种类:

数值型。

变量名标签和变量值标签可加强统计剖析结果的可读性。

4、数据文件以下图:

 

5、缺失值分为用户缺失值(UserMissingValue)和系统缺失值(SystemMissing

Value)。

用户缺失值指在问卷检查中,将无回答的一些数据以及显然失真的数据看作缺失值

来办理。

用户缺失值的编码一般用研究者自己能够识其余数字来表示,如“0”、“9”、“99”

等。

系统缺失值主要指计算机默认的缺失方式,假如在输入数据时空缺了某些数据或输入了

非法的字符,计算机就把其界定为缺失值,这时的数据标志为一个圆点“?

”。

在变量视图中

定义。

6、变量种类包含:

数值型(身高)、定序型(受教育程度)以及定种类(性别)。

在变量视图中定义。

7~9题软件操作,答案略

 

第三章练习题答案

1~8题软件操作,答案略

9、SPSS排序功能仅实现将观察按用户指定次序从头摆列;拆分功能在按次摆列的基础上,能够实现对数据按排序变量进行分组,并分组进行后续的统计剖析。

 

第四章练习题答案

1、

Statistics

户口所在

职业

年纪

Valid

282

282

282

N

0

0

0

Missing

 

户口所在地

FrequencyPercent

Valid

Cumulative

Percent

Percent

中心城市

200

Valid边郊外区

82

Total

282

 

职业

FrequencyPercent

Valid

Cumulative

Percent

Percent

国家机关

24

商业服务业

54

文教卫生

18

公交建筑业

15

经营性企业

18

学校

15

一般田户

35

种粮棉专业

4

Valid户

种果菜专业

10

工商运专业

34

退伍人员

17

金融机构

35

现役军人

3

Total

282

 

年纪

FrequencyPercent

Valid

Cumulative

Percent

Percent

20岁以下

4

20~35岁

146

Valid35~50岁

91

50岁以上

41

Total

282

 

剖析:

本次检查的有效样本为282份。

常住地的散布状况是:

在中心城市的人最多,有

200人,而在边郊外区只有82人;职业的散布状况是:

在商业服务业的人最多,其次是一

般田户和金融机构;年纪方面:

在35-50岁的人最多。

因为变量中无缺失数据,所以频数散布表中的百分比同样。

 

2、

 

剖析:

由表中能够看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。

与标准正态散布曲线进行对照,由峰度系数能够看出,此表的存款金

额的数据散布比标准正态散布更峻峭;由偏度系数能够看出,此表的存款金额的数据为右偏散布,表示此表的存款金额均值对均匀水平的测度偏大。

 

剖析:

由表中能够看出,中心城市有200人,边郊外区为82人。

两部分样本存取款金额均

呈右偏尖峰散布,且边郊外区更显然。

 

3、利用描绘菜单下窗口对话框中的“将标准得分另存为变量”功能实现。

对标准分数变量

按降序摆列,绝对值大于3的可视为“独出心裁”的样本。

原因:

标准化值反应的是样本值与样本均值的差是几个标准差单位。

假如标准化值等于

0,则表示该样本值等于样本均值;假如标准化值大于0,则表示该样本值大于样本均值;

假如标准化值小于0,则表示该样本值小于样本均值。

假如标准化值的绝对值大于3,则可

以为是异样值。

 

4、利用列联剖析实现。

第一编制列联表,而后进行卡方查验。

以户口和收入的列联剖析为例:

 

表中,卡方统计量的观察值等于,

 

概率-P

 

值等于。

若明显性水平设为,因为<,拒绝原假定,

 

表示户口地与收入水平不独立。

 

5、多项选择项分类法;

 

存款的最主要目的是正常生活零用

 

6、计算结果:

 

卡方统计量:

2

r

c

(fijo

fije)2

,用于测度各个单元格的观察频数与希望频数的差别,

fije

i1

j

1

并依卡方理论散布判断差别能否统计明显。

因为希望频数代表的是队列变量独立下的散布,所以卡方值越大表示实质散布与希望散布差别越显然。

本例中,因为概率P值小于明显性水平,应拒绝原假定,婆媳关系与住宅条件有关系。

 

7、将计数数据复原为原始数据,采纳交错分组下的频数剖析,并进行卡方查验。

 

表中,卡方统计量观察值为,对应的概率P-值为,小于明显性水平,应拒绝原假定,说明减肥成效其实不一致。

 

8、多项选择项二分法;

 

102(794份)、101(514份)、401(400份)

 

赚钱比率:

%,赔钱比率38%

 

主要依照:

基本要素法;

 

最少依照:

更跟方法

 

采纳列联剖析。

卡方查验结果表示:

专职和业余投资者在投资结果上存在明显差别。

 

9、

(1)变量:

汽车价钱、居住地域;种类:

定序型变量、定种类变量

(2)上述是计数数据的组织方式,应第一组织到SPSS的数据编写器窗口中,再利用交错分组下的频数剖析方法。

 

列联剖析。

原假定:

不一样居住区的私人车主接受的汽车价钱拥有一致性的。

上表可知,

假如明显性水平为,因为卡方查验的概率P-值小于明显性水平,所以应拒绝原假定。

 

第五章练习题答案

1、采纳单样本T查验(原假定

 

H0:

u=u0=75,

 

整体均值与查验值之间不存在明显差别)

 

 

N

 

One-SampleStatistics

MeanStd.

Deviation

 

Std.Error

Mean

VAR00001

11

 

t

 

df

 

One-SampleTest

TestValue=75

Sig.Mean

(2-tailed)Difference

 

95%ConfidenceIntervalof

theDifference

LowerUpper

VAR00001

10

.668

 

剖析:

N=11人的均匀值(mean)为,标准差()为,均值标准偏差(stderrormean)为。

t

统计量的观察值为,t统计量观察值的双尾概率P-值(sig.(2-tailed))为;六七列是整体

均值与原假定值差的95%的置信区间:

采纳双尾查验比较a和p。

T统计量观察值的双尾

概率p-值(sig.(2-tailed))为>a=所以不可以拒绝原设;且整体均值的95%的置信区间为,,

查验值75包含在置信区间内,所以经理的话是可信的。

 

2、

 

每周上网时间的样本均匀值为,标准差为,整体均值

95%的置信区间为、利用两独立样本的

T查验实现,实质为两个整体比率差的查验。

第一将计数数据经过加权功能复原为原始数据,

而后,采纳两独立样本

T查验实现。

查验变量为行为,分组变量为方式。

GroupStatistics

方式

N

Mean

Std.

Std.Error

Deviation

Mean

方式一

200

.4600

.49965

.03533

a2

183

.8798

.32611

.02411

方式二

 

剖析:

从上表能够看出票丢仍买的人数比率为46%,钱丢仍买的人数比率为88%,两种方式的样

本比率有较大差距。

1.两整体方差能否相等F查验:

F的统计量的察看值为,对应的

P值为,;假如明显性水平为,因为概率P值小于,两种方式的方差有明显差别。

看假定方差不相等行的结果。

2.两整体均值(比率)差的查验:

.T统计量的观察值为,对应

的双尾概率为,T统计量对应的概率P值<,故颠覆原假定,表示两整体比率有明显差别.更倾

向心理学家的说法。

 

4、本题是单个整体的比率查验问题。

第一将数据组织成计数方式,并以数目为加权变量还

原为原始数据。

而后,采纳独立样本的T查验实现。

查验变量为能否开兰花,查验值为。

 

剖析:

由表知:

样本中200棵开兰花的比率为71%。

假如整体比率的原假定为,因为T统计量的概率P值大于明显性水平(),不可以拒绝原假定,不可以说与遗传模型不一致。

 

5、方式一:

采纳两配对样本t查验

 

PairedSamplesStatistics

Mean

N

Std.

Std.Error

Deviation

Mean

饲料1

9

Pair1

9

饲料2

 

PairedSamplesCorrelations

N

Correlatio

Sig.

n

饲料1&饲料

9

.571

.108

Pair1

2

 

PairedSamplesTest

PairedDifferences

t

df

Sig.

Mean

Std.

Std.

95%Confidence

(2-taile

d)

Deviatio

Error

Intervalofthe

n

Mean

Difference

Lower

Upper

Pair饲料1-

8

.306

1饲料2

由上表可知,t统计量观察值为,概率P-值为,大于明显性水平,不该拒绝原假定,不

能以为不一样饲料使幼鼠体内钙的保存量出现了明显不一样。

 

方式二:

采纳两独立样本t查验

 

由上边的表可知,两组残留的样本均匀值差别不大。

由下表可知,该查验的F统计量的观察值为,对应的概率P-值为。

假如明显性水平为,则能够以为两整体的方差无明显差别。

两整体均值的查验应看第一行。

T统计量的观察值为,P-值为,。

假如明显性水平为,则不该拒绝原假定,不可以以为两饲料残留有明显差别。

 

6、两独立样本T查验

 

剖析:

1.两整体方差能否相等用F查验:

F的统计量的察看值为,对应的P值为,;假如明显性

水平为,因为概率P值大于,两种方式的方差无明显差别.看假定方差相等行。

2.两整体均值的查验:

T统计量的观察值为,对应的双尾概率为,T统计量对应的P值>

明显水平,故不可以拒绝原假定,不可以以为女生男生的课程均匀分有明显差别。

 

7、利用配对样本T查验,逐对查验

 

8、

 

由第一个表知,培训前和培训后样本的均匀值(mean)有必定差别,培训后均匀值较大;表二表示,在明显性水平为时,培训前后的销售量有必定的线性关系;由表三知,t查验统计量的观察值为,对应的双尾概率p-值为,小于明显水平a=,应拒绝原假定,培训前后的销售均匀值存在明显差别。

 

第六章练习题答案

1、

(1)

ANOVA

VAR00002

Sumof

df

MeanSquare

F

Sig.

Squares

BetweenGroups

4

.000

WithinGroups

30

Total

34

 

概率P-值靠近于0,应拒绝原假定,以为5种销售方法有明显差别。

 

(2)均值图:

 

MultipleComparisons

DependentVariable:

VAR00002

LSD

(I)VAR00001(J)VAR00001

Mean

Std.

Sig.

95%ConfidenceInterval

Difference

Error

LowerBoundUpperBound

(I-J)

2

3

1

4

5

1

3

2

4

5

1

2

3

4

5

1

2

4

3

5

1

2

5

3

4

*.Themeandifferenceissignificantatthe

*

.048

.7286

.653

.066

*

.000

*

.048

.027

*

.018

.755

*

.000

*

.042

.653

*

.018

.157

*

.000

.066

.216

*

.000

.157

.945

*

.000

*

.000

*

.042

.127

*

.000

*

.000

level.

 

可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有明显差别。

 

2、;;

 

3、

因F查验的概率P值小于明显性水平(),拒绝原假定,方差不齐,不知足方差剖析的前提假定。

;;67;

各组均值存在明显差别。

更适合第三组

 

4、

Between-SubjectsFactors

ValueLabel

N

地域一

9

地域

地域二

9

地域三

9

周一至周三

9

日期

周四至周五

9

周末

9

 

TestsofBetween-SubjectsEffects

Dependent

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 英语考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1