spss实验过程.docx
《spss实验过程.docx》由会员分享,可在线阅读,更多相关《spss实验过程.docx(26页珍藏版)》请在冰豆网上搜索。
spss实验过程
spss实验过程
1、心理学家希望研究恋爱对于抑郁的治疗效果,找到100个尚未恋爱的大学生,对他们进行长期跟踪和测试,得到了长期的检测数据,在此期间,大约有80%的同学谈恋爱了。
请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。
统计方法:
配对样本T检验:
一般用于同一研究对象分别给予两种不同处理的效果比较,推断两种效果有无差别。
以及同一研究对象处理前后的效果比较,推断某种处理是否有效。
数据处理:
抑郁用百分制衡量,分数越高,抑郁程度越高。
选取在100名中谈恋爱的人员的抑郁分数,与他们之前未恋爱测试的抑郁分数进行配对t检验。
原假设:
H0:
未恋爱与恋爱后的抑郁分数无显著差异操作方法:
Analyze-CompareMeans-Paired-SamplesTTest
结论分析:
第一个表格是数据的基本描述。
成對樣本統計資料
平均數
N
標準偏差
標準錯誤平均值
對組1
恋爱前抑郁指数
75.94
100
10.225
1.022
恋爱后抑郁指数
71.44
100
10.839
1.084
第二个是恋爱前和恋爱后抑郁分数的相关系数,原假设:
恋爱前和恋爱后的抑郁指数没有相关。
Sig=0.000<0.05拒绝原假设,恋爱前后抑郁指数有变化,即恋爱对抑郁有治疗效果。
成對樣本相關性
N
相關
顯著性
對組1
恋爱前抑郁指数&恋爱后抑郁指数
100
.946
.000
第三个表格是配对样本的t检验,原假设:
未恋爱与恋爱后的抑郁分数均值差异为0,Sig=.000<0.05拒绝原假设,表明未恋爱和恋爱后的数据有显著的变化。
即通过恋爱对抑郁的治疗有显著效果。
成對樣本檢定
程對差異數
T
df
顯著性(雙尾)
平均數
標準偏差
標準錯誤平均值
95%差異數的信賴區間
下限
上限
對組1
恋爱前抑郁指数-恋爱后抑郁指数
4.500
3.518
.352
3.802
5.198
12.793
99
.000
2、已知全国的出生率为12.08%,死亡率为7.16%,有专家认为浙江省的人口自然增长率远低于全国平均水平;请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。
统计方法:
单样本T检验
问题分析:
全国的人口自然增长率为0.0492,选取浙江省60个地区的人口自然增长率,与0.0492作比较做单样本T检验
H0:
浙江省的人口自然增长率与全国平均水平无显著差异。
操作方法:
Analyze-CompareMeans-One-SampleTTest
结论分析:
第一个表格:
显示分别是样本数、平均值、标准差、均值标准误差。
單一樣本統計資料
N
平均數
標準偏差
標準錯誤平均值
自然增长率
60
2.224000%
4.0066086%
0.5172509%
第二个表格:
显示t统计的观测值、自由度、双侧概率p值、样本均值与检验值的差、总体均值与原假设差值的95%的置信区间。
單一樣本檢定
檢定值=0.0492
T
df
顯著性(雙尾)
平均差異
95%差異數的信賴區間
下限
上限
自然增长率
4.205
59
.000
2.1748000%
1.139783%
3.209817%
其中T检验的原假设为浙江省的人口自然增长率的均值与全国的平均人口自然增长率0.0492相等。
由于Sig=0.000<0.05所以拒绝原假设,即浙江省人口自然增长率的均值与全国的平均人口自然增长率存在差异,又因为浙江省人口自然增长率均值为0.02224<0.0492,所以浙江省人口自然增长率低于全国平均水平,即专家的观点是正确的。
3、为了研究厄尔尼诺气象是否会显著农作物的价格;请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。
统计方法:
相关分析
问题分析:
用ONI指数来代表厄尔尼诺气象,值越高,厄尔尼诺气象越强。
采用相关分析,分析厄尔尼诺气象是否会显著农作物的价格。
H0:
厄尔尼诺气象指数与农作物的价格的相关系数为0.
操作方法:
Analyze—Correlate—BivariateCorrelations
表一:
相關
ONI指数
农作物价格(元/公斤)
ONI指数
皮爾森(Pearson)相關
1
.374**
顯著性(雙尾)
.007
N
50
50
农作物价格(元/公斤)
皮爾森(Pearson)相關
.374**
1
顯著性(雙尾)
.007
N
50
50
**.相關性在0.01層上顯著(雙尾)。
可以看出ONI指数与农作物价格相关系数为0.374,原假设为ONI指数与农作物价格相关系数为0,sig值=0.007<0.05,拒绝原假设,(H0:
厄尔尼诺气象不会影响农作物价格。
)即相关。
证明厄尔尼诺气象会显著农作物的价格。
4、各地区电子商务竞争力的指标包括:
网络零售额、网络交易额、每百人网商数量、每百人网络消费者数量、网络零售额与社零占比等,由于指标过于复杂导致统计工作难以展开,请从中选出最具有代表性的核心指标。
统计方法:
因子分析
操作方法:
Analyze-DataReduction-Factor
H0:
各组数据构成单位矩阵。
输出分析
相關性矩陣
网络零售额指数
网络交易额指数
每百人网商数量指数
每百人网络消费者数量指数
网络零售额与社零占比指数
相關
网络零售额指数
1.000
.137
.015
.458
-.095
网络交易额指数
.137
1.000
.311
.290
-.390
每百人网商数量指数
.015
.311
1.000
.019
.013
每百人网络消费者数量指数
.458
.290
.019
1.000
-.350
网络零售额与社零占比指数
-.095
-.390
.013
-.350
1.000
顯著性(單尾)
网络零售额指数
.148
.455
.000
.235
网络交易额指数
.148
.008
.012
.001
每百人网商数量指数
.455
.008
.444
.459
每百人网络消费者数量指数
.000
.012
.444
.003
网络零售额与社零占比指数
.235
.001
.459
.003
相关性很不好,0.148、0.455、0.235均不显著
全变量的相关性矩阵
选择Descriptives(描述)选择Coefficients和KMOandBartlett’stestofsphericity(KMO与Bartlett的球形度检验,KMO值越接近1,越适合做因子分析(kmo>0.6))
KMO與Bartlett檢定
Kaiser-Meyer-Olkin測量取樣適當性。
.553
Bartlett的球形檢定
大約卡方
39.389
df
10
顯著性
.000
KMO值为0.553,小于0.6(数据不够好),Bartlett球型检验的相伴概率0.000,小于显著性水平0.05,拒绝原假设,达到显著的水平。
(检验结果是否做因子分子需要看kmo与p值两个因素)
选择Extraction勾选Screeplot(碎石图)和Eigenvaluesover1(特征值大于1)(做主成分分析,确定因子个数(特征值大于1))
說明的變異數總計
元件
起始特徵值
擷取平方和載入
循環平方和載入
總計
變異的%
累加%
總計
變異的%
累加%
總計
變異的%
累加%
1
1.906
38.128
38.128
1.906
38.128
38.128
1.710
34.207
34.207
2
1.172
23.433
61.562
1.172
23.433
61.562
1.368
27.354
61.562
3
.954
19.083
80.644
4
.506
10.117
90.761
5
.462
9.239
100.000
擷取方法:
主體元件分析。
可以直观的看到,前两个因子就可以有61.562%的含义。
由碎石图可以看出第1个因子后图像趋于平缓,即因子1能解释大部分。
选择Rotation勾选Varimax(最大方差法);选择scores勾选显示因子得分系数矩阵
Communalities
起始
擷取
网络零售额指数
1.000
.555
网络交易额指数
1.000
.716
每百人网商数量指数
1.000
.659
每百人网络消费者数量指数
1.000
.718
网络零售额与社零占比指数
1.000
.431
擷取方法:
主體元件分析。
表示1个因子变量1共解释掉原来的变量多少。
如第一行中0.555表示1个因子变量1共解释掉网络零售额方差的55.5%。
由于数据选取不是很恰当,失真较大。
元件矩陣a
元件
1
2
网络零售额指数
.568
-.482
网络交易额指数
.703
.471
每百人网商数量指数
.256
.770
每百人网络消费者数量指数
.771
-.352
网络零售额与社零占比指数
-.656
-.025
擷取方法:
主體元件分析。
a.擷取2個元件。
根据因子分析初始解计算出的变量共变度。
利用主成分分析方法得到5个特征值,他们是因子分析的初始解,可利用这5个初始解和对应的特征向量计算出因子载荷矩阵。
由于每个原始变量的所有方差都能被因子变量解释掉,因此每个原始变量的共同度都为1.第三列是根据因子分析最终解计算出的变量共变度。
根据最终提取的1个特征值和对应的特征向量计算出因子载荷矩阵。
因子分析后因子提取和因子旋转的结果。
5、公司的行政人员认为自己与市场部的人员和研发部的人员差异太大;公司总经理则认为行政人员的综合技能、教育背景与市场部人员和研发部人员也存在明显差异,行政人员如何通过统计方法证实自己的结论?
请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。
统计方法:
单因素方差分析
问题分析:
设定类别变量:
0=“行政人员”,1=“市场部人员”,2=“研发部人员”。
综合技能用以一百分考核,教育背景以1-7教育程度衡量,1=“从未上过小学”,2=“小学”,3=“初中”,4=“高中”,5=“专科”,6=“本科”,7=“研究生”。
以此构造数据,做One-WayANOVA。
操作:
Analyze-CompareMeans-One-WayANOVA
H0:
行政人员与市场部人员和研发部人员无显著差异。
选择LSD和Tamhane’sT2,再选择Option里的方差齐性检验。
表一:
方差齐性检验
變異數同質性測試
Levene統計資料
df1
df2
顯著性
学历背景
1.096
2
57
.341
综合技能指数
4.104
2
57
.022
从表看出:
方差齐性检验,原假设:
各部门的方差相等。
学历背景一行。
Sig值=0.341>0.05,即支持原假设,即各部门综合技能的方差相等,同理,看综合技能这行可知,各部门综合技能的方差不相等。
(数据选取问题)
表二:
方差分析
變異數分析
平方和
df
平均值平方
F
顯著性
学历背景
群組之間
4.009
2
2.004
1.252
.294
在群組內
91.241
57
1.601
總計
95.250
59
综合技能指数
群組之間
5.616
2
2.808
.829
.442
在群組內
192.968
57
3.385
總計
198.583
59
综合技能:
方差检验sig值=0.442>0.05(数据问题)
学历背景:
方差检验的sig值=0.294>0.05,接受原假设,(数据问题)
表三:
多重分析
多重比較
因變數
(I)类别
(J)类别
平均差異(I-J)
標準錯誤
顯著性
95%信賴區間
下限
上限
学历背景
LSD
0
1
.517
.345
.140
-.17
1.21
2
.000
.575
1.000
-1.15
1.15
1
0
-.517
.345
.140
-1.21
.17
2
-.517
.567
.366
-1.65
.62
2
0
.000
.575
1.000
-1.15
1.15
1
.517
.567
.366
-.62
1.65
Tamhane
0
1
.517
.347
.370
-.34
1.37
2
.000
.510
1.000
-1.52
1.52
1
0
-.517
.347
.370
-1.37
.34
2
-.517
.511
.712
-2.04
1.00
2
0
.000
.510
1.000
-1.52
1.52
1
.517
.511
.712
-1.00
2.04
综合技能指数
LSD
0
1
-.499
.502
.324
-1.50
.51
2
.380
.836
.651
-1.29
2.05
1
0
.499
.502
.324
-.51
1.50
2
.879
.825
.291
-.77
2.53
2
0
-.380
.836
.651
-2.05
1.29
1
-.879
.825
.291
-2.53
.77
Tamhane
0
1
-.499
.507
.699
-1.76
.76
2
.380
.944
.973
-2.49
3.25
1
0
.499
.507
.699
-.76
1.76
2
.879
.894
.740
-2.01
3.77
2
0
-.380
.944
.973
-3.25
2.49
1
-.879
.894
.740
-3.77
2.01
综合技能:
方差齐性看LSD法多重比较的结果,从结果可看出,行政人员和市场部人,研发部人员的综合技能不存在显著差异。
学历背景:
方差齐性看LSD法多重比较的结果,从结果可看出行政人员和市场部人员、研发部人员的教育背景不存在显著差异。
(数据问题)
6、有专家提出,黄色人种相对于白色人种,更不易被晒伤;请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。
问题分析:
用1=“黄色人种”,用2=“白色人种”,晒伤用按1-5的程度衡量,1=“没晒伤”,2=“有点晒伤但不严重”,3=“晒伤有点严重”,4=“晒伤严重”,5=“晒伤非常严重”。
以此构造数据,进行独立样本t检验。
操作步骤:
Analyze—CompareMeans—Independent-SamplesTTest
H0:
黄色人种和白色人种的晒伤难易无显著差异。
结论分析:
表一:
显示基本的数据,统计描述量。
群組統計資料
人种
N
平均數
標準偏差
標準錯誤平均值
晒伤程度
1
37
2.00
.782
.129
2
23
2.83
1.337
.279
标准误:
样本在多大程度上反映总体样本。
(数值越小越好,要求N越大越好)表中的数值都是比较好的。
獨立樣本檢定
Levene的變異數相等測試
針對平均值是否相等的t測試
F
顯著性
T
df
顯著性(雙尾)
平均差異
標準誤差
95%差異數的信賴區間
下限
上限
晒伤程度
採用相等變異數
14.180
.000
-3.026
58
.004
-.826
.273
-1.373
-.280
不採用相等變異數
-2.692
31.481
.011
-.826
.307
-1.452
-.201
表二:
先进行F检验,在进行总体均值T检验。
F检验原假设:
白色人种和黄色人种的晒伤程度方差是相等,F检验的Sig=0.000小于0.05,即拒绝原假设,方差不相等。
因而看第二行,T检验的原假设是黄色人种和白色人种的晒伤程度均值差为0,T检验的Sig=0.011<0.05,拒绝原假设,即不为0。
又因为,t值为负,95%的置信区间都小于0,在0的左侧,即黄色人种和和白色人种的晒伤程度均值差小于0,即黄色人种比白色人种不易晒伤。
7、请统计分析全国各个省市的进出口额,与各地区消费品零售总额、地区工业总产值的函数关系,请构造数据,设法论证各变量之间的函数关系。
统计方法:
回归分析
操作方法:
先做散点图,主观判断,选择Graphs—LegacyDialogs—Scatter/Dot—SimpleScatter,在做相关分析,看是否相关,在做回归分析,得出具体函数。
相关性分析:
线性回归:
方法选逐步。
Statistics:
分析结果解读:
程有效,自变量和因变量呈线性关系。
係數a
模型
非標準化係數
標準化係數
T
顯著性
B
標準錯誤
Beta
1
(常數)
4.011
.726
5.527
.000
消费品零售总额
1.587
.193
.764
8.212
.000
a.應變數\:
进出口额
上表为案例分析的回归系数的T检验结果。
该表列出了非标准化回归系数、标准化回归系数、回归系数的显著性检验t值和限制性水平。
可以看出,该模型的非标准化回归系数B的估计值1.587,标准错误为0.193;标准化回归系数为0.764,回归系数的显著性检验T统计量的值为8.212,对应的显著性水平P值为0.000,表明被解释变量和解释变量之间存在显著线性关系。
标准化回归系数贝塔取值范围为-1~1,它的绝对值越大,表示自变量对因变量的影响越大,其解释因变量的变异性也越大。
对回归方程的显著性检验和对回归系数的显著性检验都表明该案例的回归方程显著。
从表中可知,β0(常量)=4.011,β1=1.587,由一元线性回归方程y=β0+β1X可以得出本案例的回归方程为y=4.011+1.587x
即进出口额=4.011+1.587*消费品零售总额