数据分析spss作业.docx

上传人:b****2 文档编号:1608957 上传时间:2022-10-23 格式:DOCX 页数:24 大小:709.76KB
下载 相关 举报
数据分析spss作业.docx_第1页
第1页 / 共24页
数据分析spss作业.docx_第2页
第2页 / 共24页
数据分析spss作业.docx_第3页
第3页 / 共24页
数据分析spss作业.docx_第4页
第4页 / 共24页
数据分析spss作业.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

数据分析spss作业.docx

《数据分析spss作业.docx》由会员分享,可在线阅读,更多相关《数据分析spss作业.docx(24页珍藏版)》请在冰豆网上搜索。

数据分析spss作业.docx

数据分析spss作业

数据分析方法及软件应用

(作业)

题目:

4、8、13、16题

指导教师:

学院:

交通运输学院

姓名:

学号:

4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。

在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。

试在a=0.05显著性水平下分析

(1)给出SPSS数据集的格式(列举前3个样本即可);

(2)分析浓度对收率有无显著影响;

(3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。

解答:

(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。

ilk^

1

1

1

13

2

1

1

10

3

1

2

12

4

1

2

11

5

1

3

13

&

1

3

9

7

1

4

10

8

1

4

12

9

2

1

9

10

2

1

7

2

2

10

12

2

2

9

13

2

3

8

14

2

3

11

峯称

类型

宽度

小数

1

法度

数值

8

0

8I

2

温度

数值

S

0

8

3

收率

数值

8

0

8

(2)思路:

本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。

假设:

浓度对收率无显著影响。

步骤:

【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,确定。

输出:

變異數分析

收率

平方和

df

平均值平方

F

顯著性

群組之間

39.083

2

19.542

5.074

.016

在群組內

80.875

21

3.851

總計

119.958

23

显著性水平a为0.05,由于概率p值小于显著性水平a,则应拒绝原假设,认为浓度对收率有显著影响。

(3)思路:

本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。

假设,Hoi:

浓度对收率无显著影响;H02:

温度对收率无显著影响;H03:

浓度与温度的交互作用对收率无显著影响。

步骤:

【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。

输出:

主旨間效果檢定

因變數:

收率

來源

第III類平方

df

平均值平方

F

顯著性

修正的模型

70.458a

11

6.405

1.553

.230

截距

2667.042

1

2667.042

646.556

.000

浓度

39.083

2

19.542

4.737

.030

温度

13.792

3

4.597

1.114

.382

浓度*温度

17.583

6

2.931

.710

.648

錯誤

49.500

12

4.125

總計

2787.000

24

校正後總數

119.958

23

a.R平方=.587(調整的R平方=.209)

第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率p值。

可以看到观测变量收率的总变差为119.958,由浓度

不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。

浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。

浓度:

显著性<0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:

显著性〉0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度:

显著性〉0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。

8、以高校科研研究数据为例:

以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6获奖数X8;建立多元线性回归模型,分析它们之间的关系。

解释变量采用逐步筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。

解答:

思路:

根据要求采用逐步筛选的解释变量筛选策略,利用回归分析方法建立多元线性回归模型,分析它们之间的关系,并且要求做多重共线性、方差齐性和残差的自相关性检验。

(1)步骤:

【分析-回归-线性】,X5选入因变量,X2、X4X6、X8选入自变量,方法选择【逐步】。

【统计量】勾选【估计】、【模型拟合度】、【共线性诊断】与【Durbin-Waston(U)】。

【绘制(T)按钮】,将*ZRESlD添加到Y(Y)框中,将*ZPRED添加到X2(X)框中,勾选【正态概率图】,【保存(S)】按钮。

在预测值与残差中勾选【标准化】选项。

选择菜单【分析一相关一双变量】将标准化预测值和标准化残差选入【变量】框,在相关系数中选择Spearman各项完成后点击【确定】。

输出:

變數已輸入/已移除

模型

變數已輸入

變數已移除

方法

1

投入人年数

逐步(準則:

F-to-enter的機率<=.050,F-to-remove的機率>=.100】。

a.應變數:

课题总数

模型摘要

模型

R

R平方

調整後R平方

標準偏斜度錯誤

Durbin-Watson

1

.959a

.919

.917

241.9582

1.747

a.預測值:

(常數),投入人年数

b.應變數:

课题总数

表中变量为投入人年数,参考调整的判定系数,由于调整的判定系数(0.917)较接近于1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,未能被解释的部分较少。

方程DV检验值为1.747,残差存在一定的正自相关。

變異數分析

模型

平方和

df

平均值平方

F

顯著性

1

迴歸

19379040.047

1

19379040.047

331.018

.000b

殘差

1697769.953

29

58543.791

總計1

21076810.000I

301III

a.應變數:

课题总数

b.預測值:

(常數),

投入人年数

被解释变量的总离差平方和为21076810.00,回归平方和及均方分别为

19379040.047和19379040.047,剩余平方和及均方分别为1697769.953和58543.791,检验统计量的观测值为331.018,对应的概率值近似为0。

依据该表可进行回归方程的显著性检验。

如果显著性水平为0.05,由于概率值小于

显著性水平,应拒绝回归方程显著性检验的零假设,认为回归系数不为0,被解释变量与解释变量的线性关系是显著的,可建立线性模型。

係數

模型

非標準化係數

標準化係數

T

顯著性

共線性統計資料

B

標準錯誤

Beta

允差

VIF

1(常數)

-94.524

72.442

-1.305

.202

投入人年数

.492

.027

.959

18.194

.000

1.000

1.000

a.應變數\:

课题总数

依据该表可以进行回归系数显著性检验,写出回归方程和检测多重共线性。

可以看到,如果显著性水平为0.05,投入人年数变量的回归系数显著性t检验的概率p值小于显著性水平,因此拒绝零假设,认为其偏回归系数与0有显著差异,与被解释变量与解释变量的线性关系是显著的,应保留在方程中。

同时从容忍度和方差膨胀因子看,解释变量与投入人年数多重共线性很弱,可以建立模型。

最终回归方程为,课题总数=-94.524+0.492投入人年数。

排除的變數

模型

Beta入

T

顯著性

偏相關

共線性統計資料

允差

VIF

允差下

1投入科研事业费(百元)

.152b

1.528

.138

.278

.267

3.748

.267

专著数

.023b

.182

.857

.034

.188

5.308

.188

获奖数

.030b

.411

.684

.077

.542

1.846

.542

a.應變數:

课题总数

b.模型中的預測值:

(常數),投入人年数

该表展示回归方程的剔除变量,可以看到,如果显著性水平为0.05,表中

三个变量的回归系数显著性t检验的概率p值大于显著性水平,因此不拒绝零假设,认为其偏回归系数与0无显著差异,与被解释变量与解释变量的线性关系是不显著的,不应保留在方程中。

同时从容忍度和方差膨胀因子看,解释变量与三个解释变量多重共线性严重,在建立模型的时候应当被剔除。

共線性診斷

|模型維度

特徵值

條件指數

變異數比例

(常數)

投入人年数

1

1

1.800

1.000

.10

.10

2

.200

3.001

.90

.90

a.應變數:

课题总数

依据该表可进行多重共线性检测,从方差比例上看第二个变量可解释常量的90%,也可解释投入人年数的90%,一次认为这些变量存在多重共线性。

条件指数都小于10,说明存在共线性较弱,低个变量特征值小于0.7,说明线性相关关系较弱。

殘差統計資料

最小值

最大值

平均數

標準偏差

N

預測值

-57.642

3246.986

960.000

803.7213

31

殘差

-466.2850

509.6787

.0000

237.8914

31

標準預測值

-1.266

2.845

.000

1.000

31

標準殘差

-1.927

2.106

.000

.983

31

a.應變數:

课题总数

嵐歸糅那化城於怕我烏F-F四

数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果表

明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。

随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。

但计算残差与预测值的Spearman等级

相关系数为-0.176,且检验并不显著,因此认为异方差现象并不明显。

相關

Standardized

Predicted

Value

Standardized

Residual

Spearman的rho

StandardizedPredicted

相關係數

1.000

-.176

Value

顯著性(雙尾)

.344

N

31

31

StandardizedResidual

相關係數

-.176

1.000

顯著性(雙尾)

.344

N

31

31

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 计算机软件及应用

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1