统计分析教学文稿.docx

上传人:b****7 文档编号:11084658 上传时间:2023-02-24 格式:DOCX 页数:23 大小:990.38KB
下载 相关 举报
统计分析教学文稿.docx_第1页
第1页 / 共23页
统计分析教学文稿.docx_第2页
第2页 / 共23页
统计分析教学文稿.docx_第3页
第3页 / 共23页
统计分析教学文稿.docx_第4页
第4页 / 共23页
统计分析教学文稿.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

统计分析教学文稿.docx

《统计分析教学文稿.docx》由会员分享,可在线阅读,更多相关《统计分析教学文稿.docx(23页珍藏版)》请在冰豆网上搜索。

统计分析教学文稿.docx

统计分析教学文稿

多因素方差分析

研究不同温度与不同湿度对粘虫发育历期的影响的试验数据如表1-1。

分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。

表1-1不同温度与不同湿度对粘虫发育历期的影响

相对湿度(%)

温度℃

重复

1

2

3

4

100

25

91.2

95.0

93.8

93.0

27

87.6

84.7

81.2

82.4

29

79.2

67.0

75.7

70.6

31

65.2

63.3

63.6

63.3

80

25

93.2

89.3

95.1

95.5

27

85.8

81.6

81.0

84.4

29

79.0

70.8

67.7

78.8

31

70.7

86.5

66.9

64.9

40

25

100.2

103.3

98.3

103.8

27

90.6

91.7

94.5

92.2

29

77.2

85.8

81.7

79.7

31

73.6

73.2

76.4

72.5

数据保存在“Desktop/1.xls”文件中。

 一、实验目的

认识多因素分析的方法,运用多因素分析的方法进行数据分析。

二、实验内容

分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。

三、实验步骤

1)打开已存在的数据文件“Desktop/1.xls”。

图1-1输入格式

2)点击主菜单“Analyze”项,在下拉菜单中点击“GeneralLinearModel”项,在右拉式菜单中点击“Univariate”项,系统打开窗口如图1-2

图1-2多因素方差分析窗口

 

3)在左边变量列表中选“历期”,用

向右拉按钮选入到“DependentVariable:

”框中; 在左边变量列表中选“a”和“b”变量,用

向右拉按钮移到“FixedFactor(s):

”框中。

4)在主对话框中单击“Model”按钮,打开“UnivariateModel”对话框。

见图1-3

图1-3“UnivariateModel”定义分析模型对话框

 

5)在主对话框中单击“Contrasts”按钮,打开“Contrasts”比较设置对话框,如图1-4示。

如图1-4contrasts比设置框

 

 

6)在主对话框中单击“Plot”按钮,打开“ProfilePlots”对话框,如图1-5示。

如图1-5ProfilePlots”对话框

 

7)在主对话框中单击“PostHoc”选项,打开“PostHocMultipleComparisonsforObservedMeans”对话框,从“Factor(s)”框选择变量,单击向右拉按钮,使被选变量进入“PostHoctestfor”框。

选择“a”和“b”。

然后选择多重比较方法。

在对话框中选择多重比较方法。

选择“Duncan”和“Tamhane'sT2”.

图1-6PostHocMultipleComparisonsforObservedMeans对话框

 

8)选择保存运算值

图1-7Save对话框

9)在主对话框中单击“Options”按钮,打开“Options”输出设置对话框,见图1-8

图1-8“Options”输出设置对话框

10)设置完成后,在多因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。

 

四、结果分析

主要输出结果:

表1-2

表1-3

 

表1-4

1)方差不齐次性检验显著

  表1-2方差齐次性检验表明:

方差不齐次性显著,p<0.05。

2)主效应方差分析

表1-3主效应方差分析表:

在表的左上方标明研究的对象是粘虫历期。

不同温度(a)对粘虫历期的偏差均方是1575.434,F值为90.882,显著性水平是0.000,即p<0.05存在显著性差异;

不同湿度(b)对粘虫历期的偏差均方是322.000,F值为18.575,显著性水平是0.000,即p<0.05存在显著性差异;

不同温度和不同湿度(a*b)共同对粘虫历期的偏差均方是19.809,F值为1.143,显著性水平是0.358,即p>0.05存在不显著性差异。

3)多重比较

由于方差不齐次性,应选择方差不具有齐次性时的“Tamhane'sT2”t检验进行配对比较。

表1-4多重比较表就是“温度”各水平“Tamhane'sT2”方法比较的结果。

温度25℃与27℃、29℃和31℃之间都有显著性差异;温度27℃与25℃、29℃和31℃之间都有显著性差异;温度29℃与26℃和27℃之间都有显著性差异;与31℃无显著性差异;温度31℃与25℃和27℃之间都有显著性差异;与29℃无显著性差异。

不同湿度水平之间无显著性差异存在。

 

多元回归分析

某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。

分级别数值列成表2-1。

预报量y:

每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。

预报因子:

x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。

     表2-1

蛾量

X1

卵量

X2

降水量

X3

雨日

X4

幼虫密度

Y

1960

1022

4

112

1

4.3

1

2

1

10

1

1961

300

1

440

3

0.1

1

1

1

4

1

1962

699

3

67

1

7.5

1

1

1

9

1

1963

1876

4

675

4

17.1

4

7

4

55

4

1965

43

1

80

1

1.9

1

2

1

1

1

1966

422

2

20

1

0

1

0

1

3

1

1967

806

3

510

3

11.8

2

3

2

28

3

1976

115

1

240

2

0.6

1

2

1

7

1

1971

718

3

1460

4

18.4

4

4

2

45

4

1972

803

3

630

4

13.4

3

3

2

26

3

1973

572

2

280

2

13.2

2

4

2

16

2

1974

264

1

330

3

42.2

4

3

2

19

2

1975

198

1

165

2

71.8

4

5

3

23

3

1976

461

2

140

1

7.5

1

5

3

28

3

1977

769

3

640

4

44.7

4

3

2

44

4

1978

255

1

65

1

0

1

0

1

11

2

数据保存在“Desktop/2.xls”文件中。

一、实验目的

认识多元回归,运用多元回归分析数据之间的关系

二、实验内容

分析预报因子与预报量的关系

三、实验步骤

1)在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。

再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。

编辑后的数据显示如图2-1。

图2-1

2)单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口。

图2-2线性回归对话窗口

3)用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent”栏左边的

向右拉按钮,该变量就移到“Dependent”因变量显示栏里;将左边变量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”变量,选移到“Independent(S)”自变量显示栏里;选择“年份”为标签变量。

4)4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。

因此在“Method”框中选中“Enter”选项,建立全回归模型。

5)单击“Statistics”按钮,将打开如图2-3所示的对话框。

该对话框用于设置相关参数。

图2-3Statistics对话框

6在主对话框单击“Plots”按钮,将打开如图2-4所示的对话框窗口。

图2-4Plots绘图对话框窗口

7)在主对话框里单击“Save”按钮,将打开如图2-5所示的对话框。

图2-5Save对话框

8)在主对话框里单击“Options”按钮,将打开如图2-6所示的对话框。

图2-6“Options”设置对话框

9)在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。

 

四、结果分析

主要结果:

表2-2

表2-3

表2-4

分析:

表2-2是对模型整体拟合效果的概述,模型的拟合优度系数为0.883,反映了因变量与自变量之间具有显著的线性关系。

表2-3的方差分析表,模型的设定检验F统计量的值为9.709,显著性概率是0.001,几乎为零,模型通过了设定检验,也就是说,因变量与自变量之间的线性关系明显。

表2-4中变量“蛾量”的t值太小,没有达到显著性水平,因此要将这个变量剔除,从这里可以看出,模型虽然通过了设定检验,但很有可能不能通过变量的显著性检验。

建立回归模型:

根据多元回归模型:

y=b0+b1x1+b2x2+……+bpxp+n

把表2-4中“非标准化回归系数”栏目中的“B”列系数代入上式得预报方程:

y=0.647+0.000x1+0.001x2+0.017x3+0.194x4

聚类分析

1985年中国学生体质调查的各省19-22岁年龄组城市男学生(汉族)身体形态指标的平均值数据保存在数据文件“xueshengtizhi.sav”中,包括身高(x1)、坐高(x2)、体重(x3)、胸围(x4)、肩宽(x5)、骨盆宽(x6)六个属性变量和28个样本观测值。

试根据身体形态指标对样本进行聚类分析。

一、实验目的

了解分层聚类基本思想和基本算法

二、实验内容

用分层聚类的方法对学生的身体形态指标进行聚类分析

三、实验步骤

1)打开已存在的数据文件“xueshengtizhi.sav”。

图3-1输入格式

 

2)点击主菜单“Analyze”项,在下拉菜单中点击“Classify”项,在右拉式菜单中点击“HierarchicalCluster…”项,系统打开如图3-2

图3-2聚类分析对话框

3)单击Statistics按钮,弹出HierarchicalClusterAnalysis:

Statistics对话框,如图3-3

图3-3分层聚类分析统计量对话框

 

4)单击continue按钮,回到分层聚类分析对话框,单击Plots…按钮,弹出HierarchicalClusterAnalysis:

Plots对话框,如图3-4

图3-4分层聚类分析图形对话框

5)单击continue按钮,回到分层聚类分析对话框,单击Method…按钮,弹出HierarchicalClusterAnalysis:

Method对话框,如图3-5

图3-5分层聚类分析方法对话框

6)单击continue按钮,回到分层聚类分析对话框,单击Save…按钮,弹出HierarchicalClusterAnalysis:

SaveNewVariables对话框,如图3-6

图3-6分层聚类分析保存新变量对话框

7)单击continue按钮,回到分层聚类分析对话框,单击OK按钮,进入计算分析。

四、结果分析

主要输出结果

表3-1

表3-2

表3-3

分析:

表3-1是聚类归属表,分为五类,第一类结果为{北京,天津,河北,山西,内蒙古,辽宁,吉林,黑龙江,山东,陕西,甘肃,宁夏,新疆,上海,江苏,浙江,安徽,河南,湖北,湖南,广东,四川,贵州,云南}、第二类{青海}、第三类{福建}、第四类{江西}、第五类{广西}

表3-2是冰柱图,由图可以看出,江苏和陕西最先聚在一起,接下来是陕西和吉林聚在一起,再就是黑龙江和辽宁聚在了一起,从下往上看,依此类推。

表3-3是聚类龙骨图,从中我们可以直观的看出聚类的过程和各个样本所属的类别。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1