多元统计分析作业.docx
《多元统计分析作业.docx》由会员分享,可在线阅读,更多相关《多元统计分析作业.docx(15页珍藏版)》请在冰豆网上搜索。
多元统计分析作业
正交试验在材料试验数据处理理中的应用研究摘要:
本文简单介绍多元统计方法,以及详细介绍设计试验的方法以及具体的步骤,主要根据相关数据进行设计正交试验,概括的正交设计的步骤和方法,然后对正交设计的实验结果进行极差和方差分析,然后进行讨论结果。
关键词:
多元统计分析方差分析极差分析
引言
随着生产和科学技术的发展,人们需要对各式各样的受随机干扰的数据进行处理,并从中提取有用信息,以期寻找隐藏在随机性背后的统计规律,达到解决实际问题的目的,在这一进程中必须要使用各种统计方法,因此学习使用统计学软件在中国形成一种时尚,而多元统计学软件诸如SPSS、SAS、MATLAB等包括的试验设计分析、多元统计分析、可靠性与生存分析及时间序列分析等方面的知识在实际工作中有着非常广泛的应用,多元统计分析能告诉读者如何从数据出发,寻找适当的统计方法,使用相应的统计软件,解释计算机输出的的结果,指明进一步研究的新途径。
多元统计分析是研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性,它的重要基础之一是多元正态分析,又称多元分析。
如果每个个体有多个观测数据,或者从数学上说,如果个体的观测数据能表示为n维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统计方法就叫做多元统计分析,它是数理统计学中的一个重要的分支学科,统计学已经在国内外生物、科学等领域应用比较成熟,在土木工程中也有了一些应用,此课题将介绍多元统计分析在土木工程材料试验数据处理中的应用。
SPS(StatisticsPackageforSocialScienee社会科学统计软件包)于20世纪60年代由美国斯坦福大学的三位研究生研制开发。
80年代以前,SPSS软件主要应用于企事业单位。
1984年,SPSS中心推出了基于DOS系统的微机版本。
90年代以后,随着Windows系统的逐渐盛行,SPSS也适时地推出了基于Windows操作平台的新版本。
如今,SPSS软件已经作为国际上最有影响力的统计软件之一,广泛应用于社会学、经济学、生物学、教育学、心理学等各个领域。
一、设计试验
1.1概述
20世纪20年代,英国生物学家及数学家费歇(RAFISher)【12]首先提出了方差分析,并将其应用于农业,生物学!
遗传学等方面,取得了巨大的成功,并在试验设计和统计分析方面做出了一系列的先驱工作,开创了一门新的学科。
20世纪60年代,日本著名统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用做出了众所周知的贡献。
田口玄一的方法对我国的试验设计的普及和广发使用有巨大的影响,我国从20世纪50年代开始研究而试验设计这门学科,60年代开始应用正交设计,蔡正永王足献老师编写的正交设计在混凝土中的应用对推动我国混凝土试验优化设计起到了重要的作用。
20世纪70年代,国际混凝土行业就已经出现了回归试验设计的应用。
1978年,著名前苏联混凝土专家巴耶诺夫将一次回归正交设计确定最佳混凝土配合比的方法写入他的专著5混凝土工艺学6中,在此之后,回归正交设计,回归旋转设计,D一最优设计。
混料设计和均匀设计在混凝土工程的试验中均得到应用。
其中,均匀设计是我国著名统计学家方开泰和著名数学家王元于1978年首先提出的,该设计考虑如何将设计点均匀散布在试验范围内,使得能用较少的试验点获得最多的信息。
到目前为止,试验设计和数据处理已成为广大技术人员与科学工作者必备的基本理论知识,在科学研究和工农业生产中,经常需要通过试验来寻找所研究对象的变化规律,并通过对规律的研究达到各种使用的目的,如提高产量、减低消耗、提高产品性能或者质量等,特别是新产品试验,未知的东西很多,要通过大量的试验来摸索工艺条件或者配方,自然科学和工程技术中所进行的试验,是一种有计划的实践,只有科学地试验设计,能用较少的试验次数,在较短的时间内达到预期的试验计划,反之,不合理的试验设计,往往会浪费大量的人力、物力和财力,甚至劳而无功。
另外,随着试验进行,必然会得到大量的试验数据,只有对试验数据进行合理地分析和处理,才能获得研究对象的变化规律,达到指导生产和科研的目的。
可见,最优试验方案的获得,必须兼顾试验设计方法和数据处理两方面,两者是相辅相成、相互依赖、缺一不可的。
1.2试验设计的基本程序
1、试验目的[1]
试验目的是试验设计首先要考虑的问题,对其应当深入了解,认真分析,提出试验目的及预期效果,避免盲目性。
例如材料性能试验,其目的主要就是各类力学性能影响因素的研究。
2、因素和水平的确定
试验设计之前必须了解哪些因素可能对试验结果产生影响,并根据试验要求选出适当因素加以研究。
例如在碾压混凝土抗压!
抗拉强
度力学性能影响因素的研究中,需考虑水灰比、砂率、粉煤灰取代率等的影响。
注意不要贪大求全,不要包罗万象,也不能过少的忽略了起重要作用的因素。
在因素和水平的确定中专业知识和经验是特别重要的。
3、指标的确定
在选择试验指标时,必须考虑指标对所研究问题能提供什么信息,以及如何确定该指。
4、试验计划的确定
试验计划的确定是整个试验设计中至关重要的,首先须确定希望分辨出不同试验处理间的最小差异程度和允许冒多大的风险,以便决定重复数,还要考虑以怎样的方式收集数据以及怎样作随机排列。
5、试验设计的实施
试验设计实施的过程也是收集数据的过程。
6、数据分析
试验所得数据应作统计分析,如比较两个处理平均数的差异,简单地比较两个平均数是不够的,要考虑统计显著性,数据分析中应注意使用计算软件,以减轻工作量。
本文突破之处是将多元统计分析中
的聚类分析,主成分分析和因子分析结合试验设计应用。
7、结论与应用
对试验分析的结果应从中归纳有关结论,给予科学专业的解释,评价这些结论的实际意义。
1.3正交试验设计
在生产实际中,试制新产品、改革工艺、寻求最佳生产条件,这些都需要先做试验,而试验总要花费时间,消耗人力、物力,因此人们总希望做试验的次数尽量的少,而得到的结果尽可能的好,要达到这个目的,就必须事先对试验作合理的安排,也就是试验设计,实际问题是复杂的,对试验有影响的因素往往是多方面的,在多因素,多水平试验中,如果对每个因素的每个水平都相互搭配进行全面的试验,需要做的试验次数就会很多。
人们在长期的实践中发现,要得到理想的结果,并不需要进行全面的试验,即使因素个数,水平都不太多,也不必做全面试验,尤其是对那些试验费用很高,或者具有破坏性的试验,更不要做全面试
验,应当在不影响试验效果的前提下,尽可能的减少试验次数。
正交试验设计就是解决这个问题的有效方法。
其主要工具是正交表,在实践中已得到广泛的应用。
1.3.1设计步骤
正交试验设计就是利用正交表合理的安排试验,尽快有效地获得最优方案。
正交表可用如公式(1-l)表示:
Ln(rm)
其中,L为正交表符号;n为正交表横行数(需要做的试验次
数);r为因素水平数;m为正交表列数(最多能安排的因素个数),
例如正交表
Lg(34)显示。
表1-1
正交表Lg(34)
试验号
1
2
3
4
1
1
1
1
1
2
1
2
2
2
3
1
3
3
3
4
2
1
2
3
5
2
2
3
1
6
2
3
1
2
7
3
1
3
2
8
3
2
1
3
9
3
3
2
1
正交试验[16]的安排是借助正交表进行的,利用正交表安排试验,一
般可分为以下几个步骤:
1、确定试验目的,确定评价指标
任何一个试验都是为了解决某一个问题,或为了得到某些结论而进行的,所以任何一个正交试验都应该有一个确定的目的,这是正交试验设计的基础。
试验指标是表示试验结果特性的值,如混凝土的抗压强度,劈裂抗拉强度等,可以用它来衡量或考核试验效果。
2、确定试验因素和水平数
影响试验指标的因素很多,但由于试验条件的所限,不可能全面考察,所以应对实际问题进行具体分析,并根据试验目的,选出主要因素,略去次要因素,以减少要考察的因素数,确定因素的水平数时,一般尽可能使因素的水平数相等,以方便试验数据处理。
最后列出因素水平表,以上两点主要依靠专业知识和实践经验来确定,是正交试验设计能顺利完成的关键。
3、选用适当的正交表根据试验因素水平以及是否需要估计相互作用来选择合适的正交表,其原则是既要能安排下全部的试验因素,又要使部分试验的水平组合尽可能的少。
在正交试验中,各试验因素的水平数减1之和加1,即为需要的最少试验次数或处理组合数,若有交互作用,需要再加上交互作用的自由度。
4、进行表头设计,列出试验方案
所谓表头设计,就是把试验中挑选的各因素填到正交表的表头各列。
正交表应该根据因素数和水平数来选择。
一般要求,因素数<正
交表列数,因素水平和正交表对应的水平数一致,在满足上述条件的前提下,选择较小的表。
例如4因素3水平的试验,满足要求的表有L9(34)等,一般可以选择L9(34),但是如果要求精度高,并且试验条件允许,可以选择较大的表。
明确试验方案,得到结果正交试验方案做出后,就可按试验方案进行试验。
如果选用的正交表较少,各列都安排了正交因子,当对试验结果进行方差分析时,就无法估算试验误差;若选用更大的正交表,则试验的处理组合数会急剧增加。
为了解决这个问题,可采用重复试验,也可采用重复取样的方法。
重复取样不同于重复试验,重复试验是从同一次试验中取几个样品进行观测或测试,结果每个处理组合也可得到几个数据。
6、对试验结果进行统计分析
对正交试验结果的分析,通常采用两种方法:
一种是直观分析法(或称极差分析法);另一种是方差分析法,通过试验结果分析可以得到因素主次顺序、优方案等有效信息。
1.3.2正交试验设计的极差分析和方差分析
方差分析[2]是科学试验中的常用工具,在科学试验中,试验结果往往是变化的,这种变化大体上由两类因素引起的。
一类是受随机因素的影响而产生的波动,这类影响在试验中常常是不能控制的,因而是不可避免的;另一类是人为控制的因素使试验结果发生变化。
这类影响对试验结果有显著的影响时,必然会明显地改变试验结果,并随随机因素的影响一起出现。
反之,当这类因素对试验结果无显著影响时,则相应的变化就不会明显的表现出来,从而使试验结果的变化基本上归结于随机因素的影响。
科学试验的目的常常是为了判断这类受人们控制的因素对试验结果的影响是否确实存在。
方差分析正是通过对试验结果数据变动的分析,对上述问题做出判断的有效工具。
因为它可以将随机变动和非随机变动从混杂状态下分离开来,帮助我们发现起主导作用的变异来源,从而抓住主要矛盾或关键因素并采取有效措施。
数据分析结果
采用SPSS数据处理软件,进行设计正交试验,进行极差和方差
分析,得到相关图表格,进行数据分析。
正交设计试验数据分析,如
下表2-1、2-2以及极差分析、方差分析见图2-1、2-2、2-3、2-4。
1正交数据源和数据
表2-1L9(34)正交试验设计方案
水」
°A粉煤娠摻率(%)
因崇
B水胶比C用术呈
D外加剂摻率(%)
1
163
().3
136
1,2
2
2Q.0
0.33
149
1.7
3
30.0
036
163
2.2
表2-2L9
(34)正交试验方案及结果
因索
vd
2Kd
组弓
A粉煤娠掺率(%)
B水胶比
c用水量
(kg/m5)
D外加剂搀率(%)
抗压强麼
CMPa)
抗压蛊度
(MPa)
]
1(163)
1(0.30)
1(136}
1(1-2}
5Z9
612
2
1(16.3)
2(0,33)
2(]49)
2(17)
50.^
63.1
3
1(16.3)
3(0.36)
3(163)
3(2.2)
377
58.3
4
2(20X1)
1(0J0)
2(149)
3(2,2)
46.2
65.1
5
2(2(10)
2(0.33)
3(163)
1(12)
43.6
67.7
6
2(20.0)
3(0.36)
1(136)
2(L7)
35.8
54.fi
7
3(30.0)
1(0.30)
3(163)
2(1.7)
3S3
59.2
3(30.0)
2(0.33)
1(136)
3(2.2)
326
569
9
3{30P(J)
3(0.36)
2(149)
1(1.2)
33.1
521
2、以抗压强度数据为例的极差分析结果
以正交试验设计的数据进行极差和方差分析,7d、28d的抗压
强度极差分析表,如表2-3所示;混凝土抗压强度各因素极差与强度的极差如图1-4所示。
表2-37d、28d的抗压强度极差分析表
7天抗压强度扱差
垓标Y-丿指
索
KI
2
K
3
K
Rs极
度强7d
灰武
A
4
6
5
2
.0
04.
o
47s
9
4
7
丄
3
3
2.
匕
B
4^
7
B
6.7
2
IL
6
)6.
—1
&
5.
4
2z
4
5
5.
3
.3
C
3
21
&riT3(
6X.
4
4(1
■b
43.
5
9.
3
1
\z
pa
KIP
/I-
涮<
D
6--
6
124.
5
5_
11
11
5
43s
5
4
5
K_
3
5_
限41.T
A
6z
8
4
8
II
2
&
6
—1
9
6(1.
5
2.
6
6.1
6.4
比文■■!
\
B
5
5_K
—
4z
X
6
g
3
6z
6
.If
-y
§
.6
量
7K.用
c
7
72.--
2
5.
X
.6
5
2
6(1
_7
61
4_
丙量
D
-IF/AKJ
77.
3
jr—
KI
3
6(1
59.t
I
BC
因素
表17d的抗压强度极差分析图
图27d的抗压强度极差分析图
昶天抗压强愛啜差
图328d的抗压强度极差分析表
图428d的抗压强度极差分析图
由极差分析可以得到以下结论:
一般来说,各列的极差是不同的,这说明各因素的水平改变时对试验指标的影响是不同的。
极差最大的那一列,其对应因素的水平改变时对试验指标的影响最大,哪个因素就是要考虑的主要因素。
(1)计算出7d抗压强度4列的极差分别为12.3,10.3,4.1,5,7d抗
压强度各影响因素的极差由高到低的顺序是:
粉煤灰掺量、水胶比、外加剂掺量、用水量,即A>B>D>C"显然第一列因素(粉煤灰掺量)的极差12.3最大,这说明因素A(即粉煤灰掺量)的水平改变时对试验指
标的影响最大,因此因素A是要考虑的主要因素。
从K1,K2,K3均值的大小来看,各个K均值取最大的组合,得到最好的试验条件组合是:
A1B1D1C2。
(2)影响28d抗压强度的因素有所变化:
极差值R由高到低的顺序是:
水胶比、粉煤灰掺量、用水量、外加剂掺量,即B>A>C>D;同理分析K1,K2,K3均值的大小顺序,可看出最好的条件组合是:
B2A2C2D1。
分析其主要原因:
7d时粉煤灰的活性基本没有被激发,所以这时粉煤灰掺量的影响比较大;28d时粉煤灰的活性得到了发挥,对强度提高起一定的作用,因此粉煤灰掺量的影响不再是主要因素。
(3)当粉煤灰掺量从16.3%,20%到30%变化时,在水胶比相同的条件下,对于7d立方体抗压强度,当强度不断降低,随着水胶比的增大,降低趋势有所减小;对于28d立方体抗压强度随粉煤灰掺量的加大先增加后减小。
3、以抗压强度数据为例的方差分析结果
7d和28d抗压强度方差分析结果见表3-1所示:
从28d抗压强度的方差分析得出如下结论:
(1)根据偏差平方和的大小可判断各因素的影响顺序为:
B>A>C>D,
与极差分析结果是一致的。
(2)由方差分析,水胶比对28d强度影响较为显著,粉煤灰掺量对28d强度影响一般显著,用水量和外加剂对影响不显著,这与一般实际验证的规律是相同的,即水胶比的波动对抗压强度的影响最大,粉煤灰对强度的影响次之。
从7d抗压强度的方差分析得出如下结论:
①根
据偏差平方和的大小可知各因素的影响顺序为:
A>B>D>C,与极差
分析结果是一致的;②由方差分析采用的F比值来分析显著性影响,可知粉煤灰掺量的影响显著,水胶比有影响但不显著;③选择最优配合比组合:
方差分析观点认为,只需对显著性因素控制选择,对于不显著的因素,原则上可选在试验范围内的任意一个水平。
粉煤灰掺量
最大的K值对应的水平为1,即首先确定A1;结合7d强度的极差分析结果,相同粉煤灰掺量的情况下,随着水胶比和用水量的增大,混凝土早期强度却减小,因此要保证大掺量粉煤灰混凝土的早期强度,尽量选用较小的水胶比,结合K值,所以确定B1C1或B1C2;减水剂掺量对强度的影响并不显著,又考虑到减水剂会影响坍落度的损失率,所以选择D1,因此,由方差分析得出的影响7d强度,的最优组合为A1B1D1C1或A1B1D1C2,与极差分析基本一致。
从28d抗压强度的方差分析得出如下结论:
①根据偏差平方和的大小可知各因素的影响顺序为:
B>A>C>D,与极差分析结果是一致的;②由方差分析,水胶比对28d强度影响较为显著,粉煤灰掺量对28d强度影响一般显著,用水量和外加剂对影响不显著。
表3-1方差分析表
考核指标
方差来源
平方和
自由度
均方¥
F比
临界值
显著水平
A
23147
2
115.74
11.63
*
B
J63X12
2
8J.51
S.20
注度
19.91
2
9,95
2914
2
14.57
1.46
凡22)=9』
443.M
S
i.f7牛、一10凸
A
61.45
2
30.72
10&
B
158.(14
2
7y.(J2
27.43
^(2,2)=99.0
*
2苦d强度
c
12.67
2
6.33
2.20
D
S76
2
2SS
z
237.92
8
4、试验综合分析结论
(1)粉煤灰掺量对混凝土强度的影响程度随着时间的发展发生变化,在7d时粉煤灰的活性得不到发挥,其强度主要由水泥提供,随着粉煤灰掺量的增加其强度逐渐降低,粉煤灰成为影响强度因素的第一要素;28d粉煤灰的活性得到了一定的发挥,水胶比成为影响强度因素的第一要素,抗压强度随粉煤灰掺量的加大先增加后减小,粉煤灰掺量在16.3%-20%之间时,对28d抗压强度最为有利。
(2)水胶比无论在早期还是后期对混凝土强度的影响均较大,控制水胶比是达到目标强度的最好选择。
为了保证混凝土的早期强度应尽量采用低水胶比,最好控制在0.3-0.33之间。
(3)减水剂对早期强度影响较大,对后期强度影响程度减小,考虑到减水剂会影响坍落度的经时损失率,建议控制在1.2%-1.7%之间;另外分析也表明,用水量对28d强度的影响程度增加。
(4)综合极差和方差分析结果,对于考核7d抗压强度的最优配合比为A1B1C1D2,即粉煤灰掺量16.3%,水胶比0.3,用水量149kg/m,外加剂掺量1.2%;对于考核28d抗压强度的最优配合比为B2A2C2D1,即粉煤灰掺量20%,水胶比0.33,用水量149kg/m,外加剂掺量1.2%。
参考文献
[1]张劲松,正交设计在混凝土配合比优化中的应用,吉林水利,2010(5).
[2][KaiYang,JayantStrewn,MultivariateStatisticalMethodsinQuality
Management,NewYork,McGanw-Hill,2004.
[3]孙文爽,陈兰详编著,多元统计分析,北京:
高等教育出版社,1994.
[4]方开泰,实用多元统计分析,上海:
华东师范大学出版社,1989.
[5]王业刚,王有志,基于正交分析的高性能混凝土配合比优化设计,济南;山东大学,2010.
[6]李云雁,胡传荣,试验设计与数据处理,北京:
化学工业出版社,2004.
[7]高惠漩,应用多元统计分析,北京:
北京大学出版社,2005.
[8]马芳芳,郑磊,宋其凯,大掺量粉煤灰混凝土配合比设计正交试验研究,粉煤灰综合利用,2010
(1).
[9]于秀林,任雪松,多元统计分析,北京:
中国统计出版社,1999.
[10]王德民,潘东,掺粉煤灰混凝土配合比正交试验设计及二元线性分析,混凝土,2002(10).