第五次作业答案.docx

上传人:b****3 文档编号:26602030 上传时间:2023-06-20 格式:DOCX 页数:20 大小:204KB
下载 相关 举报
第五次作业答案.docx_第1页
第1页 / 共20页
第五次作业答案.docx_第2页
第2页 / 共20页
第五次作业答案.docx_第3页
第3页 / 共20页
第五次作业答案.docx_第4页
第4页 / 共20页
第五次作业答案.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

第五次作业答案.docx

《第五次作业答案.docx》由会员分享,可在线阅读,更多相关《第五次作业答案.docx(20页珍藏版)》请在冰豆网上搜索。

第五次作业答案.docx

第五次作业答案

5.1

代码:

datapaba;

infile'D:

\1.txt'missover;

inputbrand&:

$14.papufa@;

dountil(papufa=.);

output;

inputpapufa@;

end;

run;

procprint;

run;

procglmdata=pabaorder=data;

classbrand;

modelpapufa=brand;

meansbrand;

contrast'cornvsbean'brand-1-1-1-122;

meansbrand/tukeylsd;

run;

quit;

(a)

①结果

②说明

这一小题要求利用单因子固定效应模型对数据进行方差分析并给出一些参数的估计。

由于每一组实验的数据个数不一样,因此使用“missover”参数结合“until”循环使得实验数据能够正常读入。

用“classbrand;”语句指定分类变量之后,用“modelpapufa=brand;”进行因变量“papufa”关于变量“brand”不同水平的方差分析。

从上图结果可以看出整个模型原假设

,F-检验统计量值为79.26,对应的p-值为<0.0001,所以拒绝原假设,可以认为这六个品牌的奶油产生的脂肪酸水平有显著差异。

方差分析表中,“Error”行所对应的“MeanSquare”是对

的估计值。

在本题中为0.2729750,在最后的图中每一个水平对应的“Mean”列中的数值即为每一个水平下处理效益μ的估计值

(b)

①结果

②说明

这一题要求进行对照实验分析,比较cornbased与soybeanbased品牌均值之间是否

有显著差异。

从SAS输出结果可以看出,这一次对照实验的对照平方和为100.8687364,F-检验统计量的值为369.52,对应的p值为<0.0001。

这些结果说明原假设被拒绝,亦即认为不同材料制作的人造奶油的“papufa”值有显著性差异。

(c)

①结果

T检验的区间

Tukey的区间

②说明

这一小题要求用两种方法进行两两配对比较。

这一过程可以用语句“meansbrand/tukeylsd;”实现,“tukey”“lsd”分别指定检验方法为Tukey检验和Fisher最小显著性差异(即LSD或t分布法)。

从表中可以看出,对于同一个进行两两配对比较的组而言,用Tukey检验方法算得的置信区间要比用Fisher最小显著性差异检验方法算得的区间大。

这两个区间产生差异的原因是两种方法控制第一类错误概率的对象不同。

Tukey检验法只控制实验总体错误率为α(样本量相等时)或至多为α(样本量不等时);而Fisher最小显著性差异检验法只控制每一次配对比较的错误率为α。

5.4

(a)

①代码

datapackage;

inputdesign$@;

doi=1to6;

inputSALES@;

output;

end;

dropi;

datalines;

1121814151715

2141213101512

3191721231620

4243027283230

;

run;

procprintdata=package;

run;

procglmdata=package;

classdesign;

modelSALES=design;

run;

②结果

③说明

这一小题要求对“design”这一分类变量的不同水平下处理效应即均值是否有差异进行检验。

从结果中来看,相应方差分析的检验统计量值为52.30,对应的p值为<0.0001,因此拒绝原假设,即认为μ1、μ2、μ3、μ4至少有一个与其余的μ是显著不同的。

(b)

①代码

procglmdata=package;

classdesign;

modelSALES=design;

meansdesign/lsdalpha=.05;

run;

②结果

③说明

本题采用lsd检验将不同包装下销售额的均值进行两两比较,判断其是否具有显著性差异。

从结果中可以看出,4个实验组一共分成了3类。

第4组的处理效应显著高于其他三组,被作为第一类,第3组的处理效应显著高于第1、2组,因此被作为第二类。

而第1、2组的处理效应没有显著性差异,因此它们都被作为第三组。

(c)

①代码

procglmdata=package;

classdesign;

modelSALES=design;

meansdesign/tukeyalpha=.05;

run;

②结果

③说明

在这一小题的结果中对4个实验组的分类结果与第b小题相同,通过比较参数“lsd”“tukey”的结果可以看出,两者的差别在于结果的第一部分。

在“tTests(LSD)forsales”的结果中,“CriticalValueoft”的值为2.08596,“LeastSignificantDifference”的值为2.8372。

结果不同的原因是tukey检验过程控制的是experimentwiseerrorrate,减少了真实结果与估计结果有显著差异的情况,过程更为保守,准确度也相对较高。

(d)

①代码

procglmdata=package;

classdesign;

modelSALES=design;

estimate'three-colorVS.five-color'design11-1-1;

estimate'withcartoonsVS.withoutcartoons'design1-11-1;

estimate'three-colordesignwithcartoonsVS.withoutcartoons'design1-100;

estimate'five-colordesignwithcartoonsVS.withoutcartoons'design001-1;

run;

②结果

③说明

这一小题要利用t-检验进行预设计的实验比较。

利用“estimate”语句并且正确分配要检验的原假设中各个处理均值的系数,可以得到相关结果。

根据显著性水平α=0.05,可以得到以下结论。

(i.)

这一组比较中要求比较“3colors”与“5colors”组是否存在显著性差异。

从第一行输出结果可以看出,这组比较的检验t值为-10.40,对应p值为<0.0001,因此拒绝原假设,亦即认为“3colors”与“5colors”组的处理均值之间存在显著性差异。

(ii.)

这一组比较中要求比较“withcartoons”与“withoutcartoons”组是否存在显著性差异。

从第二行输出结果可以看出,这组比较的检验t值为-3.47,对应p值为0.0024,因此拒绝原假设,亦即认为“withcartoons”与“withoutcartoons”组的处理均值之间存在显著性差异。

(iii.)

这一组比较中要求比较“3colorswithcartoons”与“3colorswithoutcartoons”组是否存在显著性差异。

从第三行输出结果可以看出,这组比较的检验t值为1.84,对应p值为0.0810,因此不能拒绝原假设,亦即并没有充分的理由认为“3colorswithcartoons”与“3colorswithoutcartoons”组的处理均值之间存在显著性差异。

(iv.)

这一组比较中要求比较“5colorswithcartoons”与“5colorswithoutcartoons”是否存在显著性差异。

从第四行输出结果可以看出,这组比较的检验t值为-6.74,对应p值为<0.0001,因此拒绝原假设,亦即认为“5colorswithcartoons”和“5colorswithoutcartoons”的处理均值之间存在显著性差异。

5.7

(a)

①代码

dataplate;

inputlength$@;

doi=1to7;

inputstiffness@;

output;

end;

dropi;

datalines;

4309.2409.5311326.5349.8309.7316.8

6402.1347.2361404.5331348.9381.7

8392.4366.2351357.1409.9367.3382

10346.7452.9461.4433.1410.6384.2362.6

12407.4441.8419.9410.7473.4441.2465.8

;

run;

procprint;

run;

procglmdata=plate;

classlength;

modelstiffness=length;

meanslength;

run;

②结果

③说明

这一小题要求对各个处理的均值及模型方差进行估计,从上面的结果可以得到自变量“stiffness”的各个水平下处理均值的估计为

“Error”行“MeanSquare”列可以得到模型方差σ2的估计为1049.16771。

(b)根据(a)中的输出结果可知,整个单因子固定效应方差分析模型的F-检验统计量的值为10.48,对应的p值为<0.0001。

因此拒绝原假设,即认为不同“length”下的处理均值有显著性差异。

(c)

①代码

procglmdata=plateorder=data;

classlength;

modelstiffness=length;

contrast'LinearTrend'length-2-1012;

run;

②结果

③说明

这一小题要求利用正交多项式对因变量与自变量之间的关系进行检验。

由于自变量水平为5,因此“contrast”语句中的系数采用的是N为5时正交多项式回归的的一次项的系数“-2-1012”。

从输出结果可以看出,对照平方和的值为42780.43214,F-统计量的值为40.78,对应的p值为<0.0001。

因此拒绝回归系数为0的原假设,即认为因变量“stiffness”与自变量“length”之间有着显著的线性相关关系。

(d)

①代码

procglmdata=plateorder=data;

classlength;

modelstiffness=length;

estimate'LinearTrend'length-2-1012/divisor=10;

run;

②结果

③说明

这一题要求输出求得的回归模型中系数的估计。

根据输出结果可知回归系数的估计值就是24.214286。

它表明自变量“length”每增加一个单位,因变量“stiffness”平均增加24.214286个单位。

5.9

(a)

①代码

datafila;

inputmachine$@;

doi=1to5;

inputyx@;

output;

end;

dropi;

datalines;

136204125392442254832

245225228442249305128

335213723422634213215

;

run;

procprint;

run;

procglmdata=fila;

classmachine;

modely=machinexx*machine;

run;

②结果

③说明

这一小题要求对协方差分析模型的斜率及处理效应进行分析。

第一个glm过程中的中包含了交互效应项“x*machine”,这样可以用来检验协方差模型中不同处理水平下模型的斜率是否相同。

可以看出,“x*machine”的“TypeIIISS”值为1.3743086,F-检验统计量的值为0.25,对应的p值为0.7830>0.05。

因而不能拒绝原假设,亦即认为不同处理水平下拟合的直线回归模型的斜率是相等的。

“x”的“TypeISS”的检验p值<0.0001,表明协变量的影响效果是显著的。

“machine”的“TypeIIISS”的检验p值为0.3470,仅仅表明在协变量为0的时候处理均值没有显著性差异。

由于长丝纤维直径为0时没有实际意义,因此这并不代表不同的机器生产的长丝纤维的抗断强度有显著性差异。

为了得到处理效应的修正的方差分析表,在已经检验了斜率相同的情况下,在第二个glm过程中将交互效应项去掉。

可以得到处理水平“machine”的“TypeISS”值为374.8,F检验统计量的值为79.35,对应的p值为<0.0001。

因此可以认为协变量x的影响是显著的即β≠0。

从该图还可以得到处理水平“machine”的“TypeIIISS”的值为146.6477019,F-检验统计量的值为79.35,对应的p值为<0.0001。

因此拒绝原假设,即认为不同的机器的处理均值是有显著性差异的。

(b)

①代码

procglmdata=fila;

classmachine;

modely=machinex/nointsolution;

run;

②结果

③说明

这一小题要求如果斜率不相同的话分别计算回归模型中的斜率。

从第a小题中的检验可知,回归模型的斜率是相同的。

因此这一小题可以不做。

但考虑到第d小题作图之用,在此处仍然求出这个相同的斜率。

考虑到当X=0(亦即单长丝纤维的直径为0)时,讨论其抗断强度(即y的值)没有意义,因此语句“modely=machinex”中用“noint”将模型中的常数项去除,用“solution”输出斜率。

从结果的最后一部分可以看出,协变量的系数即均值的估计为0.90899796,各个水平下处理均值的估计分别为18.29325153,24.56605317,16.72924335,并且都是显著的。

(c)

①代码

procglmdata=filaorder=data;

classmachine;

modely=machinex/nointsolution;

lsmeansmachine/clpdiff;

run;

②结果

③说明

这一小题要求计算两两比较的修正的处理均值差异的95%置信区间。

由于已经检验过模型的斜率是相同的,因此可以直接使用“lsmeansmachine/clpdiff”语句进行计算。

从结果的“LeastSquaresMeansforEffectmachine”部分可以得到相应的比较置信区间。

从结果中可以看出机器1、2与2、3的置信区间不包含0,说明这两组之间修正的处理均值是存在显著差异的;机器1、3的置信区间包含0,说明这两组之间修正的处理均值是不存在显著差异。

(d)

①代码

datafittedlines;

machine='11';

x=15;y=18.29325253+0.90899796*x;output;

x=35;y=18.29325253+0.90899796*x;output;

machine='2l';

x=15;y=24.56605317+0.90899796*x;output;

x=35;y=24.56605317+0.90899796*x;output;

machine='3l';

x=15;y=16.72924335+0.90899796*x;output;

x=35;y=16.72924335+0.90899796*x;output;

run;

dataappended;

setfilafittedlines;

run;

symbol1v="1"cv=redf=centbh=1.5i=none;

symbol2ci=magentav=nonei=join;

symbol3v="2"cv=brownf=centbh=1.5i=none;

symbol4ci=orangev=nonei=join;

symbol5v="3"cv=bluef=centbh=1.5i=none;

symbol6ci=cyanv=nonei=join;

axis1c=dapklabel=(c=blackh=1.5a=90f=centb'breakingstrength');

axis2c=dapklabel=(c=blackh=1.5f=centb'diameter');

procgplotdata=appended;

ploty*x=machine/vaxis=axis1haxis=axis2nolegend;

run;

②结果

③说明

这一小题要求利用一个过程步作出各个数据点的散点图及拟合直线的叠加图。

为完成这一目的,首先根据第b小题得到的斜率和截距的估计得到每一条回归方程的数据,然后取x=15和35以便让直线范围涵盖所有的散点。

利用两点确定一条直线的原理只需计算拟合直线上两个点即可,这些就是创建“fittedlines”数据集的数据步的目的。

之后第二个data步将两个数据集联合起来以便于作图。

之后用一系列symbol语句进行区分。

“v”指明需要在图中标示的字符,“cv”指定散点的颜色,“f=centb”指定字符的字体,“h”指定字符的大小,“i=none”表明不作拟合线(以防止没有散点图)。

“ci”指定拟合曲线的颜色,“v=none”声明不再拟合曲线上标注散点,“i=join”指明拟合曲线的类型。

因为同一张图中要用到6种类型的图示,因此一共定义了6个symbol语句。

“axis”语句用来指定坐标轴的表示方法。

“c=dapk”指定坐标轴的颜色,“label”指定表示坐标轴标签的一系列方式,“c=black”指定坐标轴标签的颜色,“h=1.5”指定字体的大小,“a=90”指定两个坐标轴的夹角,“f=centb”指定标签的字体。

“'breakingstrength'”指定坐标的标签。

最后使用gplot过程步完成作图。

“nolegend”为不输出图例项。

结果中散点和与其颜色相近的拟合直线作为一组。

从结果中可以看出等斜率的假设比较合适,第1组机器与第3组机器的处理均值相近而它们都与第2组的机器处理均值有较大差异,说明之前方差分析得到结论是合适的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 小学作文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1