0124196晏明相关与回归分析.docx
《0124196晏明相关与回归分析.docx》由会员分享,可在线阅读,更多相关《0124196晏明相关与回归分析.docx(9页珍藏版)》请在冰豆网上搜索。
0124196晏明相关与回归分析
学生实验报告
学院:
统计学院
课程名称:
SAS软件
专业班级:
统计122
姓名:
晏明
学号:
0124196
学生实验报告
(经管类专业用)
学生姓名
晏明
学号
0124196
同组人
实验项目
制作统计表
必修
操作性实验
实验地点
0505
实验仪器台号
指导教师
董成武
实验日期及节次
10月20日
一、实验目的及要求:
1、目的
利用多媒体会计实验软件,使学生在实验过程中全面了解和熟悉会计实务,掌握会计基本概念,熟悉会计核算的基本程序和基本方法。
(使用时斜体字删去,下同)
2、内容及要求
掌握会计基本概念,熟悉会计核算的基本程序和基本方法
1、认知各种凭证、账、表,熟悉相关操作
2、了解会计工作中工商注册、银行开户、税务登记、盘点、凭证装订等工作
3、提交实验报告
二、仪器用具:
仪器名称
规格/型号
数量
备注
计算机
1
SAS软件
1
一、下面是某地一年级的12位女生的体重(kg)和肺活量(L)的数据试求肺活量对体重的回归方程。
体重
42
42
46
46
46
50
50
50
52
52
58
58
肺活量
2.55
2.2
2.75
2.4
2.8
2.81
3.41
3.1
3.46
2.85
3.5
3
要求:
三、实验方法与步骤:
(1)将上表数据导入SAS软件的临时库中,语法如下:
datayan;
inputweightfhl;
cards;
422.55
422.2
462.75
462.40
462.80
502.81
503.41
503.1
523.46
522.85
583.5
583
;
run;
(2)在insight的环境下打开上面导入的数据集。
(3)在下拉菜单选择:
对上面的导入数据进行如下操作:
AnalyzeScatter(xy)
(4)如下图所示进行操作;点击“OK”得到散点图。
如图(1)
(5)在下拉菜单选择:
对上面的导入数据进行如下操作:
AnalyzeMultivariate,在变量表中选择要分析的变量,WEIGHT,FHLY,单击“OK”.得到肺活量和体重的相关系数矩阵。
如图(2)
(6)在下拉菜单选择:
对上面的导入数据进行如下操作:
Analyze
Fit(Y X);在因变量表中选择肺活量(FHL):
FHLY;在自变量表中选择体重(WEIGHT):
WEIGHT X。
单击“OK”,得到残差图和回归方程的检验表。
(7) 在下拉菜单选择:
对上面的导入数据进行如下操作:
Analyze Distribution。
在因变量表中选择肺活量(FHL):
FHL Y。
进入“Output“,选择”95% C.I.for mean“。
单击”OK“,得到肺活量期望值的95%的可信区间。
四、实验结果与数据处理:
1.对肺活量和体重进行相关分析。
绘制体重与肺活量的散点图,计算其相关系数。
并对输出结果进行解释。
图(1)
图(2)
由图(1)的散点图可知,体重和肺活量成线性关系。
由图(2)的相关系数矩阵可得,体重和肺活量的相关系数为0.7495.
2.判断体重和肺活量两变量的关系,拟合肺活量对体重的方程,对回归系数进行解释和对回归系数进行检验,绘制残差图。
回归方程:
FHL(肺活量)=0.0588WEIGHT(体重)
残差图图(5)
3.如果你的方程通过检验,体重为57kg的女生的肺活量是估计值是多少?
当体重为57KG时,肺活量为3.3516L
4.并救出肺活量期望值的95%的可信区间。
由上表可知肺活量期望值的95%的可信区间为{2.6392,3.1658}.
二、利用dst.fitness数据集,拟合多元线性方程(以OXYGEN变量为因变量)。
一.实验方法与步骤:
1.在分析员的环境下,打开dst.fitness数据集。
2.在下拉菜单选择:
进行如下操作statisticsregressionLinear.在Dependent列表中选择OXYGEN.在Quantitative列表中选择AGE,WEIGHT,RUNTIME,RSTPULSE,RUNPULSE,MAXPULSE.
3.进入Model中选择stepwiseselection方法,点击“OK”.
4.进入PLOTS中选择余差与Y的预测值建立散点图,点击“OK”.
5.进入Statistics中选择VarianceInflationFactors检验方法,点击“OK”.
6.在Insight的环境下打开数据集,在下拉菜单选择:
进行如下操作AnalyzeFit(Y X);在因变量表中选择OXYGEN.在自变量列表中选择AGE,WEIGHT,RUNTIME,RSTPULSE,RUNPULSE,MAXPULSE.点击“OK”.
7.点击“Vars”,选择Cook’D,在数据表中加入的变量D_OXYGEN
就是每一个观测的Cook’D值。
实验结果与数据处理:
(1)拟合多元线性方程的方程。
由上可得多元线性方程为:
OXYGEN=98.148-0.198AGE-2.767RUNTIME-0.348RUNPULSE+0.27MAXPULSE
(2)判断方程是否存在共线性和异方差?
如果方程存在共线性,怎样用逐步回归法进行变量筛选拟合回归方程(保留模式的显著性水平为0.15)。
由上图中的VarianceInflation都小于10可得,方程不存在共线性。
如果存在多重共线性,以OXYGEN为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。
用拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不是作为独立的解释变量。
如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立解释变量,它可以用其他变量的线性组合代替,也就是说它与其他变量之间存在共线性的关系。
由残差图可得:
方程存在异方差。
(3)检验样本中是否存在强影响点。
第29个观测和第31个观测的Cook’D值大于4/n,所以存在强影响点。
五、讨论与结论
六、指导教师评语及成绩:
评语:
指导教师依据学生的实际报告内容,用简练语言给出本次实验报告的评价和价值
成绩:
指导教师签名:
批阅日期: