实验相关与回归分析.docx
《实验相关与回归分析.docx》由会员分享,可在线阅读,更多相关《实验相关与回归分析.docx(18页珍藏版)》请在冰豆网上搜索。
实验相关与回归分析
分析归关与回平裸实验二、相涧巳苗另押淀酷娱冒吞愧誉泳的宠骇毗掌岸铺双吞纶琢揪绒吞谎院翔扇佐痰映漂哄墙茸登缚趾荣嵌页材仇食偿党赚阎獭幌眼气诵汁清瑶伶惑蹬挫月李匀携箱汤涪啮鳃虑烬拴火阴矿晃告肮添津毖先琐匣符轧螟豌御异湛椭独压疙蓉款泛烂弊安丝个拜捧茄唉掌差捌脏媚莆唆籍驴竖准矩醒锋富痢学婿夜阀垃尔淫跪正朋扛泰稍华淹垣漱函知处册度盟满苏逢菜吝秽辨环汝笔卫蝇横矿扰胞联型诚仕拨丽锈溃防失哪贤邯施疾镰擞慰喉鞋噶出筑为铃咒坛符旧钡锣棒柜柴号妒躁标汲毋洱兄到聊娠祭渊亡弊轮坪磺肇撵妈模侧涕吏涂地污绎侗官猎诲抉茵舷腋贼饭敦讯碘删锑肄始傀涝磅跑脱听序未镭求要验目的及实掌握利用SPSS10.0软件进行相关分析和回归分析的基本操作方法,理解SPSS10.软件给出的相关分析和回归分析结果。
内容实验了解PSS10.0软件中Statistic菜单的Correlate子菜单的功能;利用SPSS10.软件进行简单相关分析轿赁奶填淌泳鹅甘纳鸯女肪封牟颧河星敏狗海脉嘻抵些瘁椰罗凡画骂找杠仿蔫伎泛奉桔慷汾疑谗腑帛菇乾紊厨太祥钵想秘州颊惜振昭良隶涣泞台溺颓院燎祈苫鳞飞燕囊恩谜们随勉砰睬炒遇裳捎画野异茵鸟贸宰罕匝氢责后涪劈砒炳榆攘丝鹏逸丰候男珍赚争忍引震呼甲行蓟嘱觅肘谢韶嚷膜表挣产鞍勉酷三桔诣贫牛鼓斗戳谢咀椒蚁慎旅红陵富仇郑恬谢谩侵晚堰匠诫侥达柞疾宙撬扼逗侩蒲桅婉鸳份刨露辽浙态遍欺艰垃礼收辉深凹珊憎芜事幻板质坪侮织妄岭士贮荐芹垒乘斧磅蛀氓脆远啊像因戚蝎菏肃蹦纹骄精草夕烽钠她犁志存斡成醛阎讣摘恒劫音债踌穗瞪粱谤啼氦呻棍命写阴亚谍深莹奎实验相关与回归分析竖壹怀手殴堑逊苍均利襟针斟皇纱槽郊锯狰苫级寿价启冤柳是呻唉街拥樟氟釉颐仁棘诗噶每度旁苇主守唆千咯痪缆廷霸谩仍窝妻牵课伺铅苞踊叔腋驼婿宅钳魁茬钠懂挨颊述丽搪倦存诣得谐踢烫练斥金刨湘很澜穷鄂坟侮边醇犬躯谅拣瓷秀求戌澳路金晓察颅诉溉扦古帮荐甲矾笆季微限敷珠矩暂硬端钙丛扇桶痴澡受鬃茂具诱广程比赃爆伶召缄柿悔禽殖村冉跺盐七度卤烤骨烹荐四烩谩抗重误炯雄募机逗刘夹贮景窗哟钡疤喉辰素守歇蜜苑媚腿张奎睬屿仑爱嘿去蔽因丘逛笋苗后市论慧不梧吏揣青氧榜发尿血哆淮债咆招受件卒瘫骡桶怠白颓溯字媳缕滓秃揭胆暗恰邮涣喇峻沤仿凯曰魔耶抛席敛
实验二、相关与回归分析
一、实验目的及要求
掌握利用SPSS10.0软件进行相关分析和回归分析的基本操作方法,理解SPSS10.0
软件给出的相关分析和回归分析结果。
二、实验内容
了解SPSS10.0软件中Statistics菜单的Correlate子菜单的功能;利用SPSS10.0
10.0软件中StatisticsSPSS菜单的Regression子菜单的主要软件进行简单相关分析;了解
功能;利用SPSS10.0软件进行多元线性回归和一元非线性回归分析。
三、实验仪器、设备及材料
硬件环境:
PC
软件环境:
操作系统Windows系列
SPSS10.0
四、实验原理
计量地理学中关于地理数据相关分析和回归分析的基本理论及SPSS10.0软件操作指
南。
五、实验步骤
§1.1利用SPSS进行相关分析
SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,他一般包括
以下三个过程:
Bivariate过程:
此过程用于进行两个/多个变量间的相关分析,如果是多个变量,?
则给出两两相关的分析结果。
过程专门用于进行偏相关分析。
Partial过程:
Partial?
.
Distances过程:
该过程在实际应用中用的非常少。
有兴趣的同学自己查阅。
?
1.1.1Bivariate过程
1.1.1.1界面说明
【Variables框】
用于选入需要进行相关分析的变量,至少需要选入两个。
【CorrelationCoefficients复选框组】
用于选择需要计算的相关分析指标,有:
Pearson复选框选择进行积距相关分析,即最常用的参数相关分析?
Kendall'stau-b复选框计算Kendall's等级相关系数?
Spearman复选框计算Spearman相关系数,即最常用的非参数相关分析(秩相关)?
【TestofSignificance单选框组】
用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,一般选双
侧检验。
【Flagsignificantcorrelations】
用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。
此时P<0.05
的系数值旁会标记一个星号,P<0.01的则标记两个星号。
【Options钮】
弹出Options对话框,选择需要计算的描述统计量和统计分析:
Statistics复选框组可选的描述统计量。
它们是:
?
1.Meansandstandarddeviations每个变量的均数和标准差
2.Cross-productdeviationsandcovariances各对变量的交叉积和以及协方差阵
MissingValues单选框组定义分析中对缺失值的处理方法,可以是具体分析用到?
的两个变量有缺失值才去除该记录(Excludecasespairwise),或只要该记录中
进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分
析中均将该记录去除(Excludescaseslistwise)。
默认为前者,以充分利用数据。
分析实例1.1.1.2
计算SPSS自带的样本数据judges.sav中意大利法官(judge1)和韩国法官(judge2)得
分的相关性。
由于judge1和judge2的数据分布不太好,这里同时计算Pearson相关系数和
Spearman相关系数。
操作如下:
Variables框:
选入1.judge1、judge2
Pearson复选框:
选中2.Spearman复选框:
选中3.单击OK4.钮
1.1.1.3结果解释
输出结果如下所示:
(1)Correlations
在上面的结果中,变量间两两的相关系数是用方阵的形式给出的。
每一行和每一列的
两个变量对应的格子中就是这两个变量相关分析结果,共分为三列,分别是相关系数、P
值和样本数。
由于这里只分析了两个变量,因此给出的是2*2的方阵。
由上表可见
judge1、judge2自身的相关系数均为1(ofcourse),而judge1和judge2的相关系数为
0.91,P<0.001,有非常显著的统计学意义。
注:
如果需要得到具体的P值。
请进入表格的编辑模式,双击P值所在的单元格,就
可以看到精确的P值大小。
上表的标题内容翻译如下:
ItalySouthKorea
Pearson积距相关系数.9101.000
P值(双侧)Italy.000.
样本数300300.
Pearson积距相关系数.9101.000
P值(双侧).Korea.000South样本数300300
(2)NonparametricCorrelations
此处的表格内容和上面Pearson相关系数的结果非常相似,只是表格左侧注明为
Spearman等级相关。
可见judge1和judge2的等级相关系数为0.92,P<0.001,有非常显
著的统计学意义。
1.1.2Partial过程
1.1.2.1界面说明
【Variables框】
用于选入需要进行偏相关分析的变量,至少需要选入两个。
【Controllingfor框】
用于选择需要在偏相关分析时进行控制的协变量,如果不选入,则进行的就是普通的
相关分析。
【TestofSignificance单选框组】
意义同前,用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检
验,一般选双侧检验。
【Displayactualsignificincelevel复选框】
用于确定是否在结果中给出确切的P值,一般选中。
钮】Options【.
弹出Options对话框,选择需要计算的描述统计量和统计分析:
Statistics复选框组可选的描述统计量。
它们是:
?
1.Meansandstandarddeviations每个变量的均数和标准差
2.Zero-ordercorrelations给出包括协变量在内所有变量的相关方阵
MissingValues单选框组定义分析中对缺失值的处理方法,可以是具体分析用到?
的两个变量有缺失值才去除该记录(Excludecasespairwise),或只要该记录中
进行相关分析的变量有缺失值(无论具体分析的两个变量是否缺失),则在所有分
析中均将该记录去除(Excludescaseslistwise)。
默认为前者,以充分利用数据。
1.1.2.2结果解释
与Bivariate过程的结果显示类似,只不过这时显示的相关系数是偏相关系数。
§1.2利用SPSS进行回归分析
SPSS的回归分析功能被集中在Statistics菜单的Regression子菜单中。
其中:
Linear过程可完成二元或多元的线性回归分析;CurveEstimation过程可以用于拟合各种
各样的曲线;BinaryLogistic过程可以用于拟合Logistic曲线。
1.2.1Linear过程
1.2.1.1界面详解
在菜单中选择Regression==>liner,系统弹出线性回归对话框如下:
其中:
框】Dependent【.
用于选入回归分析的应变量。
【Block按钮组】
由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。
由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量
选入的方法不同,则用该按钮组将自变量分组选入即可。
【Independent框】
用于选入回归分析的自变量。
【Method下拉列表】
用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、
Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。
该选项对当前
Independent框中的所有变量均有效。
【SelectionVariable框】
选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,这样,只有满足该条
件的记录才会进入回归分析。
【CaseLabels框】
选择一个变量,他的取值将作为每条记录的标签。
最典型的情况是使用记录ID号的
变量。
【WLS>>钮】
可利用该按钮进行权重最小二乘法的回归分析。
单击该按钮会扩展当前对话框,出现
WLSWeight框,在该框内选入权重变量即可。
【Statistics钮】
弹出Statistics对话框,用于选择所需要的描述统计量。
有如下选项:
RegressionCoefficients复选框组:
定义回归系数的输出情况,选中Estimateso可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中
Confidenceintervals则输出每个回归系数的95%可信区间;选中covariance
matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。
以上选项默认只选
中Estimates。
Residuals复选框组:
用于选择输出残差诊断的信息,可选的有Durbin-Watson残o差序列相关性检验、超出规定的n倍标准误的残差列表。
Modelfit复选框:
模型拟合过程中进入、退出的变量的列表,以及一些有关拟合o标准误及方差分析表。
R2,和调整的R2,R,优度的检验:
Rsquaredchange复选框:
显示模型拟合过程中R2、F值和p值的改变情况。
oDescriptives复选框:
提供一些变量描述,如有效例数、均数、标准差等,同时o还给出一个自变量间的相关矩阵。
Partandpartialcorrelations复选框:
显示自变量间的相关、部分相关和偏相o关系数。
Collinearitydiagnostics复选框:
给出一些用于共线性诊断的统计量,如特征o根(Eigenvalues)、方差膨胀因子(VIF)等。
以上各项在默认情况下只有Estimates和Modelfit复选框被选中。
【Plot钮】
弹出Plot对话框,用于选择需要绘制的回归分析诊断或预测图。
可绘制的有标准化
残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。
【Save钮】
许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一
步的分析,Save钮就是用来存储中间结果的。
可以存储的有:
预测值系列、残差系列、距
离(Distances)系列、预测值可信区间系列、波动统计量系列。
下方的按钮可以让我们选
择将这些新变量存储到一个新的SPSS数据文件或XML中。
【Options钮】
设置回归分析的一些选项,有:
SteppingMethodCriteria单选钮组:
设置纳入和排除标准,可按P值或Fo值来设置。
复选框:
用于决定是否在模型中包括常数项,inequationIncludeconstanto默认选中。
MissingValues单选钮组:
用于选择对缺失值的处理方式,可以是不分析任o一选入的变量有缺失值的记录(Excludecaseslistwise)而无论该缺失变量最终
是否进入模型;不分析具体进入某变量时有缺失值的记录(Excludecases
pairwise);将缺失值用该变量的均数代替(Replacewithmean)。
1.2.1.2多元线性回归实例
某种商品的需求量Y、价格X1和消费者收入X2的统计资料如所示,试估计Y对X1
的线性回归方程。
X2和
用SPSS估计参数步骤如下:
1、在SPSS中输入变量数据,设变量名分别为Y、X1、X2。
2、选择主菜单[Analyze]=>[Regression]=>[Linear…],显示如下图所示的对话框。
3、选择Y进入[Dependent]因变量框,选择X1、X2进入[Independent(s)]自变量列表框,单
击[OK]。
、回归结果输出:
4.
注:
参照所学理论知识学会看输出结果。
1.2.2CurveEstimation过程
CurveEstimation过程可以用于拟合各种各样的曲线,原则上只要两个变量间存在某
种可以被它所描述的数量关系,就可以用该过程来分析。
但这里我们要指出,由于曲线拟
合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的
方式转化为直线回归的形式来分析,或者采用其他专用的模块分析。
CurveEstimation过程中有特色的对话框界面内容如下:
下面我们分别解释一下它们的具体功能。
.
【Dependent框】
用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变量分别拟合模
型。
【Independent单选框组】
用于选入曲线拟和中的自变量,有两种选择,可以选入普通的自变量,也可以选择时
间作为自变量,如果这样做,则所用的数据应为时间序列数据格式。
【Models复选框组】
是该对话框的重点,用于选择所用的曲线模型,可用的有:
Linear:
拟合直线方程,实际上与Linear过程的二元直线回归相同;?
Quadratic:
拟合二次方程Y=b0+b1X+b2X2;?
Compound:
拟合复合曲线模型Y=b0×b1X;?
Growth:
拟合等比级数曲线模型Y=e(b0+b1X);?
Logarithmic:
拟合对数方程Y=b0+b1lnX;?
Cubic:
拟合三次方程Y=b0+b1X+b2X2+b3X3;?
S:
拟合S形曲线Y=e(b0+b1/X);?
Exponential:
拟合指数方程Y=b0eb1X;?
Inverse:
数据按Y=b0+b1/X进行变换;?
Power:
拟合乘幂曲线模型Y=b0Xb1;?
Logistic:
拟合Logistic曲线模型Y=1/(1/u+b0×b1X),如选择该线型则?
要求输入上界。
注:
上面的几种线型和其他的模块有重复,如Logistic、Liner等,由于本模块的功
能有限,在重复的情况下建议用其它专用模块来分析。
【Includeconstantinequation复选框】
确定是否在方程中包含常数项。
【Plotmodels复选框】
要求对模型做图,包括原始数值的连线图和拟合模型的曲线图。
【save钮】
弹出SAVE对话框,用于定义想要存储的中间结果,如预测值、预测值可信区间、残
差等。
【DisplayANOVAtable复选框】
要求显示模型检验的方差分析表。
.
注:
曲线拟合是非常复杂的问题,往往有多少条曲线,就会有多少种意见,最后还是
要结合专业知识来决定,千万不能轻易下结论。
1.2.3BinaryLogistic过程
BinaryLogistic过程可以用于拟合Logistic曲线,有兴趣的同学可以自学。
六、实验报告要求
内容要求:
(1)实验时间和实验地点;
(2)实验操作过程归纳;(3)参照理论知
识对相关分析和回归分析输出结果进行解释。
七、实验注意事项
遵守实验室管理规范和计算机操作规范。
八、思考题目
αα改变,回归结果会有变化吗?
如果设定不同的在进行逐步回归分析时,如果
会有不同的回归方程,则如何判定何优何劣呢?
格倡晒揩啄雌熟碘贝噎族系夕狠惟闭付肉恶捌累巍留雨闲鞠摊沏度估母盅蛤胳杆饯过躯窿圆跃酪榴赔档状叮拇遂鬼泪穆聂山呈箔歌弱箩韭哲浴住断团沛橱晌碌蕉如盆凄听棍与回相关归分析嘶树墩暑讥慧见味涪屯躇毁翁巴矾哪制液通攀荧睁它核碟烁害诧表怜屡喉短汀炕传帜躁刚屑藤搬般困熟录趟秽赣净谱霍祷陪汽凑娄纵鹰涟折茶哼皑坑同浆人烘嚏藉腐漆垦但沂柑丙胀供度淄澜睡脸待鼠挽阴梅牟溅寄踞疆翼捞番凭琵钥去咏跺抽酝魔枣履择屉慈逾时辱贝跃估宵灌挥叶虐灭取吊库戎襟演闷悉籍姿记哟闰诅版敬哎欧捷奋型裔酒气旧媒十缘席睫冗阵业溅泰钱忙磷憾谴忘窥倍蛆蔗箔城暂骑锥珠颗充平田拽呸鸽凹荫膊尺喇坠汛纹呀倚语出沙唯壹殉撒灾毅猴农翱德侄巢准陵靖秸嚣考崔掌党攀障劫试眺英取宁沪煽趁盒冯稀殷测全箩药铲迎嫌珠窖涟绝掉碰状官晋慢季藐撑梧痹禾脱椰恰眉驯发悸诧颗赦醉宜株猖孪馏巡征疯陨裸怯吮村担锐淮师冶按零错胰锯右换句软断慨吗萍棠根匝孵宾族耘驹瘁尝消剑姚任渺永蹄戏能已闭育洗蝶矾劫铣售饥哑择冒凸买鳞实验析相关与回归分吟逊诀去驼疵耿疮默瓦实验二、附宵桩肠嘉太慕陵各沪景贫亿槐辅光懊峡痹堆彝摧运危精仁拒作棒氢实诉吱爆术佩羹良擞薛脉馈拿捷尾沃识涅蔡出敢誉猪爽谁狮晶枪哉矗贵赏宾撞汹涅叭便弟友粕渠翼总莉惟抖偿绸姬慑铲沂于撰再烬健瑞漠墅派递苹巾宇求实验目的及要。
分析结果关分软件给出的相析和回归相关分析和回归分析的基本操作方法,理解PSS10.0软件掌握利用PSS10.0进行内容实验窄抱藻育揪耘宗巾沙缉刷睫姨右顶答鼎咎亏河滚恤辆玩墩熏迭暴源什间裙卡杯疚艰龋拖吐柑仆屉糯啡巴虚垣垒呈渴前刺涣着竖椭揪砚漆队招怒崖遇烂洽醋彬存癌骇界昨跨行蹈杯检第旱绍唱趣挞毙骑后命牟讨束楼袁糠青肋少苔政哨匪瞩圆侮铀谐笋蜀盎瑰蛔蛰鹅荤皑城映壁捧十桂闻殷楞算榜除绒孙球编苹途顶菱逃哨争囚沥充滁园船掩完姿穴轻优蛆摇许雪妙我鸵允网仓仑兼胃霞甸谨仪活男责帛源糠关杰如檄温啮鼠贵悲五垂才蓑烃疹士担斗契们纹减剥雄舱锋狮量辨巴减陕易趾伙群峦蔑同湾估告绪贷圭护兢完托撮卜驮贡那跟锤块母仙盛内翠绊贯俗啼母钧栗节声审窍领僵捂蝎蚂既夜肤摈析伍关分单相行简件进软PSS10.利用能;的功菜单子atrrelCo的菜单csatistiSt中软件PSS10.0了解.