spss回归分析18页精选文档.docx

上传人:b****3 文档编号:4741151 上传时间:2022-12-08 格式:DOCX 页数:24 大小:72.05KB
下载 相关 举报
spss回归分析18页精选文档.docx_第1页
第1页 / 共24页
spss回归分析18页精选文档.docx_第2页
第2页 / 共24页
spss回归分析18页精选文档.docx_第3页
第3页 / 共24页
spss回归分析18页精选文档.docx_第4页
第4页 / 共24页
spss回归分析18页精选文档.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

spss回归分析18页精选文档.docx

《spss回归分析18页精选文档.docx》由会员分享,可在线阅读,更多相关《spss回归分析18页精选文档.docx(24页珍藏版)》请在冰豆网上搜索。

spss回归分析18页精选文档.docx

spss回归分析18页精选文档

第八章回归分析 

唐宋或更早之前,针对“经学”“律学”“算学”和“书学”各科目,其相应传授者称为“博士”,这与当今“博士”含义已经相去甚远。

而对那些特别讲授“武事”或讲解“经籍”者,又称“讲师”。

“教授”和“助教”均原为学官称谓。

前者始于宋,乃“宗学”“律学”“医学”“武学”等科目的讲授者;而后者则于西晋武帝时代即已设立了,主要协助国子、博士培养生徒。

“助教”在古代不仅要作入流的学问,其教书育人的职责也十分明晰。

唐代国子学、太学等所设之“助教”一席,也是当朝打眼的学官。

至明清两代,只设国子监(国子学)一科的“助教”,其身价不谓显赫,也称得上朝廷要员。

至此,无论是“博士”“讲师”,还是“教授”“助教”,其今日教师应具有的基本概念都具有了。

回归分析是处理两个及两个以上变量间线性依存关系的统计方法。

在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。

回归分析就是用于说明这种依存变化的数学关系。

宋以后,京师所设小学馆和武学堂中的教师称谓皆称之为“教谕”。

至元明清之县学一律循之不变。

明朝入选翰林院的进士之师称“教习”。

到清末,学堂兴起,各科教师仍沿用“教习”一称。

其实“教谕”在明清时还有学官一意,即主管县一级的教育生员。

而相应府和州掌管教育生员者则谓“教授”和“学正”。

“教授”“学正”和“教谕”的副手一律称“训导”。

于民间,特别是汉代以后,对于在“校”或“学”中传授经学者也称为“经师”。

在一些特定的讲学场合,比如书院、皇室,也称教师为“院长、西席、讲席”等。

第一节Linear过程 

课本、报刊杂志中的成语、名言警句等俯首皆是,但学生写作文运用到文章中的甚少,即使运用也很难做到恰如其分。

为什么?

还是没有彻底“记死”的缘故。

要解决这个问题,方法很简单,每天花3-5分钟左右的时间记一条成语、一则名言警句即可。

可以写在后黑板的“积累专栏”上每日一换,可以在每天课前的3分钟让学生轮流讲解,也可让学生个人搜集,每天往笔记本上抄写,教师定期检查等等。

这样,一年就可记300多条成语、300多则名言警句,日积月累,终究会成为一笔不小的财富。

这些成语典故“贮藏”在学生脑中,自然会出口成章,写作时便会随心所欲地“提取”出来,使文章增色添辉。

8.1.1主要功能

调用此过程可完成二元或多元的线性回归分析。

在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:

逐步法、向前法、向后法,等)。

8.1.2实例操作

[例8.1]某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。

试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。

儿童编号

体表面积(Y)

身高(X1)

体重(X2)

1

2

3

4

5

6

7

8

9

10

5.382

5.299

5.358

5.292

5.602

6.014

5.830

6.102

6.075

6.411

88.0

87.6

88.5

89.0

87.7

89.5

88.8

90.4

90.6

91.2

11.0

11.8

12.0

12.3

13.1

13.7

14.4

14.9

15.2

16.0

8.1.2.1数据准备

激活数据管理窗口,定义变量名:

体表面积为Y,保留3位小数;身高、体重分别为X1、X2,1位小数。

输入原始数据,结果如图8.1所示。

 

图8.1原始数据的输入

8.1.2.2统计分析

激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框(如图8.2示)。

从对话框左侧的变量列表中选y,点击Ø钮使之进入Dependent框,选x1、x2,点击Ø钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:

Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。

本例选用Enter法。

点击OK钮即完成分析。

 

图8.2线性回归分析对话框

用户还可点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;点击Plots...钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图);点击Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预测值和标准化Y预测值作保存);点击Options...钮选择变量入选与剔除的α、β值和缺失值的处理方法。

8.1.2.3结果解释

在结果输出窗口中将看到如下统计数据:

****MULTIPLEREGRESSION****

 

ListwiseDeletionofMissingData

EquationNumber1DependentVariable..Y

BlockNumber1.Method:

EnterX1X2

 

Variable(s)EnteredonStepNumber

1..X2

2..X1

 

MultipleR.94964

RSquare.90181

AdjustedRSquare.87376

StandardError.14335

AnalysisofVariance

DFSumofSquaresMeanSquare

Regression21.32104.66052

Residual7.14384.02055

F=32.14499SignifF=.0003

 

------------------VariablesintheEquation------------------

VariableBSEBBetaTSigT

X1.068701.074768.215256.919.3887

X2.183756.056816.7576603.234.0144

(Constant)-2.8564766.017776-.475.6495

 

EndBlockNumber1Allrequestedvariablesentered.

 

结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。

回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。

回归方程为Y=0.0687101X1+0.183756X2-2.856476。

本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库。

系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏),详见图8.3。

 

图8.3计算结果的保存

本例还要求对标准化Y预测值作变量分布图,系统将绘制的统计图送向ChartCarousel窗口,双击该窗口可见下图显示结果。

 

图8.4对标准化Y预测值所作的正态分布图

第二节CurveEstimation过程

8.2.1主要功能

调用此过程可完成下列有关曲线拟合的功能:

1、Linear:

拟合直线方程(实际上与Linear过程的二元直线回归相同,即Y=b0+b1X);

2、Quadratic:

拟合二次方程(Y=b0+b1X+b2X2);

3、Compound:

拟合复合曲线模型(Y=b0×b1X);

4、Growth:

拟合等比级数曲线模型(Y=e(b0+b1X));

5、Logarithmic:

拟合对数方程(Y=b0+b1lnX)

6、Cubic:

拟合三次方程(Y=b0+b1X+b2X2+b3X3);

7、S:

拟合S形曲线(Y=e(b0+b1/X));

8、Exponential:

拟合指数方程(Y=b0eb1X);

9、Inverse:

数据按Y=b0+b1/X进行变换;

10、Power:

拟合乘幂曲线模型(Y=b0Xb1);

11、Logistic:

拟合Logistic曲线模型(Y=1/(1/u+b0×b1X)。

 

8.2.2实例操作

[例8.2]某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试拟合对数曲线。

年龄(岁)

X

锡克试验阴性率(%)

Y

1

2

3

4

5

6

7

57.1

76.0

90.9

93.0

96.7

95.6

96.2

8.2.2.1数据准备

激活数据管理窗口,定义变量名:

锡克试验阴性率为Y,年龄为X,输入原始数据。

8.2.2.2统计分析

激活Statistics菜单选Regression中的CurveEstimation...项,弹出CurveEstimation对话框(如图8.5示)。

从对话框左侧的变量列表中选y,点击Ø钮使之进入Dependent框,选x,点击Ø钮使之进入Indepentdent(s)框;在Model框内选择所需的曲线模型,本例选择Logarithmic模型(即对数曲线);选Plotmodels项要求绘制曲线拟合图;点击Save...钮,弹出CurveEstimation:

Save对话框,选择Predictedvalue项,要求在原始数据库中保存根据对数方程求出的Y预测值,点击Continue钮返回CurveEstimation对话框,再点击OK钮即可。

 

图8.5曲线拟合对话框

8.2.2.3结果解释

在结果输出窗口中将看到如下统计数据:

ndependent:

X

DependentMthRsqd.f.FSigfb0b1

YLOG.913552.32.00161.325920.6704

 

在以X为自变量、Y为应变量,采用对数曲线拟合方法建立的方程,决定系数R2=0.913(接近于1),作拟合优度检验,方差分析表明:

F=52.32,P=0.001,拟合度很好,对数方程为:

Y=61.3259+20.6704lnX。

本例要求绘制曲线拟合图,结果如图8.6所示。

 

图8.6对数曲线拟合情形

根据方程Y=61.3259+20.6704lnX,将原始数据X值代入,求得Y预测值(变量名为fit_1)存入数据库中,参见图8.7。

 

图8.7计算结果的保存

第三节Logistic过程 

8.3.1主要功能

调用此过程可完成Logistic回归的运算。

所谓Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中经常遇到,如:

死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严重程度有关;对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。

此类问题的解决均可借助逻辑回归来完成。

特别指出,本节介绍的Logistic过程,应与日常所说的Logistic曲线模型(即S或倒S形曲线)相区别。

用户如果要拟合Logistic曲线模型,可调用本章第二节CurveEstimation过程,系统提供11种曲线模型,其中含有Logistic曲线模型(参见上节)。

在一般的多元回归中,若以P(概率)为应变量,则方程为P=b0+b1X1+b2X2+…+bkXk,

但用该方程计算时,常会出现P>1或P<0的不合理情形。

为此,对P作对数单位转换,即logitP=ln(P/1-P),于是,可得到Logistic回归方程为:

eb0+b1X1+b2X2+…+bkXk

P=———————————

1+eb0+b1X1+b2X2+…+bkXk

8.3.2实例操作

[例8.3]某医师研究男性胃癌患者发生术后院内感染的影响因素,资料如下表,请通过Logistic回归统计方法对主要影响因素进行分析。

术后感染

(有无)

Y

年龄

(岁)

X1

手术创伤程度

(5等级)

X2

营养状态

(3等级)

X3

术前预防性抗菌

(有无)

X4

白细胞数

(×109/L)

X5

癌肿病理分度

(TNM得分总和)

X6

69

72

57

41

32

65

58

54

55

59

64

36

42

48

50

4

5

3

1

1

3

3

4

2

1

2

1

3

4

1

2

3

2

1

1

3

2

2

2

1

2

1

1

2

2

5.6

4.4

9.7

11.2

10.4

7.0

3.1

6.6

7.9

6.0

9.1

8.4

5.3

4.6

12.8

9

6

4

5

5

5

6

6

7

4

6

8

6

5

4

8.3.2.1数据准备

激活数据管理窗口,定义变量名:

术后感染为Y(字符变量,有输入Y、无输入N),年龄为X1,手术创伤程度为X2,营养状态为X3,术前预防性抗菌为X4(字符变量,有输入Y、无输入N),白细胞数为X5,癌肿病理分度为X6。

按要求输入原始数据。

8.3.2.2统计分析

激活Statistics菜单选Regression中的Logistic...项,弹出LogisticRegression对话框(如图8.8示)。

从对话框左侧的变量列表中选y,点击Ø钮使之进入Dependent框,选x1、x2、x3、x4、x5和x6,点击Ø钮使之进入Covariates框;点击Method处的下拉按钮,系统提供7种方法:

 

图8.8逻辑回归对话框

1、Enter:

所有自变量强制进入回归方程;

2、Forward:

Conditional:

以假定参数为基础作似然比概率检验,向前逐步选择自变量;

3、Forward:

LR:

以最大局部似然为基础作似然比概率检验,向前逐步选择自变量;

4、Forward:

Wald:

作Wald概率统计法,向前逐步选择自变量;

5、Backward:

Conditional:

以假定参数为基础作似然比概率检验,向后逐步选择自变量;

6、Backward:

LR:

以最大局部似然为基础作似然比概率检验,向后逐步选择自变量;

7、Backward:

Wald:

作Wald概率统计法,向后逐步选择自变量。

本例选用Forward:

Conditional法,以便选择有主要作用的影响因素;点击Options...钮,弹出LogisticRegression:

Options对话框,在Display框中选取Atlaststep项,要求只显示最终计算结果,点击Continue钮返回LogisticRegression对话框,再点击OK钮即可。

8.3.2.3结果解释

在结果输出窗口中将看到如下统计数据:

DependentVariableEncoding:

OriginalInternal

ValueValue

y0

n1

 

Parameter

ValueFreqCoding

(1)

X4n51.000

y10-1.000

 

系统先对字符变量进行重新赋值,对于应变量Y,回答是(Y)的赋值为0,回答否(X)的赋值为1;对于应变量X4,回答是(Y)的赋值为-1,回答否(X)的赋值为1。

DependentVariable..Y

BeginningBlockNumber0.InitialLogLikelihoodFunction

-2LogLikelihood19.095425

*Constantisincludedinthemodel.

 

BeginningBlockNumber1.Method:

ForwardStepwise(COND)

Improv.ModelCorrect

StepChi-Sq.dfsigChi-Sq.dfsigClass%Variable

18.5101.0048.5101.00480.00IN:

X3

26.7661.00915.2762.00093.33IN:

X6

 

Nomorevariablescanbedeletedoradded.

 

EndBlockNumber1PIN=.0500Limitsreached.

FinalEquationforBlock1

 

Estimationterminatedatiterationnumber12because

LogLikelihooddecreasedbylessthan.01percent.

-2LogLikelihood3.819

GoodnessofFit3.000

 

Chi-SquaredfSignificance

ModelChi-Square15.2762.0005

Improvement6.7661.0093

 

ClassificationTableforY

Predicted

ynPercentCorrect

y|n

Observed+———+———+

yy|4|1|80.00%

+———+———+

nn|0|10|100.00%

+———+———+

Overall93.33%

 

----------------------VariablesintheEquation-----------------------

VariableBS.E.WalddfSigRExp(B)

X3-30.5171298.0526.01051.9184.0000.0000

X6-10.2797107.9559.00911.9241.0000.0000

Constant123.40531155.1065.01141.9149

 

结果表明,第一步自变量X3入选,方程分类能力达80.00%;第二步自变量X6入选,方程分类能力达93.33%(参见结果中的分类分析表);方程有效性经χ2检验,χ2=15.276,P=0.0005。

Logistic回归的分类概率方程为:

e123.4053-30.5171X3-10.2797X6

P=——————————————

1+e123.4053-30.5171X3-10.2797X6

根据该方程,若一胃癌患者营养状态评分(X3)为3,癌肿病理分度(X6)为9,则其P=4.5×10-27≈0,这意味着术后将发生院内感染;另一胃癌患者营养状态评分(X3)为1,癌肿病理分度(X6)为4,则其P=0.98105≈1,这意味着术后将不会发生院内感染。

第四节Probit过程 

8.4.1主要功能

调用此过程可完成剂量-效应关系的分析。

通过概率单位使剂量-效应的S型曲线关系转化成直线,从而利用回归方程推算各效应水平的相应剂量值。

8.4.2实例操作

[例8.4]研究抗疟药环氯胍对小白鼠的毒性,试验结果如下表所示。

试计算环氯胍的半数致死剂量。

 

剂量(mg/kg)

动物数

死亡数

12

9

7

6

5

4

3

5

7

19

34

38

12

5

5

6

11

17

12

2

0

8.4.2.1数据准备

激活数据管理窗口,定义变量名:

剂量为DOSE、试验动物数为OBSERVE、死亡动物数为DEATH。

然后输入原始数据。

8.4.2.2统计分析

激活Statistics菜单选Regression中的Probit...项,弹出ProbitAnalysis对话框(如图8.9示)。

从对话框左侧的变量列表中选death,点击Ø钮使之进入ResponseFrequency框;选observe,点击Ø钮使之进入TotalObserved框;选dose,点击Ø钮使之进入Covariate(s)框,并下拉Transform菜单,选Logbase10项(即要求对剂量进行以10为底的对数转换)。

 

图8.9剂量-效应关系分析对话框

系统在Model栏中提供两种模型,一是概率单位模型(Probit),另一是比数比自然对数模型(Logit)。

本例选用概率单位模型。

点击Options...钮,弹出ProbitAnalysis:

Options对话框,在NaturalResponseRate栏选Calculatefromdata项,要求计算各剂量组的实际反应率。

之后点击Continue钮返回ProbitAnalysis对话框,再点击OK钮即可。

8.4.2.3结果解释

在结果输出窗口中将看到如下统计数据:

系统首先显示,共有7组原始数据采概率单位模型进行分析。

回归方程的各参数在经过14次叠代运算后确定,即PROBIT=5.95215-4.66313X。

该方程拟合优度χ2检验结果,χ2=0.833,P=0.934,拟合良好。

DATAInformation

7unweightedcasesaccepted.

0casesrejectedbecauseofmissingdata.

0casesareinthecontrolgroup.

0casesrejectedbecauseLOG-transformcan'tbedone.

MODELInformation

ONLYNormalSigmoidisrequested.

 

NaturalResponseratetobeestimated

 

CONTROLgroupisnotprovided.

 

Parameterestimatesconvergedafter14iterations.

Optimalsolutionfound.

 

ParameterEstimates(PROBITmodel:

(PROBIT(p))=Intercept+BX):

 

RegressionCoeff.StandardErrorCoeff./S.E.

DOSE5.952152.398322.48180

 

InterceptStandardErrorIntercept/S.E.

-4.663132.19942-2.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 商业计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1