SPSS使用方法速查.docx

上传人:b****5 文档编号:3631516 上传时间:2022-11-24 格式:DOCX 页数:11 大小:100.40KB
下载 相关 举报
SPSS使用方法速查.docx_第1页
第1页 / 共11页
SPSS使用方法速查.docx_第2页
第2页 / 共11页
SPSS使用方法速查.docx_第3页
第3页 / 共11页
SPSS使用方法速查.docx_第4页
第4页 / 共11页
SPSS使用方法速查.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

SPSS使用方法速查.docx

《SPSS使用方法速查.docx》由会员分享,可在线阅读,更多相关《SPSS使用方法速查.docx(11页珍藏版)》请在冰豆网上搜索。

SPSS使用方法速查.docx

SPSS使用方法速查

SPSS方法简介

自由度:

自由度(degreeoffreedom,df)在数学中能够自由取值的变量个数,如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。

在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。

通常df=n-k。

其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。

自由度通常用于抽样分布中。

0.Spss的适用范围

1)统计描述

运用适宜的统计指标、统计表、统计图等方法,对研究对象(变量)的分布类型和数量特征进行展示的过程,通过统计描述可以研究对象的基本特征。

2)概率分布

随机变量:

变异现象在生物界普遍存在,这种变异现象表现在人体某一具体指标或变量上,就是其数值的变化,测量前的不可预知性,这种变量叫随机变量

频数分布表和分布图描述了某一随机变量的经验分布,这是针对样本资料来透视数据的分布特征。

由于抽样的随机性,样本的经验分布会随着样本的不同而变化。

当样本扩展到总体时,随机变量的总体分布即为概率分布。

变量值的常见总体分布有正态分布、二项分布和Poisson分布,常见的抽样分布有t分布、F分布和x2分布,本质上这两种分布都是概率分布。

3)参数估计与假设检验

统计推断是根据样本提供的信息,以一定的概率对总体的分布及其特征作推断,常包含参数估计和假设检验。

参数估计是指由样本统计量估计总体参数;假设检验是指对所估计的总体的首先提出某种假设,然后根据随机样本信息及抽样误差理论,应用小概率反证法逻辑思维推断某种假设可被接受或拒绝的统计检验方法。

4)t检验

T检验是以t分布为基础,是数值资料中常用的假设检验方法主要用于两个均数的比较。

理论上,t检验的应用条件要求样本来自正态分布总体,随机样本且总体方差齐性。

当样本含量(确切讲是自由度)较大时,t分布近似于正态分布,可用u检验(又称z检验),此情况下t检验等价于u检验。

5)方差分析

对于多个样本均数的比较,需用方差分析,多样本均数的比较不能反复使用t检验的原因是会增大I性错误的概率。

6)双变量相关与回归分析

变量之间的关系有确定性关系(函数关系)和非确定性关系(随机性关系)。

确定性关系是指对于一个变量的每个可能取值,另外的变量都有完全确定的值与之对应;非确定性关系是指变量间的关系不确定,如人的身高与体重、胰岛素与血糖、年龄与血压、吸烟与肺癌、体温与脉搏等,这些变量间关系密切,但不能由一个或几个变量的值精确求出另一个变量的值。

回归与相关(regressionandcorrelation)是研究变量间非确定关系的统计方法。

7)x2检验

即卡方检验,是以x2分布为理论基础的统计方法,主要包含两个样本率或构成比、多个样本率或构成比之间的差别有无统计学意义及多重比较、两个分类变量之间的关联分析、频数分布拟合忧度的x2检验。

8)基于秩次的非参数检验

假设检验分为参数检验(parametrictest)和非参数检验。

参数检验是以特定的总体分布(如正态分布)为前提,对未知的总体参数(如u或π)进行推断的假设检验方法。

但有时候总体分布不易判定,参数检验的条件得不到满足,在这种情况下,可以采用非参数检验的方法。

非参数检验是参数检验方法的有效补充,它并不依赖于总体分布类型,不检验总体的参数,而是对总体的分布或分布位置进行检验。

9)协方差分析

方差分析要求各比较组除所施加的处理因素不同,其它对观察指标有影响的因素要求固定在同一个水平上。

但有时是的处理因素对观察指标产生了影响,在直接分析观察指标建的差异则不满足方差分析对处理因素的要求。

比如降糖药物临床疗效研究中,试验后的血糖值是评价药物疗效的一个重要指标,但试验后的血糖值受试验前血糖值影响,实验前后的血糖值间存在一定的线性关系,试验前的血糖值是难以控制,如果直接分析试验后的血糖值间的差异来评价药物的降糖疗效不恰当,这里必须扣除或均衡不可控制因素(试验前的血糖值的影响),故考虑应用协方差分析。

10)多重线性回归分析

一个应变量与多个自变量之间依存关系的统计方法。

多重线性回归分析要求应变量是服从正态分布的连续性数值变量。

11)Logistic回归分析

应变量是分类变量(包括二分类和多分类)的资料,如治愈与未治愈,生存与死亡,发病与未病,疗效评价分显效、好转、无效等。

这类资料,由于应变量是分类变量不具有连续性和正态性,直接用一般多重线性回归分析是不妥的,可用logistic回归分析。

适用于应变量为分类变量的回归分析。

12)生存分析

应用于社会科学和自然科学领域具有不完全数据的事件分析,如设备的失效、疾病的发生、患者康复或复发等,另外还有可靠性分析和失效时间分析。

13)聚类分析和判别分析

都是研究事物分类的统计学方法。

聚类分析是在事物分类面貌尚不清查,甚至连总共分几类也不确定的情况讨论事物的分类问题,是“无法可循”的方法;

判别分析是根据已知其类别的样品,总结出类别的判别方法,用以判断未知类别的新样品的类别,是“有法可依”的方法。

14)主成分与因子分析

旨在浓缩数据或简化数据,即以最少的信息丢失为代价将众多的观测变量浓缩为少数几个因素,从而提炼问题,或发现事物的内在联系。

主成分分析和因子分析是最为常用的数据简化方法,用于考察多个变量的内在结构,或者提取数据的主要信息。

15)Meta分析

对已有研究结果进行二次定量综合分析与评价,是现代循证医学产生最佳证据的重要方法。

1.Spss软件中常见的累积概率分布函数和密度函数

函数形式

函数说明

累积分布函数(cumulativedistributionfunctions,CDF)

CDFNORM(zvalue)

返回标准正态分布的累计概率值

CDF.NORMAL(quant,mean,stddev)

返回任意给定的正态分布的累计概率值

CDF.BINOM(quant,n,prob)

返回任意给定的二项分布的累计概率值

CDF.POISSON(quant,mean)

返回任意给定的Poisson分布的累计概率值

CDF.T(quant,df)

返回任意给定自由度的t分布的累计概率值

CDF.CHISQ(quant,df)

返回任意给定自由度的x2分布的累计概率值

CDF.F(quant,df1,df2)

返回任意给定自由度的F分布的累计概率值

CDF.UNIFORM(quant,min,max)

返回任意给定参数的均匀分布的累计概率值

概率密度函数(probabilitydensityfunctions,PDF)

PDF.NORMAL(quant,mean,stddev)

返回任意给定的正态分布的概率密度值

PDF.BINOM(quant,n,prob)

返回任意给定的二项分布的概率密度值

PDF.POISSON(quant,mean)

返回任意给定的Poisson分布的概率密度值

NPDF.T(quant,df,nc)

返回任意给定自由度的t分布的概率密度值

PDF.CHISQ(quant,df)

返回任意给定自由度的x2分布的概率密度值

PDF.F(quant,df1,df2)

返回任意给定自由度的F分布的概率密度值

2.累计函数和密度函数

transform->computevariable->写目标变量的名字,然后找合适的函数,填入适当参数即可。

3.求可信区间

输入变量值-〉analyze->descriptivestatistics->explore->选择求值变量-〉dipendent-〉statistics->descriptive->continue->ok

1)求T界值(T分布函数的逆函数)

T分布函数(跟累计函数和密度函数路径一致)CDF.T(q,a)=p(0<=p<=1,a>0,a为自由度)

其逆函数IDF.T(p,a),将会返回q值。

比如求双侧检验自由度为8的t界值t0.05/2,8,赋值为t=IDF.T(0.975,8),得t0.05/2,8=2.30600,假定求单侧检验t界值t0.05,8,则赋值为t=IDF.T(0.95,8),得t0.05,8=1.85955

2)正态性检验(分布检验,不适合样本太小时)

Analyze-〉descriptivestatistics->explore->(需检测正态性的变量)-〉dependent->plots->stem-and-leaf,histogram,normalityplotswithtests->continue-ok

可以得出:

基本统计描述指标、偏度系数和峰度系数及其标准误、Kolomogorov-Smirnov(即D法)与Shapiro-Wilk(即W法)的检验统计量与对应的P值、Q-Q图与去势的正态Q-Q图、箱图等。

另外,还可以由anaylyze->descriptivestatistics->P-PPlots或Q-Qplots或Q-Qplots视窗中,选中normal正态性检验,作P-P图与去势的正态P-P图或Q-Q图与去势的Q-Q图,点击testdistribution下面选框中的下拉键头,选其他分布,可进行对应的分布检验,如选studentt,则进行t分布检验。

3)t检验(Ttest)

{单样本t检验}Analyze->comparemeans->one-sampleTtest->”检查变量”-〉右下test框中修改系统默认值为比较的值

{配对设计t检验-比如治疗前后比较}paired-sampleTtest过程进行配对设计t检验:

analyze->comparemeans->paired-sampletest->”选择配对的两个变量”-〉pairedvairables->ok

{独立样本t检测-比如两组治疗情况对比}analyze->comparemeans->independent-samplesTtest->”分别把检测变量和组别选好”-〉continue->ok

急性黄疸性肝炎患者退黄天数

组别

人数

退黄疸天数

中药组

7

5

10

14

21

17

8

12

对照组

8

18

21

30

23

22

22

29

20

例如:

 

结果:

 

得到t值为4.284,自由度v=n1+n2-2=15-2=13,P=2*[1-CDF.T(3.351,13)]=0.00089(不知道这个P有啥用,跟levene的P啥关系?

),按照a=0.05的水准,若P<=0.05,采用equalvariancesnotassumed(方差不齐)的t检验结果,若P>=0.05,则采用equalvariancesassumed(方差齐)的t’检验结果。

本题levene检验结果:

P=0.486>0.05,所以t=4.284,P=0.001,最终拒绝H0,接受H1,由此推断中药组的退黄天数比对照组少。

4){成组设计两样本几何均数比较的t检验}:

(1)计算变量的对数:

transform->computevariable->targetvariable中输入“比较变量的对数”,选中“比较变量”->numericexpression->ok

(2)频数加权:

data->weightcase->weightcaseby”变量2”->frequency->ok

(3)正态性检验:

analyze->descriptivestatistics->exlpore->”比较变量”->dependent->”组别”->factorlist->plot->stem-and-leaf、histogram、normalityplotswithtests->continue->ok

(4)对数数值的t检验:

analyze->comparemeans->independent-samplettest->“检测变量”->test->”组别”->grouping->definegroups->continue->ok

4.单因素方差分析

Analyze->comparemeans->one-wayANOVA->”检测变量”放入dependentlist,”组别”->factor->options->descriptive、homogeneityofvariance->continue,返回one-wayANOVA->postHoc->LSD、S-N-K->dunnett,在controlgategory->first->continue->OK

5.双(多)因素方差分析

Analyze->generallinearmodel->univariate->”检测变量”放入dependent,“组别”、“区组”放入fixedfactor->mode->custom将“组别”、“区组”->右model框->continue->PostHoc,将factor内的“组别”->posthoctestsfor->LSD、S-N-K、Dunnett,在controlcategory->first->continue->options->ddescriptivestatistics->continue->ok

{多因素}Analyze->generallinearmodel->univariate->选择自变量和因变量->option->displaymeansfor->选中descriptivestatistics

SPSS软件分析没有给出交互作用项各种搭配的均数或合计,所以,在方差分析的基础上,找最佳搭配,非交互作用因素不同水平差别有统计意义,可采用SPSS输出的相应因素不同水平的均数大小,结合专业,来决定取哪个水平。

但有交互作用的因素选哪一个水平,还需要手工计算。

6.相关分析(li0701--03)

直线:

(1)散点图:

graphs->legacydialogs->scatter/dot->simplescatter->define->x,y轴选好->ok

(2)正态性检测

(3)线性相关:

analyze->correlate->bivariate(双变量相关分析)->变量放入variable框->correlationcoefficients->pearson,在testofsignificance下选中two-tailed->ok

秩:

Analyze->correlate->bivariate,”自变量””因变量”->variables,在correlationcoefficients->spearman,在testofsignificance下选中two-tailed->ok

回归分析:

(1)散点图:

graphs->legacydialogs->scatter/dot->simplescatter->define->x,y轴选好->ok

(2)正态性检测

(3)

线性回归:

analyze->regression->linear,”待检测变量”->dependent”因素变量”->independent->statistics,选中estimates,confidenceinteraval,modelfit->continue->save,在predictedvalues-〉unstandardized,在predictioninterval->meanindividual,在residuals下选中standardized->continue->ok

(4)绘制回归直线:

双击散点图,在charteditor->elements->fitlineattotal,在properties->linear->close->点空白区,得回归直线。

在properties中选means或individual,可拟合上反应变量总体均数95%的可信区间变量个体值95%的容许区间带。

1)相关系数r=0.852,决定系数r2=0.726,血糖的变异有72.6%与回归有关,即可由自变量“血清总胆固醇含量”来解释的变异(回归平方和)在血糖的总变异(总平方和)中占72.6%。

2)直线回归的方差分析F=24.233,P=0.001

3)直线回归方程的截距a=3.851,回归系数b=1.555,t检验t=4.923,p=0.001

4)PRE_1为预测值,ZRE_1为标准化残差,LMCI_1和UMCI_1为反应变量总体均数95%的可信区间下限和上限值,LICI_1与UICI_1为反应变量个体值95%的容许区间下限和上限值。

本例中只有第10个标准化残差大于2,x=5.5对应的血糖预测值为12.40337,总体血糖的95%可信区间为(11.56355,13.12635),个体血糖95%的容许区间为(9.83202,14.85788)

7.非线性回归分析+非线性回归方程(li0704)

1)

对“X”作对数变换,transform->computevariable->targetvariable输入新变量“lnX”,numericexpression输入ln(x)->ok,可在数据窗口产生一新变量lnx

2)对“Y”“lnX”作直线回归分析,analyze->regression->liner->”Y”->dependent,”lnX”->independent->ok

结果:

方差分析F=763.499,P=0.00,回归方程成立;t检验:

t=27.631,P=0.000,回归系数有统计学意义,回归方程:

Y=19.745+7.777ln(X)

8.x2检验

1)独立样本x2检验

例如,由组别、疗效、频数三列组成,data->weightcases->by频数->frequency->ok;analyze->descriptivestatistics->crosstabs->组别—rows,疗效—columns->chi-square(卡方)->continue->cells,选中observed、expectde、raw、total->continue->ok

结果:

所有格子的理论频数均〉5(t12=22.8,t22=8.2,如果<5,则用连续性校正continuitycorrection),总例数n=376,所以用不校正的x2检验,pearsonx2=56.772,v=1,p=0.000.(若四格表中n(total)<40或T<1,需用Fisher确切概率法)

2)配对设计假设检验

数据假设以甲法、乙法、频数为变量名,频数加权(data->weightcase),analyze->descriptivestatistics-crosstabs->甲法—row,乙法—column->statistics;选中chi-square、contingencycoefficient、kappa、mcnemar->continue->cell->observed、expected、row、total->continue->ok

结果:

独立性检验pearsonx2=11.096,v=1,p=0.001;列联系数(contingencycoefficient):

rp=0.395,P=0.001;kappa值=0.406,z=3.331,P=0.001;优势性检验(mcnemartest)P=0.031。

结论:

关联性分析认为甲乙两法有关联,但程度不高;一致性检验有统计学意义,程度中等;优势性检验〈0.05,按a=0.05水准拒绝H0,接受H1,两种检验方法总体阳性率差异有统计学意义,结合本例b>c,甲法检查的阳性率高于乙法。

Linear-by-linerassocilation线性趋势检验,spearmancorrelationspearman等级相关系数

3)构成比拟和优度检验

数据以“中医证型”、“例数”,频数加权,analyze->nonparametrictests->chi-squera,”中医证型”->testvariable->ok

4)二项分布拟合优度检验(有问题)

数据以“每户发病人数”、“实际户数”,频数加权,analyze->descriptivestatistics->每户发病数—variable->option,选中mean、sum->continue->ok;transform->computevariable->输入P1,公式PDF.BINOM(每户发病数,3,120,260)

同样实现:

作为理论户数变量T,赋值为260*P1;作为计算卡方统计量的过程变量x,赋值为x=((实际户数-T))**2/T;作为计算卡放统计量的变量xx=485.68+30.45+52.40+9.47;作为卡方检验的变量P=1-CDF.CHISQ(xx,2),这里自由度v=2.

5)CMH统计分析

数据以中心、组别、疗效、频数为变量名,频数加权,analyze->decrisptivestatistics->crosstabs->组别—rows,疗效—column,中心—layer1->statistics->选中chi-square+cochran’sandmantel-haensel>continue->cells->observed,expected,row,total->continue->ok

要跑Frequenciesanalysis,从SPSS菜单选:

Analyze,DescriptiveStatistics

Frequencies...选好一个或几个分析变量.点击Charts.选一个图象类型例如Piecharts,Bar,Histogram,点击Continue.点击OKintheFrequenciesdialogbox.

注意这个程序不但可以用于分类变量也可以是连续变量.但你此时要把频率表去掉不选.办法是和前面一样进入该程序菜单内,选择一个连续变量(例如销售额或广告数目)作分析变量,再把Displayfrequencytables前面的选项去掉变成空白即可.接下来的警告不要管它点击OK就可以.点击Statistics,选Quartiles,Std.deviation,Minimum,Maximum,Mean,Median,Skewness,andKurtosis.点击Continue.点击ChartsintheFrequenciesdialogbox.选Histograms,选Withnormalcurve.点击Continue.点击OKintheFrequenciesdialogbox.

要跑Crosstabsanalysis,从菜单上选Analyze,DescriptiveStatistics,Crosstabs...选好行变量和列变量.如果要看三个变量关系可以加一个Layer变量,点击Statistics,再根据你的变量性质选不同统计值.一般来说不论变量测量尺度如何都要选Chi-square.接下来如果是定类变量还可以选ContingencyCoefficient,PhiandCramer'sV,Lambda,andUncertainty

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 小升初

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1