SPSS在数学建模中的应用PPT文档格式.ppt
《SPSS在数学建模中的应用PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《SPSS在数学建模中的应用PPT文档格式.ppt(89页珍藏版)》请在冰豆网上搜索。
选择“File”菜单的“SaveAs”命令,弹出“SaveDataAs”对话框,可选择保存为Excel(*.xls)等文件格式。
数据编辑,
(1)数据的排序:
DataSortCases
(2)数据的转置:
DataTranspose(3)数据的聚合:
DataAggregateData(4)数据文件的拆分:
DataSplitFile(5)数据文件的合并:
DataMergeFilesAddCases/AddVariables(6)数据的转换:
TransformCompute例2:
数据编辑案例.doc,SPSS调用其他数据文件,按照FileOpenData的顺序选择菜单项,打开“OpenFile”对话框。
可以打开的文件格式除了SPSS(*.sav)外,还包括:
Excel(*.xls)、数据文件(*.dat)和文本文件(*.txt)。
三、SPSS制图主要通过“Graph”菜单中的选项来创建图形。
SPSS在数学建模中的应用.ppt,第二讲方差分析,方差分析是检验多个总体均值之间是否存在显著差异的一种统计方法。
例如,研究不同班级学生的学习成绩是否存在差异。
学习成绩,教学方法,接受能力,心理素质,努力程度,所用教材,例题,根据因素的个数,可以将方差分析分为:
单因素方差分析多因素方差分析单因素方差分析的控制变量只有一个,而控制变量可以有多个观察水平。
例如,在研究教学方法对学习成绩的影响,可以选择多种不同的教学方法进行实验。
如果这些方法之间存在显著的差异性,就可以选择最有效的手段来提高教学水平。
一、单因素方差分析,例如:
把18名学生分为三个等组,各组内学生的能力相当,在三种不同的教学方法下进行相同内容的学习。
其中:
第一组为受表扬组,每次练习后,不管成绩如何,始终受到表扬;
第二组为受训斥组,始终受到训斥;
第三组为对照组,不受任何信息作用。
将三组学生相互隔离,若干天后对他们进行考试,得到每组的学习成绩:
各组的教学效果是否存在差异?
哪种教学效果最好?
单因子方差分析的数据结构,单因素方差分析的步骤,提出假设构造检验的统计量显著性检验得到结论,1、提出假设,在单因素方差分析中,要检验因素A的k个水平(总体)的均值是否相等,因此提出假设的一般形式为:
原假设:
对立假设:
2、构造检验的统计量,由于样本均值可以作为总体均值的估计,所以可以借助样本均值粗略估计一下总体均值的情况。
符号说明:
总样本容量第i水平的样本均值总样本均值,2、构造检验的统计量,当时,有,。
对例子中的数据,由于各组样本容量相等,于是计算得到总样本均值,2、构造检验的统计量,Questions三组的样本均值各不相等,能否说明三组的总体均值有明显差异?
为什么观察值之间存在差异?
这些差异是由哪些原因造成的?
如何来衡量各组之间的差异大小呢?
2、构造检验的统计量,所有观察值几乎各不相等,它们的分散程度可以用总平方和来度量。
观察值之间的差异越大,SST越大。
在单因素实验中,造成观察值差异的原因有两个:
一个是由随机误差引起的,不可避免;
另一个就是由因素的不同水平造成的。
2、构造检验的统计量,我们定义组间平方和来度量各组之间的差异。
定义组内平方和来度量组内随机误差引起的偏差。
可以证明:
2、构造检验的统计量,按照构造统计量的基本原则:
统计量具有一定的实际意义统计量要服从某已知分布可以构造单因素方差分析的统计量:
服从自由度为的F分布。
3、显著性检验,对给定的显著性水平,当时,应拒绝原假设,即认为各水平之间有明显差异;
否则应接受原假设,即认为各水平之间无明显差异。
例题的求解,当时,查F分布表得到,由于,因此应拒绝原假设。
4、SPSS的实现过程,
(1)选择菜单AnalyzeComparemeansOne-WayANOVA,弹出One-WayANOVA对话框。
(2)从左侧列表框中选择观测变量(指标),通过中间的移动按钮移入到右侧的DependentList框内。
(3)从左侧列表框中选择因素变量,通过中间的移动按钮移入到右侧的Factor框内。
(4)依次单击“Contrasts”按钮和“PostHoc”按钮,弹出One-WayANOVA:
Contrasts对话框和One-WayANOVA:
PostHoc对话框,由于这两个对话框太专业,也较少用,此处略。
4、SPSS的实现过程,(5)单击“Options”按钮,弹出One-WayANOVA:
Options对话框。
Statistics项:
选择Descriptive复选项,输出基本描述统计量,其他选项略。
MissingValues项:
定义缺失值的处理方式。
其内容设置与One-SamplesTTest完全相同,此处不再重复。
单击“Continue”按钮,返回到One-WayANOVA对话框。
(6)单击“OK”按钮,即可完成单因素方差分析的操作。
4、SPSS的实现过程,例3:
单因素方差分析.doc,二、双因素方差分析,实际中,有时需要考虑两个因素对实验结果的影响。
例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量。
若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。
对因素A和因素B同时进行分析,就属于双因素方差分析的内容。
双因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。
二、双因素方差分析,双因素方差分析有两种类型:
一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;
另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
1、理论分析,1、理论分析,以下根据平方和分解的思想来给出检验用的统计量的计算公式。
先引入下述记号:
i=1,2,rj=1,2,s,1、理论分析,其中总样本容量n=rsm。
总偏差平方和ST、因素A的效应平方和SA、因素B的效应平方和SB、交互效应平方和SAB以及误差平方和SE的计算公式如下:
1、理论分析,双因素方差分析表,1、理论分析,2、SPSS实现过程,在“Analyze”菜单的“GeneralLinearModel”子菜单中选择“Univariate”。
将观察变量添加到“DependentVariable”框中,将两个控制变量添加到“FixedFactor”框中。
若考虑因子间的交互作用,可单击“Model”按钮,选择“Fullfactorial”;
若不考虑交互作用,则选择“Custom”,再在“BuildTerms”下方选择“MainEffects”。
与单因素方差分析类似,单击“Options”,可以选择是否进行方差相等的检验等。
例4:
双因素方差分析.doc,第三讲相关及回归分析,相关分析与回归分析是处理变量之间关系的一种常用统计方法。
用这种方法可以定量地建立一个变量关于另一个变量或另几个变量的数学表达式(即数学模型),然后利用这种表达式,可以对该变量进行预测或控制。
一、相关分析,相关分析(CorrelationAnalysis)是根据实际观察的数据资料,在具有相关关系的变量之间,对现象之间的依存关系的表现形式和密切程度的研究。
可以用两种方法来表现变量间的相关关系。
一种方法是通过比较直观的散点图来表现,另一种方法是通过相关系数来反映。
通过图形和数值两种方式,能够有效地揭示变量之间的关系的强弱程度。
1、散点图,散点图就是将数据以点的形式画在直角坐标系上,通过点组成的图形来观察两变量之间的相关关系。
具体做法是:
用横坐标代表自变量X,纵坐标代表因变量Y,通过观察或实验我们可以得到若干组数据(xi,yi),将其在平面直角坐标系中用点来表示。
2、相关系数,相关系数是根据样本数据计算的对两个变量之间线性关系强弱的度量值,用r来表示。
若相关系数是根据总体全部数据计算的,则称为总体相关系数,记为。
样本相关系数的计算公式为:
2、相关系数,相关系数的意义:
0r1表示两个变量间存在正线性相关关系。
-1r0表示两个变量间存在负线性相关关系。
r=0表示两个变量间不存在线性相关关系。
|r|=1表示两个变量间存在完全线性相关关系。
|r|越接近于0,表示两个变量间的线性相关程度越低。
|r|越接近于1,表示两个变量间的线性相关程度越高。
2、相关系数,2、相关系数,3、SPSS实现过程,
(1)选择菜单Analyze-Correlate-Bivariate,弹出BivariateCorrelations对话框。
(2)把参加计算相关系数的变量从左侧列表框中选到右侧的Variables列表框中。
(3)CorrelationCoefficients项:
选择相关系数类型。
包含3个复选项。
Pearson复选项:
简单相关系数,是系统默认的方式。
用于连续变量或等间距测度的数值型变量。
Spearman复选项:
等级相关系数,用来度量顺序变量。
Kendallstau-b复选项:
等级相关系数,用来度量顺序变量。
3、SPSS实现过程,(4)TestofSignificance项:
选择输出相关系数检验的双边或单边概率p值。
包含2个单选项。
Two-tailed单选项:
双边检验,是系统默认的方式。
用于事先不知道相关方向的情况。
One-tailed单选项:
单边检验。
用于事先知道相关方向的情况。
(5)FlagsignificantCorrelations复选项:
选择输出“*”标志,以标明变量间的相关性是否显著。
在相关系数上用“*”标出检验结果,“*”表示显著性概率p0.05,即一般显著;
“*”表示显著性概率p0.01,即特别显著。
3、SPSS实现过程,(6)单击“Options”按钮,弹出BivariateCorrelationsOptions对话框。
选择要输出的统计量。
包含2个复选项。
Meansandstandarddeviations复选项:
输出变量的均值和标准差。
Cross-productdeviationsandcovariances复选项:
输出各对变量的叉积离差阵和协方差阵。
指定对缺失值的处理方式。
3、SPSS实现过程,Excludecasespairwise单选