1、组图功能、添加误差条、参考线、连接线等数据和结果的管理与导出字符型变量可长达32767字节可以读入SAS 9.1.3数据应用日期时间向导可将结果中的统计图表直接导出到PowerPoint文件统计功能的增强新增决策树模块在复杂抽样模块中增加了线型回归、方差分析和协方差分析等二分类和多分类Logistic回归等定性数据的分析功能,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,SPSS界面介绍,SPSS界面介绍,数据的录入,数据的录入,数据的录入,数据的录入,数据的录入,变量名:不超过64个字符,首字符必须是字母或汉字,不能以“_”或“.”结尾变量名不能有空格或某些特殊符号,如
2、“!”、“?”和“*”变量名不能与SPSS的关键字相同,如ALL、AND、BY、EQ、WITH、OR等,数据的录入,标准数值型逗号数值型圆点数值型科学计数法型日期型美元数值型用户自定义型字符型,变量类型,数据的录入,数据的录入,数据的录入,数值标签,数据的录入,缺失值的定义,数据的录入,列宽,对齐,连续性变量有序分类变量无序分类变量,数据的获取,方法一:,数据的获取,方法二:,数据的获取,SPSS13.0可以导入*.sav,*.xls,*.dbf,*.dat,*.txt,*.mdb,*.w,*.dbc以及各类SAS数据文件。,数据的获取,使用文本导入向导读入文本类型的数据*.txt,数据的保存
3、,数据的保存,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据的管理,文件级别的管理,Define Variable PropertiesCopy Data PropertiesDefine DatesInsert VariableInsert CaseGo to Case Sort CasesTranspose RestructureMerge Files Aggregate Identify Duplicate CasesOrthogonal DesignSplit File Select Cases Weight Cases,Define Variable Pro
4、perties,Define Variable Properties,Insert Variables/Cases,插入变量,插入记录,Insert Variables/Cases,点击右键,插入变量,插入记录,Go to Case.,Sort Case.,Sort Case.,点击右键,*只能进行单变量排序,Transpose.,将数据库的行 列,列 行,Restructure.,Restructure.,Restructure.,Merge Files.,纵向合并,横向合并,Add Cases.,遵循两个原则:两个待合并的SPSS数据文件,其内容合并是有实际意义的;为方便SPSS数据文件的
5、合并,在不同数据文件中,数据含义相同的列,最好起相同的变量名,变量类型和变量长度也要尽量相同,这样方便 SPSS对变量的自动对应和匹配。,Add Cases.,Add Variables.,遵循三个原则:如果不是按照记录号对应的规则进行合并,则两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应合并的依据,称为关键变量;如果是使用关键变量进行合并的对应,则两个数据文件都必须事先按关键变量进行升序排列;为方便SPSS数据文件的合并,在不同数据文件中,数据含义不同的列,变量名不应该取相同的名称。,Add Variables.,Add Variables.,*横向合并一定要
6、按照关键变量进行排序,否则相应的合并操作将会失败!,Aggregate.,Aggregate.,Identify Duplicate Cases.,Identify Duplicate Cases.,Split File.,Select Cases.,Select Cases.,分析所有的记录只分析满足条件的记录从原始数据中按某种条件抽样基于时间或记录序号来选择记录使用筛选指标变量来选择,Weight Cases.,ComputeRecodeVisual BanderCountRank CasesAutomatic RecodeDate/TimeCreat Time SeriesReplace
7、 Missing ValueRandom Number GeneratorsRun Pending Transforms,变量级别的管理,Compute.,生成新变量,Compute.,设置条件,练习:1、计算平均的收缩压和舒张压:2、计算BMI:3、计算年龄:有两种方法,Age=RND(CTIME.DAYS(invidate)-CTIME.DAYS(birth)/365.25)Age=RND(invidate-birth)/(60*60*24*365.25),bmi=weight/(height/100)*2,sbp=(sbp1+sbp2+sbp3)/3dbp=(dbp1+dbp2+dbp3
8、)/3,Recode.,练习:1、Into Same Variables 将性别变量编码(1=男;2=女)修改为0=男;1=女2、Into Different Variables 根据计算出来的年龄分组,1表示=60岁,Into Different Variables,Into Different Variables,Visual Bander.,Visual Bander.,Visual Bander.,Visual Bander.,Count.,Rank Cases.,Rank Cases.,Automatic Recode.,Date/Time.,Replace Missing Valu
9、e.,Replace Missing Value.,用所有记录该变量上数值的均值用相邻的前和后的邻近数值的均值用相邻的前和后邻近数值的中位数线性内插值法:以缺失值前后的2个有效观察值,根据内插法估计和替代缺失值。线型趋势法。用线性回归法生成和替代缺失值。,Random Number Generators.,提 纲,背景介绍,数据管理,数据导入,数据分析,一些建议,参考文献,数据汇总报告描述性统计统计表均数比较一般线性模型混合模型相关分析回归分析对数线性模型聚类/判别分析因子分析及主成分分析量表(信度、效度)分析非参数检验时间序列分析生存分析多重响应等几大类缺失值分析复杂抽样,SPSS统计分析过
10、程,数据汇总报告(Reports),即时汇总数据汇总行汇总报告列汇总报告,OLAP Cubes,OLAP:Online Analytical Processing,OLAP Cubes,OLAP Cubes,OLAP Cubes,基本描述统计分析,Frequencies,Frequencies,Frequencies,Descriptives,Descriptives,Explore,判断有无离群点或极端值提示数据转换方法了解组间差异的特征给出统计量、正态检验和描述性统计图,包括茎叶图、直方图及箱图,Explore,Explore,Explore,Explore,Crosstabs,例:某医师
11、研究用兰苓口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗。问两药的治疗有效率是否相同。,Crosstabs,Crosstabs,Crosstabs,、P值,连续性变量的假设检验,一、t检验 1、样本均数与总体均数的比较 2、完全随机设计(成组设计)的两样本均数的比较 3、完全配对设计的两样本均数比较二、方差分析 1、完全随机设计(成组设计)的单因素方差分析 2、随机区组设计(配伍设计)的两因素方差分析三、协方差分析,样本均数与已知总体均数的比较,例:通过大量调查,已知某地正常男婴体重为3.26Kg,某医生随机抽取20名难产男婴,测得出生体重如
12、下:问,该地难产男婴体重是否不同于本地正常男婴?3.5 3.5 3.2 3.5 3.3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4.0 4.0,SPSS 分析命令:AnalyzeCompare MeansOne-Sample T Test,样本均数与已知总体均数的比较,总体均数,样本均数与已知总体均数的比较,结论:不能认为难产男婴的出生体重与正常男婴不同。,完全随机设计(成组设计)两个样本均数的比较,例:某医生测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/L)结果如下:问肝炎患者和正常人血清转铁蛋白含量有无差异?病毒
13、性肝炎患者:2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人:2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64,SPSS 分析命令:AnalyzeCompare MeansIndependent-Samples T Test,完全随机设计(成组设计)两个样本均数的比较,完全随机设计(成组设计)两个样本均数的比较,统计描述,方差齐性检验,结论:病毒性肝炎患者与正常人血清转铁蛋白含量有差别。,配对设计的两个样本均数比较,例:为比较某新药与常规药
14、降血脂的效果,将性别相同、血清总胆固醇水平相近的高血脂患者配成对子,每对中随机抽取一个人服用新药,另一个人服用常规药。服用一段时间后,测得血清总胆固醇含量(mmol/L)如下:问新药与常规药降血清总胆固醇效果是否相同?新 药:6.57 6.46 6.27 6.89 6.21 7.61 7.60 7.04 6.68 7.42常规药:6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.22,SPSS 分析命令:AnalyzeCompare MeansPaired-Samples T Test,配对设计的两个样本均数比较,配对设计的两个样本均数比较,结论:不能认为新药与常规药降低血清总胆固醇的效果不同。,配对差值,方差分析Analysis of Variance,ANOVA,方差分析的目的:推断多个总体均数是否相等方差分析的使用条件:各处理组样本来自正态总体各样本是相互独立的随机样本各处理组的总体方差相等,即方差齐性,方差分析的结果解释:方差分析的F 检验,当P0.05,可以认为各组总体均数不等或不全相等,但并不以为着任
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1