1、统计描述与参数估计统计描述与参数估计连续变量统计描述与参数估计连续变量统计描述与参数估计频数分布频数分布的类型正态分布正偏态分布负偏态分布正态性判断统计图正态性检验常用的统计指标集中趋势frequency tablearithmetic meangeometric meanmedian离散趋势rangequartile intervalvariancestandard deviation参数估计的概念参数估计的概念区间估计:按一定的概率估计包括总体参数范围的方法可信区间:总体参数的所在的可能范围通常称为参数的可信区间可信区间以一定的概率(如95%或99%)包含总体参数 以120名健康男性农民舒
2、张压(mmHg)资料为例(数据见freq.sav),讲解数值变量的统计描述。analyzedescriptive statistics frequencies descriptive exploreAnalyze descriptive statistics frequencies提供频数分布表,集中趋势和离散趋势的指标,偏度系数、峰度系数及其标准误,统计图等 偏度系数z0.032/0.2210.14 P=0.88峰度系数z0.584/0.4381.33 P=0.18 可认为舒张压服从正态分布 Analyze descriptive statistics descriptive 输出集中趋势和
3、离散趋势的指标,偏度系数、峰度系数及其标准误,z值等 explore除给出基本描述性指标外,可对数据进行初步检查,进行正态性、方差齐性检验,提供描述性统计图等 analyzedescriptive statistics explore dependent list:舒张压 factor list:(分组变量)label cases by:(标记的分类变量)Statistics对话框:总体均数的可信区间M估计值5个最大值,最小值百分位数 Plot对话框:对话框:箱丝图箱丝图茎叶图茎叶图直方图直方图作正态性检验,并绘制正态概率图作正态性检验,并绘制正态概率图方差齐性检验方差齐性检验 稳健估计M值离
4、均数、中位数很近,提示数据中无明显的异常值 5个最大值,最小值无离群值 正态性检验.,提示数据为正态分布 舒张压 茎叶图Stem-and-Leaf Plot Frequency Stem&Leaf 1.00 5.8(1例58mmHg)8.00 6.22234444 (3例62mmHg,1例63mmHg,4例64mmHg)18.00 6.555567777788888999 24.00 7.000011111222222233334444 35.00 7.55555555566666666677777888888999999 21.00 8.000000111222233344444 11.00
5、 8.55666677789 2.00 9.01 Stem width:10 Each leaf:1 case(s)显示数据基本为对称分布 正态性检验Q-Q图如资料服从正态分布,则散点的分布接近直线本例资料为正态分布箱体高度为四分位数间距(P75-P25),中间线为P50。顶线、底线分别为去除异常值外的最大值、最小值。观察值距P75或P25的距离为箱体高度的1.53倍时,用 表示被视为离群值;超过3倍时,用*表示,被视为极端值。本例数据基本对称,无异常值。例:对陈平雁13/clinical trail.sav中“pltl”分组“group”进行探索性分析。分类变量的统计描述分类变量:有序分类变量无序分类变量例:药物治疗感冒(何test.sav)试验组60人,对照组69人。疗效评价指标:是否有效。协变量:年龄,性别。分组描述两组的年龄、性别、疗效 analyzedescriptive statistics frequency analyzedescriptive statistics crosstables例:描述试验组与对照组疗效(整理成四个表)频数分布表
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1