ImageVerifierCode 换一换
格式:DOCX , 页数:18 ,大小:841.30KB ,
资源ID:11939553      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/11939553.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第四章 基本统计分析.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第四章 基本统计分析.docx

1、第四章 基本统计分析第四章 SPSS基本统计分析 2017年10月8日主要内容 频数分析 计算描述统计量 列联分析 多选项分析频数分析 目的:粗略把握变量值的分布状况。 例:研究被调查者的特征(如:性别,年龄,收入) 研究被调查者对某个问题的总体看法(如:教学方式,选修课程) 采用的方法 计算频分布表:包括频数、累计频数、百分比、累计百分比 绘制统计图形:条形图、饼图频数分析 基本操作步骤(1)菜单选项:分析-描述统计-频率(2)选择几个待分析的变量到变量框. (3)图表选项,选择所需要的图形频数分析频数分析中的其他分析计算分位数:适用于定距数据数据按升序排序后,找到若干个分位点上的变量值计算

2、四分位数:25%(QL)、50%(中位数)、75%(QU)分位数的应用:在排除极端值影响的条件下, 通过计算分位数差,比较两组样本数据的离散程度例:( QL=50,QU=80)和(QL=70,QU=75)的比较与频数分析相关的图形 以制作条形图为例绘制简单条图(单式条图)绘制复式条图绘制堆积条图(分段条图)定义统计图中数据的表达类型:同一变量若干条记录的分组汇总条图反映了不同变量的汇总条图反映了个体观察值 第一种模式:用于变量在各组下的频数对比 第二种模式:用于多个变量基本描述统计量的对比与频数分析相关的图形 交互作图:以制作条形图为例计算描述统计量 目的:精确把握变量的总体分布状况,了解数据

3、 的集中趋势、离散趋势、对称程度、陡峭程度。 基本方法: 计算基本描述统计量计算描述统计量 描述集中趋势的统计量 均值:表示某变量所有变量值集中趋势或平均水平 的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。 描述离散程度的统计量 标准差:表示某变量的所有变量值离散程度的统计 量。 SPSS中计算的是样本标准差 极差:最大值最小值计算描述统计量 描述对称程度的统计量 偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大(右偏) 小于0表示负偏差大(左偏)计算描述统计量 描述陡峭程度的统计量 峰度(kurtosis)

4、:描述某变量所有变量值分布形态陡缓程度的统计量。 峭度为0表示与标准正态分布峭度相同。 大于0表示比标准正态分布陡,尖峰。 小于0表示比标准正态分布缓,平峰。计算描述统计量其他统计量均值标准误差(means of S.E)中心极限定理认为:样本均值N(u,2/n)反映样本均值与总体真值间的平均离散程度样本数越大,样本均值的离散程度越小,对真值的估计越准确计算描述统计量 基本操作步骤(1)菜单选项:分析-描述统计-描述(2)选择将参加计算的数值型变量名到变量框计算描述统计量 其他功能 数据标准化处理 新变量的均值为0,标准差为1; 小于0表示在平均水平下,大于0反之. 正态分布的数据标准化后呈标

5、准正态分布 3准则:(68.2%,95.4%,99.7%) 将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.描述连续变量分布的图形 箱线图:以四分位差的1.5倍为标准剔除极端值描述连续变量分布的图形 直方图和金字塔图 Q-Q图和P-P图:累计分布函数(CDF)和概率密度函数(PDF)函数的应用交叉分组下的频数分析 目的:了解不同变量在不同水平下的数据分布 例:学习成绩与性别有关联吗?(两变量) 例:职业、性别、爱逛商店有关联吗?(三变量) 分析的主要步骤 产生交叉列联表 分析列联表中变量间的关系列联表 列联表中的元素:地区职称收入高(人)中(人)低(人)高工工程师助工技术员合计 产生

6、交叉列联表 基本操作步骤(1)菜单选项: 分析-描述统计- 交叉表(2)选择一个变量作为行变量到行框.(3)选择一个变量作为列变量到列框.(4)可选一个或多个变量作为控制变量到层框. 控制变量的层次设置:同层为水平数加;不同层为水平数积.(5)是否显示复式条形图产生交叉列联表 进一步计算 单元格选项:选择在频数分析表中输出各种百分比. 行百分比;列百分比;总百分比列联表 例:住房满意程度与购房计划列联表中行列变量间的关系 目的:通过列联表分析,检验行列变量之间是否独 立 方法:卡方检验(分类变量相关性的检验)年龄与工资收入交叉列联表低中高青40000中05000老00600青低0中0高500中

7、 0 600 0老 400 0 0卡方检验列联表中行列变量间的关系卡方检验基本步骤(1)H0:行列变量独立 2 =( fo- f )2efe(2)构造卡方统计量:从(r-1)*(c-1)个自由度的卡方分布优良中及格总数男1055323女8124125总数1817944837.535.418.88.3100期望分布反映的是H0成立情况下的分布特征(3)计算卡方的观测值, 得到概率P值(4)比较显著性水平和概率P值。小于等于则拒绝H0,否则不能拒绝列联表中行列变量间的关系 例:不同行业的人职业选择标准是否存在差异? 制造业 服务业物质报酬 105 45稳定性 40 352乘2的列联表进行yates

8、连续性校正:列联表中行列变量间的关系 卡方检验的要求: 一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以合并单元格。 卡方值会受样本数的影响列联表中行列变量间的关系11221221 行列变量相关性的其他测度指标 = A A - A A phi系数:适用于22列联表 行列变量独立时(期望频数): 有: = 0R1R2C1C2A11 = A12 , A21 = A22 C1 C2 C1 C2 行列变量完全相关时:A12 = A21 = 0有: = 1A11 A12 R1A21 A22 R2 C1 C2 越接近于1,相关性越强。越接近0,相关性越弱列联表中

9、行列变量间的关系 行列变量相关性的其他测度指标 列联C系数(contingency coefficient): 0,1);取值受到行列数的影响C = V系数:0,1V = 值越大表示行列变量的相关性越大多选项分析 多选项分析是针对多选项问题的 SPSS多选项问题的处理思路: 将一个问题定义成几个变量。分别用几个变量描述问题的几个可能被选择的答案 具体策略:采用不同的编码方式 多选项二分法(multiple dichotomize method) 将每个答案作为一个变量,每个变量只有两个取值(0或1) 多选项分类法(multiple category method) 预先指定多选项问题被选择的最

10、多答案数 每个答案建立一个变量,取值为多选项问题的备选答案多选项分析 多选项分析的基本思路 定义多选项变量集 多选项频数分析 多选项交叉分组下的频数分析多选项分析 定义多选项变量集 目的:将已分解的变量定义为一个集合,便于进行多选项分析 菜单选项:分析-多重响应-定义变量集 从原变量中选取被分解的变量(数值型)到集合中的变量框 指定被分解的变量是按多选项二分法分解还是按 多选项分类法分解的 为变量集命名。系统自动在名字前加字符$.多选项分析 多选项频数分析 菜单选项:分析-多重响应-频率 多选项交叉分析下的频数分析 菜单选项:分析-多重响应-交叉表 P-P图是根据变量的累积比例与指定分布的累积

11、比例之间的关系所绘制的图形。通过P- P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P 图中各点近似呈一条直线。如果P-P图中各点不呈直线,但有一定规律,可以对变量数据进行转换, 使转换后的数据更接近指定分布。 Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的分位数为纵坐标,样本值为横坐标的散点图. 要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ 图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值. 用QQ 图还可获得样本偏度和峰度的粗略信息 自然对数转换:选择此项,对当前变量的数据取自然对数,即将原有变量转换成以自然数e为底的对

12、数变量。 标准值:选择此项,将当前变量的数据转换为标准值,即转换 后变量数据的均值为0,方差为1。 差分:选择此项,对当前变量的数据进行差分转换,即利用变量中连续数据之间的差值来转换数据。选择此项以后,后面的文本框变为可用,在其中输入一个正整数,以确定转换的差分 度,默认值为1。 季节性差分:用于确定指明计算时间序列的季节差分。只有在对当前变量的数据序列定义了周期(通过主菜单中的【数据】(Data)菜单中的【定义日期】(Define Dates)选项定义)以后才可用,如果当前周期为0,将不能计算季节差分。选择此项,在后面的文本框中输入正整数,然后根据该正整数所确定的范围来计算该范围内数据的差值,并用该差值来转换原数据。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1