spss课堂笔记.docx

上传人:b****7 文档编号:23463433 上传时间:2023-05-17 格式:DOCX 页数:12 大小:322.90KB
下载 相关 举报
spss课堂笔记.docx_第1页
第1页 / 共12页
spss课堂笔记.docx_第2页
第2页 / 共12页
spss课堂笔记.docx_第3页
第3页 / 共12页
spss课堂笔记.docx_第4页
第4页 / 共12页
spss课堂笔记.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

spss课堂笔记.docx

《spss课堂笔记.docx》由会员分享,可在线阅读,更多相关《spss课堂笔记.docx(12页珍藏版)》请在冰豆网上搜索。

spss课堂笔记.docx

spss课堂笔记

1、教学数据

2、研究数据(2-3周做好选题工作)

(1)自备数据(导师提供的数据)

(2)赵老师提供的数据

(A.NSSE-CHINA.2010-2013;B.CGSS.2006中国社会状况综合调查C.其他)

3、助教:

确定选题、汇总研究进度、提出修改意见。

查重:

paper.

<0.05小概率事件<0.01极小概率事件

0.002的概率<0.05,假设研究样本和总体样本s=x1-x2=0不成立,显著

地方依赖感

焦虑抑郁神经质根据一周以来的自我感受

SCL

性别:

2

年龄:

23

民族:

1

专业:

土地资源管理4

学历:

研究生硕士

城乡:

1

职业:

学生

建立数据文件、算出总分

独立样本的检验T检验

男的均值>女的均值,所以女性的精神病性更强。

0假设:

男性JSBX得分和女性相同。

(不存在显著差异)

构建变量,考察

研究结果表明:

方差的Sig>0.05均值的Sig>0.05不显著相关

F,P,对应t和p为,俩总体均值不存在显著差异,男女研究生在JSBX研究上,不存在显著差异。

方差的Sig<0.05均值的Sig<0.05显著相关

科学:

对象可确定的,可观测的、可测量的,对象的观测和测量可以重复观测和测量,结果可以保持不变。

SQL标准化的量表

音频分析,对音频高的进行汇总。

统计学:

数据分析的方法论。

SAS

EVIEWS

S-plus

编码手册做好、设置97个变量

1-100岁进行等距变量婴儿、儿童…

研究说明和解释

完整的

题目、摘要、作者简介3~6:

5000-6000

1、问题背景

2、方法(T检验、回归分析…)工具(SQL90)和程序(样本)

3、结果3.13.23.3

4、分析讨论

5、基本结论

6、参考文献

变量计量尺度:

性别:

定类变量

年龄:

定距定秩定比

Scale:

定距数据收入、人数

Ordinal:

有固定顺序年龄段职称

nominal:

无固定顺序性别

BemSexRoleInventory

横的为变量,竖的为个案。

8个个案。

8人次。

0假设:

喝茶前体重-喝茶后体重=0

Sig=0.000<0.05假设不成立说明这两数据存在显著差异

 

男女

专业1:

1023

专业2:

1210

Exp1:

 

1、不多于8个字符

2、不区分大小写

3、允许汉字作为变量名

4、默认变量:

var

数值型:

1、逗号:

123,456

2、科学计数法:

1.2E+05

字符串(string):

日期型(Date):

变量名标签:

解释说明

变量值标签:

品质数据1-男2-女、1-高2-中3-低

缺失值:

漏填的、明显错误的、篡改的数据

快捷键学习:

关机:

ALT+F4

切换“alt+tab

回到桌面:

Windows+D

利用副本进行数据操作

怎么避免数据复制过来以后串行?

好像没说~

描述统计:

没有推理过程的统计。

标准差、方差、级差:

描述离散程度的变量。

均值:

描述集中程度的变量。

描述分布情况:

偏度、峰度。

3西格玛大约99.73%落在[-3○,3○]

1、频数分析

2、Spss中使用的是样本方差很敏感地反映数据的离散程度

表1(空一格)

姓名

年龄

收入

哈哈

呵呵

 

均值

中位数

众数

实证和否证?

绝对真理和相对真理:

否证:

找不到反驳的条件或案例,那么也就间接证明了他的真实性。

 

抽样分布

 

假设检验的基本步骤

(1)根据检验的目标,对待推断的总体参数或分布做一个基本假设Ho平均年龄50岁(总体均值与检验值之间不存在显著差异)

(2)构造检验统计量,且该统计量服从某种已知分布。

TF检验20与50之间是否存在显著差异

(3)如果概率P值小于用户给定的a水平,则拒绝0假设,否则o假设成立。

(计算T统计量及相应的P值)

(4)P<=a,拒绝0假设,总体均值和检验值之间有显著差异。

单样本T检验:

分析——均值比较检验值为75

得到:

研究结果表明,平均身高为71.8,得到T值,对应P值为,<0.05,拒绝0假设,周岁儿童平均身高小于75cm。

例如:

《中日周岁儿童平均身高比较研究》

独立样本:

配对样本:

 

1分析——>比较均值——>单样本T检验

表3-1周岁儿童身高的单个样本检验

检验值=75

t

df

Sig.(双侧)

均值差值

差分的95%置信区间

下限

上限

周岁儿童的身高

-3.620

20

.002

-3.14286

-4.9539

-1.3319

构建单样本t检验公式,考察周岁儿童身高是否为75CM,研究结构钢表明:

t=-3.62,p=0.002(<0.05),所以,拒绝零假设,也就是说周岁儿童身高与75CM之间存在显著差异。

2两独立样本T检验是单因素方差分析的形式

1.Ho=U1-U2=0两总体均值无显著差异

2.构造检验统计量,从两样本均值差的分布出发FT

3.<0.05,拒绝零假设,存在显著差异。

方差齐性F检验两总体方法是否齐性

<=a拒绝非齐性

3两配对样本t检验

两总体均值无显著差异,差值序列的均值u=0

0.000不等于0

 

方差分析

(1)观测变量:

作为观测的对象(如:

亩产量、推销量)

(2)控制因素:

人为可以控制的因素(如,施肥量、种子、先天环境)

观测变量的数据差异=控制因素造成+随机因素造成

{单因素方差分析:

只考虑一个控制因素AC

(各水平下,各总体的分布是否存在显著差异,进而判断各控制变量是否有影响)

构造F统计量:

SST=SSA+SSE

结论:

F值较大时候,P<=用户给定的显著性水平a,则拒绝Ho,认为不同水平各总体均值有显著差异。

LSD:

单因素方差分析中的多重比较,事后两两比较。

(特点:

利用了全部样本数据,不仅是所比较的两组的数据,且认为各水平均是等方差的)

{多因素方差分析:

考虑2个以上的控制因素和他们的交互作用对观测变量的影响

A+B+ABC

SSAB=SST-SSA-SSB-SSE

A、B、AB对应的三个F值

结论:

依次查看各F值,F值较大时候,P<=用户给定的显著性水平a,则拒绝Ho,认为不同水平各总体均值有显著差异。

只考虑A、B不考虑AB,非饱和模型。

这样设定的话,与Full全因子是一样的,饱和。

非饱和模型的话就是没有AB。

{协方差分析:

在尽量排除其他因素的影响下,只考虑单个或多个因素

不同地区的销售额存在显著差异

因果关系:

 

交叉表

卡方检验

定类与定类:

相关分析:

卡方检验

定序与定序:

Spearman相关系数

定距与定距:

Pearson相关

R=1完全正相关

R=-1完全负相关

R=0不相关

分析——>相关——>双变量

偏相关也称净相关

分析——>相关——>偏相关

e+A+B+C+D=>E

回归分析:

1.确定回归方程的解释变量和被解释变量

2.确定回归方程

3.对回归方程进行检验

4.利用回归方程进行预测

不显著的话,这个变量就要剔除。

逐步进入法

可决系数、判定系数,R^2越高,解释性越高,要看调整后的判定系数。

一元的话:

看R

多元的话:

看调整后的R^2

该回归方程具有较好的解释力。

自变量本身就存在高相关,所以一个自变量高相关,不能排除其他因素的影响。

多重贡献性。

残差分析应包括以下内容:

DW检验用来检验残差的自相关

DW=2无自相关,0-2正相关,2-4负相关,1.5-2.5无自相关现象。

题目、工具、方法、说明

 

多元线性方程的B1,B2,B3都是偏回归系数。

多重线性分析

1.容忍度:

1-R^2

2.

为什么很多变量被删除了,因为很多变量有相互作用。

聚类分析:

Mall

20个分值变量

一个总值(计算变量)

比较哪个商场更好?

1.单因素方差分析

 

思路:

1、解题

2、设置变量

3、整理和编辑数据

4、均值比较POSThook事后比较(虽然分数低了点,但没有显著差异,就可以给2个一等奖)

亲疏程度:

个体相似程度、个体差异程度

定距型变量个体间距离的计算方式

卡方

Phi方

 

聚类分析几点注意:

1.所选择的变量应符合聚类的要求:

所选变量应能够从不同的侧面反映我们研究的目的;

2.不应该有数量级上的差异;

3.不应该有较强的相关关系

最近邻居

最远邻居

分析分类系统聚类分析

 

个案聚类:

R聚类=变量聚类:

 

因子分析:

降维—>因子分析

1.基于特征值

2.因子的固定数量

K均值分类(就只出来2个表)在数据栏后面形成结果

先做树形图

 

因子分析:

因子分析能将很多原始的众多变量综合成几个,起到降维的作用。

1.因子个数远远少于原有变量的个数

2.因子能够反应原有变量的绝大部分信息

3.因子之间不存在线性关系

4.因子具有命名解释性(可以将聚类的指标进行较好的解释)

相关系数矩阵中相关系数<0.3,那么就不建议做因子分析

 

因子个数的确定方法:

1.特征值>1

2.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1