2频数分析列连表.docx

上传人:b****8 文档编号:28134086 上传时间:2023-07-08 格式:DOCX 页数:17 大小:183.60KB
下载 相关 举报
2频数分析列连表.docx_第1页
第1页 / 共17页
2频数分析列连表.docx_第2页
第2页 / 共17页
2频数分析列连表.docx_第3页
第3页 / 共17页
2频数分析列连表.docx_第4页
第4页 / 共17页
2频数分析列连表.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

2频数分析列连表.docx

《2频数分析列连表.docx》由会员分享,可在线阅读,更多相关《2频数分析列连表.docx(17页珍藏版)》请在冰豆网上搜索。

2频数分析列连表.docx

2频数分析列连表

1频数分析(DescriptiveStatistics-Frequencies)

频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

下面我们通过例子来学习单变量频数分析操作。

 

1)输入分析数据

在数据编辑器窗口打开“data1-2.sav”数据文件。

 

2)调用分析过程

在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“DescriptiveStatistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。

图3-4“Frequencies”对话框

 

3)设置分析变量

从左则的源变量框里选择一个和多个变量进入“Variable(s):

”框里。

在这里我们选“三化螟蚁螟[虫口数]”变量进入“Variable(s):

”框。

 

4)输出频数分布表

   

Displayfrequencytables,选中显示。

 

5)设置输出的统计量

单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:

图3-5“Statistics”对话框

①选择百分位显示“PercentilesValues”栏:

Quartiles:

四分位数,显示25%、50%和75%的百分位数。

    

Cutpointsfor10equalgroups:

将数据平分为输入的10个等份。

    

Percentile(s):

用户自定义百分位数,输入值0—100之间。

选中此项后,可以利用“Add”、“Change”和

     “Remove”按钮设置多个百分位数。

②选择变异程度的统计量“Dispersion”:

(离散趋势)

Std.deviation标准差

Minimum最小值

    

Variance方差 

Maximum最大值

    

Range 极差

S.E.mean均值标准误

③选择表示数据中心位置的统计量“CentralTendency”:

(集中趋势)

Mean均值

    

Median中位数

    

Mode众数

    

Sum算术和

④选择分布指标“Distribution”:

Skewness偏度

    

Kurtosis峰度

 

6)统计图形输出设置

单击“Charts”按钮,将弹出如图3-6所示的对话框:

图3-6“Charts”对话框

①ChartType图形选择栏:

○None:

不输出图形;

    ○Barcharts:

输出条形图;

    ○Piecharts:

输出饼图;

    ⊙Histograms:

输出柱状图。

若选中“√Withnormalcurve”项,则在绘制柱状图中加绘一条正态分布曲线。

②当用户选中条形图或饼图时,在“ChartValues”框的选项中可选择:

⊙Frequencies:

绘制频数图。

    ○Percentages:

绘制频率图。

 

7)设置频数表格式

在图3-4对话框中,单击“Format”按钮,打开如图3-7所示的对话框:

图3-7“Format”对话框

①设置排序的方法“Orderby”:

⊙Ascendingvalues:

按变量值的升序排列。

    ○Descendingvalus:

按变量值的降序排列。

    ○Ascendingcounts:

按频数的升序排列。

    ○Descendingcounts:

按频数的降序排列。

②选择多变量输出设置“MultipleVariables”:

⊙Comparevariables选项,所有变量在一个图形中输出,以便进行比较。

    ○Organizeoutputbyvariables选项,为每一个变量单独输出一个图。

③设置在频数表中显示的组数

选中此项,输入分组数,系统缺省为10组。

设置完成后,点击“Continue”按钮回到上一级对话框。

 

8)提交执行

在图3-4对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。

 

9)分析结果

表1统计量表           Statistics

                              三化螟蚁螟

N

Valid

120

 

Missing

0

Mean(平均数)

75.14

Std.Deviation(标准差)

7.024

Skewness(偏度系数)

-.031

Std.ErrorofSkewness(偏度系数误差)

.221

Kurtosis(峰度系数)

-.582

Std.ErrorofKurtosis(峰度系数误差)

.438

Percentiles

10

65.00

 

20

68.20

 

30

71.00

 

40

73.40

 

50

75.00

 

60

77.00

 

70

79.00

 

80

81.80

 

90

84.90

在表1中列出的信息有:

有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。

偏度系数(Skewness)及误差:

-0.031和0.221,峰度系数(Kurtosis)及误差:

-0.582和0.438。

表2频数表

三化螟蚁螟

 

Frequency

(频数)

Percent

(百分比)

ValidPercent

(有效观测值的百分比)

CumulativePercent

(累积百分比)

Valid?

?

?

?

?

58

1

.8

.8

.8

62

3

2.5

2.5

3.3

63

1

.8

.8

4.2

64

4

3.3

3.3

7.5

65

4

3.3

3.3

10.8

66

1

.8

.8

11.7

67

5

4.2

4.2

15.8

68

5

4.2

4.2

20.0

69

4

3.3

3.3

23.3

70

4

3.3

3.3

26.7

71

5

4.2

4.2

30.8

72

7

5.8

5.8

36.7

73

4

3.3

3.3

40.0

74

4

3.3

3.3

43.3

75

9

7.5

7.5

50.8

76

9

7.5

7.5

58.3

77

5

4.2

4.2

62.5

78

6

5.0

5.0

67.5

79

6

5.0

5.0

72.5

80

6

5.0

5.0

77.5

81

3

2.5

2.5

80.0

82

4

3.3

3.3

83.3

83

3

2.5

2.5

85.8

84

5

4.2

4.2

90.0

85

2

1.7

1.7

91.7

86

4

3.3

3.3

95.0

87

3

2.5

2.5

97.5

88

1

.8

.8

98.3

90

1

.8

.8

99.2

91

1

.8

.8

100.0

Total

120

100.0

100.0

?

在表2中列出的信息有:

Frequency频数;Percent百分比;ValidPercent有效观测值的百分比;CumulativePercent累积百分比。

图3-8频数分布的条形图表示

 

 

 

2列联表分析(Crosstabs)

列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。

SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。

其中卡方检验是分析列联表资料常用的假设检验方法。

例子:

山东烟台地区病虫测报站预测一代玉米螟卵高峰期。

预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。

数据如下表。

山东烟台历年观测数据分级表()

年份

59

60

61

62

63

64

65

66

67

69

70

71

72

73

74

75

76

77

y

1

3

1

1

3

1

1

2

1

3

2

1

2

2

3

2

2

1

x1

3

2

2

3

1

3

2

3

3

1

2

3

1

1

1

2

2

1

x2

1

2

3

1

1

2

2

1

1

1

1

2

3

1

1

1

1

2

x3

3

1

1

3

1

2

1

3

2

2

1

2

1

2

3

2

3

1

x4

3

1

1

1

1

1

1

1

1

1

3

1

1

2

1

1

1

1

注:

摘自《农业病虫统计测报》131页。

 

1)输入分析数据

在数据编辑器窗口打开“data1-3.sav”数据文件。

数据文件中变量格式如下:

 

2)调用分析过程

在菜单选中“Analyze-Descriptive-Crosstabs”命令,弹出列联表分析对话框,如下图

 

3)设置分析变量

选择行变量:

将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:

”行变量框中。

选择列变量:

将“玉米螟卵高峰发生期[y]”变量选入“Columns:

”列变量框中。

 

4)输出条形图和频数分布表

   

Displayclusteredbarcharts:

选中显示复式条形图。

  

Suppresstable:

选中则不输出多维频数分布表。

 

5)统计量输出

点击“Statistics”按钮,弹出统计分析对话框(如下图)。

Chi-Square:

卡方检验。

选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验

                   (ContinuityCorrection)及Fisher精确概率检验(Fisher’sExacttest)的结果。

Correlations:

选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。

Nominal:

两分类变量的关联度(Association)测量

ContingencyCoefficient:

列联系数,其值越大关联性越强。

    

PhiandCramer’sV:

Cramer列联系数,其值越大关联性越强。

    

Lambda:

减少预测误差率,1表示预测效果最好,0表示预测效果最差。

    

UncertaintyCoefficient:

不定系数

Ordinal:

两有序分类变量(等级变量)的关联度测量

Gamma:

关联度,+1表示完全正关联,-1表示负关联,0表示无联。

    

Somers’d:

列联度,其取值范围和意义同上。

    

Kendall’stau-b:

NominalbyInterval:

一个定性变量和一个定量变量的关联度

Eta:

关联度统计量。

Kappa:

吻合度系数,其取值-1至+1,其值越大吻合程度越高。

    

Risk:

危险度分析。

    

McNemar:

配对计数资料的卡方检验。

Cochran’sandMantel-Haenszelstatistics:

检验在协变量存在下,两个二分类变量是否独立。

 

6)设置列联表的显示

单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。

Counts:

频数

  

Observed:

观测频数。

      

Expected:

期望频数。

Percentages:

百分比

 

Row:

占本行的百分比。

      

Column:

占本列的百分比。

      

Total:

占全部的百分比。

Residuals:

残差分析

 

Unstandardized:

非标准化残差分析。

      

Standardized:

标准化残差分析。

      

Adj.Standardized:

调整的标准化残差分析。

NonintegerWeights:

 ⊙Roundcellcounts:

临近列计算。

     ○Truncatecellcounts:

     ○RoundcaseWeights临近记录度量

     ○TruncatecaseWeights

     ○Noadjustments:

不调整。

 

7)设置输出格式

单击Format按钮,弹出列联表输出格式对话框(如下图)。

RowOrder:

频数

                ⊙Ascending:

行变量从小到大升序排列。

                ○Descending:

行变量从大到小降序排列。

 

8)设置检验

单击“Exact”按钮,弹出精确检验对话框(如下图)。

⊙Asymptoticonly近似的,系统设置。

    ○MonteCarlo

          Confidencelevel:

99%置信度,系统默认99%。

          Numberofsamples:

10000样本数量,系统默认10000。

    ○Exact

          Timelimitpertest:

5minutes限时检验时间,系统默认值5分钟。

 

9)提交执行

设置完成后,在列联表分析对话框中,点击OK按钮,计算结果输出在结果窗口中。

 

10)结果与分析

在结果窗口中查看计算结果,主要输出内容如下。

五月气温*玉米螟卵高峰发生期

               Crosstab

 

 

玉米螟卵高峰发生期

Total

 

 

6月20日前

6月21-25日

6月25日以后

 

 

五月气温

16.5以下

 

Count(频数)

ExpectedCount(期望值)

1

2.7

2

2.0

3

1.3

6

6.0

16.6-17.8

 

Count(频数)

ExpectedCount(期望值)

2

2.7

3

2.0

1

1.3

6

6.0

17.8以上

 

Count(频数)

ExpectedCount(期望值)

5

2.7

1

2.0

0

1.3

6

6.0

Total

Count(频数)

ExpectedCount

8

8.0

6

6.0

4

4.0

18

18.0

                     Chi-SquareTests

Value

df

Asymp.Sig.(2-sided)

PearsonChi-Square

皮尔森卡方检验

7.750(a)

4

.101

LikelihoodRatio

似然比卡方检验

8.510

4

.075

Linear-by-LinearAssociation

6.248

1

.012

NofValidCases

18

 

 

a9cells(100.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis1.33.

(其余的省约)

结果分析:

从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(5>2.7,3>2.0,3>1.3)。

从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-LinearAssociation),双尾检验p<0.012。

因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 笔试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1