地理学数学方法汇总SPSS与R语言应用.docx

上传人:b****7 文档编号:26054819 上传时间:2023-06-17 格式:DOCX 页数:27 大小:590.57KB
下载 相关 举报
地理学数学方法汇总SPSS与R语言应用.docx_第1页
第1页 / 共27页
地理学数学方法汇总SPSS与R语言应用.docx_第2页
第2页 / 共27页
地理学数学方法汇总SPSS与R语言应用.docx_第3页
第3页 / 共27页
地理学数学方法汇总SPSS与R语言应用.docx_第4页
第4页 / 共27页
地理学数学方法汇总SPSS与R语言应用.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

地理学数学方法汇总SPSS与R语言应用.docx

《地理学数学方法汇总SPSS与R语言应用.docx》由会员分享,可在线阅读,更多相关《地理学数学方法汇总SPSS与R语言应用.docx(27页珍藏版)》请在冰豆网上搜索。

地理学数学方法汇总SPSS与R语言应用.docx

地理学数学方法汇总SPSS与R语言应用

地理学数学方法SPSS与R语言应用

本部分第二种方法为R语言,R语言是用于统计分析、绘图的语言和操作环境。

集统计分析和绘图于一体,一个自由、免费、源代码开放的系统。

一至二章(各种图表)

1.SPSS实例:

Q1:

根据某百货公司连续40天的商品销售额数据进行适当的分组,编制频数分布表,并绘制直方图、茎叶图及箱线图。

1)直方图

步骤:

1)将数据从excel表格中复制到SPSS

2)图形>旧对话框>直方图

3)将销售额导入变量,点击确定

结果:

2)茎叶图:

步骤:

1)分析>描述统计>探索

2)将销售额导入因变量列表中,在绘制中选择茎叶图,箱线图。

结果:

1)茎叶图

销售额Stem-and-LeafPlot

FrequencyStem&Leaf

.002.

4.002.5689

6.003.002344

15.003.556666777778889

9.004.012233444

6.004.556679

Stemwidth:

10

Eachleaf:

1case(s)

3)箱线图

2.R语言实例:

4)条形图:

从维多利亚南部到皇后区的七个地区的104只负鼠(possum)的年龄、尾巴的长度、总长度等9个特征值,我们仅考虑43只雌性负鼠的特征值,我们建立子集fpossum,考查雌性负鼠(fpossum)的总长度的频率分布.

library(DAAG)

library(ggplot2)

data("possum")

fpossum<-possum[possum$sex=="f",]

ggplot(fpossum,aes(x=fpossum$totlngth),color="blue")+

geom_histogram()+

labs(title="雌性负鼠长度分布图",x="负鼠长度")#ggplot2绘图直方图

5)茎叶图

仍然考虑雌性负鼠的总长度

74|0

76|

78|

80|05

82|0500

84|05005

86|05505

88|0005500005555

90|5550055

92|000

94|05

96|5

6)箱线图

雌性负鼠总长度分布

boxplot(fpossum$totlngth)

箱子中的五根横线对应的坐标分别是最小值,第一4分位数,中位数,第三4分位数和最大值

第三章常用数值计算

3.SPSS实例:

Q2:

计算40天销售额的均值、标准差、五数(最小值、第三4分位数、中位数、第一4分位数、最大值)

步骤:

1)分析>描述统计>描述

2)单击选项,选中均值、标准差、最大最小值、方差。

再单击继续,确定。

如下图所示:

结果:

描述统计量

N

极小值

极大值

均值

标准差

方差

销售额

40

25

49

37.85

5.959

35.515

有效的N(列表状态)

40

4.R语言实例:

计算雌性负鼠的均值、标准差、五数(最小值、第三4分位数、中位数、第一4分位数、最大值)

Min.1stQu.MedianMean3rdQu.Max.

75.0085.2588.5087.9190.5096.50

结果分别为:

最小值,第一四分位数,中位数,均值,第三四分位数,最大值

雌性负鼠总长度标准差:

a<-c(fpossum$totlngth)

stdevp<-sqrt(sum((a-mean(a))^2)/length(a))#有偏估计标准差

stdevp=4.133324

有偏估计标准差计算公式:

sd(fpossum$totlngth)#计算无偏估计标准差

4.182241

四章假设检验与方差分析

5.假设检验

微波炉在炉门关闭时的辐射量是一个重要的质量指标.设该指标服从正态分布

均值要求不超过0.12.为检查近期产品的质量,从某厂生产的微波炉中抽查了25台,得其炉门关闭时辐射量的均值

0:

13,问该厂生产的微波炉炉门关闭时辐射量是否偏高?

在显著性水平α=0.05时:

方差

已知,μ的检验,Z检验:

$mean

[1]0.13

$z

[1]0.5

$p.value

[1]0.6915

$conf.int

[1]0.09080.1692

因为p值=0.6915>α=0.05,故接受原假设,认为炉门关闭时辐射量没有偏高.

某车间用一台包装机包装精盐,额定标准每袋净重500g,设包装机包装出的盐每袋净重

某天随机地抽取9袋,称得净重为490,506,508,502,498,511,510,515,512.问该包装机工作是否正常?

7)SPSS方法:

步骤:

1)将数据输入到SPSS中,修改变量视图中的名称。

2)分析>比较分析>单样本T检验

2)将净重导入检验变量中,检验值为500单击选项,置信区间百分比为95%,继续,确定。

结果:

单个样本统计量

N

均值

标准差

均值的标准误

净重

9

505.78

7.886

2.629

 

单个样本检验

检验值=500

t

df

Sig.(双侧)

均值差值

差分的95%置信区间

下限

上限

VAR00001

2.198

8

.059

5.77778

-.2842

11.8398

结论分析:

Sig=0.059<0.05,说明该包装机工作正常。

8)R语言方法:

方差

未知,显著性水平α=0.05

方差

未知时μ的检验:

t检验

salt<-c(490,506,508,502,498,511,510,515,512)

t.test(salt,mu=500)

OneSamplet-test

data:

salt

t=2.2,df=8,p-value=0.06

alternativehypothesis:

truemeanisnotequalto500

95percentconfidenceinterval:

499.7511.8

sampleestimates:

meanofx

505.8

P值=0.06>α=0.05,接受原假设,认为包装机正常

检查一批保险丝,抽出10根测量其通过强电流熔化所需的时间(单位:

秒)为:

42,65,75,78,59,71,57,68,54,55.假设熔化所需时间服从正态分布,问能否认为熔化时间方差不超过80(取α=0.05).

卡方检验:

source("chisqvartest.r")

time<-c(42,65,75,78,59,71,57,68,54,55)

chisq.var.test(time,80,0.05,alternative="less")

输出结果:

$var

[1]121.8

$chi2

[1]13.71

$p.value

[1]0.8668

$conf.int

[1]57.64406.02

P值=0.8668>α=0.05故接受原假设,认为熔断时间方差不过80

甲、乙两台机床分别加工某种轴承,轴承的直径分别服从正态分布

从各自加工的轴承中分别抽取若干个轴承测其直径,结果如下表所示.设

问两台机床的加工精度有无显著差

异?

(取α=0.05)

机床加工的轴的直径数据

总体

样本容量直径

X(机床甲)

Y(机床乙)

820.519.819.720.420.120.019.019.9

720.719.819.520.820.419.620.2

均值的比较:

t检验

输入:

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9)

y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2)

t.test(x,y,var.equal=TRUE)

结果:

TwoSamplet-test

data:

xandy

t=-0.85,df=13,p-value=0.4

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-0.76840.3327

sampleestimates:

meanofxmeanofy

19.9320.14

P值=0.4>α=0.05,接受原假设,两台机床加工精度无明显区别

6.方差分析

以淀粉为原料生产葡萄的过程中,残留许多糖蜜,可作为生产酱色的原料.在生产酱色的过程之前应尽可能彻彻底底除杂,以保证酱色质量.为此对除杂方法进行选择.在实验中选用5种不同的除杂方法,每种方法做4次试验,即重复4次,结果见下表:

不同除杂方法的除杂量

除杂方法Ai

除杂量Xij均量Xi

A1

A2

A3

A4

A5

25.622.228.029.826.4

24.430.029.027.527.7

25.027.723.032.227.0

28.828.031.525.928.6

20.621.222.021.221.3

9)SPSS方差分析:

1)将数据输入到SPSS中,修改变量视图的名称和类型,X修改为数值类型,小数点保留一位;

2)点击分析>一般线性模型>单变量>将x导入因变量,A导入固定因子>确定

结果:

主体间效应的检验

因变量:

X

III型平方和

df

均方

F

Sig.

校正模型

131.957a

4

32.989

4.306

.016

截距

13707.848

1

13707.848

1789.303

.000

A

131.957

4

32.989

4.306

.016

误差

114.915

15

7.661

总计

13954.720

20

校正的总计

246.872

19

a.R方=.535(调整R方=.410)

结果分析:

Sig=0.016<0.05所以拒绝原假设,即五种除杂方法有显著差异。

10)R语言单因子方差分析:

输入代码:

X<-c(25.6,22.2,28.0,29.8,24.4,30.0,29.0,27.5,25.0,27.7,

23.0,32.2,28.8,28.0,31.5,25.9,20.6,21.2,22.0,21.2)

A<-factor(rep(1:

5,each=4))

miscellany<-data.frame(X,A)

aov.mis<-aov(X~A,data=miscellany)

summary(aov.mis)

结果:

DfSumSqMeanSqFvaluePr(>F)

A413233.04.310.016*

Residuals151157.7

---

Signif.codes:

0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1

上述结果中,Df表示自由度;sumSq表示平方和;MeanSq表示均方和;Fvalue表示F检验统计量的值,即F比;Pr(>F)表示检验的p值;A就是因素A;Residuals为残差.

F=4.31>F0.05(5-1,20-5)=3.06,或者p=0.016<0.05所以拒绝原假设,即五种除杂方法有显著差异。

由图可知,第五种方法有着明显的差异

五六章相关分析与回归

Q4:

某医生测定了10名孕妇的15-17周及分娩时脐带血TSH(Mu/L)水平.

母血TSH(X)

1.211.301.391.421.471.561.681.721.982.10

脐带血(Y)

3.904.504.204.834.164.934.324.994.705.20

问X、Y是否是正相关关系?

11)SPSS相关分析:

步骤:

1,先测定是否符合正态分布

1)将数据输入到SPSS中,修改变量视图的名称和类型,X、Y修改为数值类型,小数点保留两位;

2)点击分析>非参数分析>旧对话框>单样本ks检验>将x导入检验变量列表中>选中检验分布中的常规>确定

结果输出与分析:

单样本Kolmogorov-Smirnov检验

X

N

10

正态参数a,b

均值

1.5830

标准差

.28856

最极端差别

绝对值

.152

.152

-.116

Kolmogorov-SmirnovZ

.482

渐近显著性(双侧)

.974

a.检验分布为正态分布。

b.根据数据计算得到。

渐近显著性(双侧)=0.974>0.05,不能拒绝原假设,即X、Y符合正态分布。

2,由步骤一得出可进行Pearson相关分析

1)分析>相关>双变量>变量:

x,y,选中Pearson>确定

结果:

P值0.03<0.05所以,变量X、Y相关

相关性

x

y

x

Pearson相关性

1

.681*

显著性(双侧)

.030

N

10

10

y

Pearson相关性

.681*

1

显著性(双侧)

.030

N

10

10

*.在0.05水平(双侧)上显著相关。

12)R语言Pearson相关:

Pearson'sproduct-momentcorrelation

data:

xandy

t=2.6,df=8,p-value=0.03

alternativehypothesis:

truecorrelationisnotequalto0

95percentconfidenceinterval:

0.089430.91723

sampleestimates:

cor

0.6807

P值0.03<0.05所以,变量X、Y相关

为了看出它们之间的关系,我们做一元线性回归:

huigui<-lm(y~x)

summary(huigui)

plot(x,y)

abline(huigui)

回归结果:

Call:

lm(formula=y~x)

Residuals:

Min1QMedian3QMax

-0.3497-0.2925-0.03460.26260.4196

Coefficients:

EstimateStd.ErrortvaluePr(>|t|)

(Intercept)2.9940.6104.910.0012**

x0.9970.3792.630.0303*

---

Signif.codes:

0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1

Residualstandarderror:

0.328on8degreesoffreedom

MultipleR-squared:

0.463,AdjustedR-squared:

0.396

F-statistic:

6.91on1and8DF,p-value:

0.0303

回归方程:

y=2.9904x+0.997

13)SPSS回归分析:

1,一元线性回归

Q5:

某地一年中测得每个月份的平均气温(x)及平均地温(y),问x、y是否存在线性相关关系。

月份

气温(x)

地温(y)

1

-4.7

-3.6

2

-2.3

-1.4

3

4.4

5.1

4

13.2

14.5

5

20.2

22.3

6

24.2

26.9

7

26.0

28.2

8

24.6

26.5

9

19.5

21.1

10

12.5

13.4

11

4.0

4.6

12

-2.8

-1.9

步骤:

1)将数据导入到SPSS中,更改变量视图。

2)点击分析>回归>线性>因变量:

地温,自变量:

气温

结果:

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

-.786

.163

-4.813

.001

气温

.952

.009

1.000

101.192

.000

a.因变量:

地温

分析:

因为Sig=0.000<0.05.两者线性相关差异大。

2.多元线性回归

Q6:

某地理要素Y的变化可能受到地理因素X1、X2、X3的综合影响,请根据样本观测数据,分析X与Y之间是否存在线性关系。

y

x1

x2

x3

5.78

3.9

1.2

40.76

4.38

5.2

2.5

42.48

2.27

4.8

4.5

55.13

3.65

8.2

1.1

44.67

3.12

8.4

2.6

42.44

1.9

8.9

3.6

50.61

3.42

6.7

1.2

49.32

1.53

7.9

1.5

65.03

1.03

9.8

1.3

63.94

0.09

7.8

3.2

72.63

步骤:

1)将数据输入SPSS,更改变量视图。

2)点击分析>回归>线性>因变量:

Y,自变量:

x1,x2,x3>确定

结果:

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

11.683

.290

40.295

.000

x1

-.362

.031

-.415

-11.562

.000

x2

-.420

.047

-.298

-9.009

.000

x3

-.103

.005

-.677

-18.749

.000

a.因变量:

y

所以:

X与Y之间存在线性关系

14)R语言回归分析:

27名糖尿病人的血清总胆固醇(X1)、甘油三酯(X2)、空腹胰岛素(X3)、糖化血红蛋白(X4)、空腹血糖(Y)的测量值列于下表中,试建立血糖与其它指标的多元线性回归方程,并作进一步分析.

27名糖尿病人的指标

Y

X1

X2

X3

X4

1

11.2

5.68

1.9

4.53

8.2

2

8.8

3.79

1.64

7.32

6.9

3

12.3

6.02

3.56

6.95

10.8

4

11.6

4.85

1.07

5.88

8.3

5

13.4

4.6

2.32

4.05

7.5

6

18.3

6.05

0.64

1.42

13.6

7

11.1

4.9

8.5

12.6

8.5

8

12.1

7.08

3

6.75

11.5

9

9.6

3.85

2.11

16.28

7.9

10

8.4

4.65

0.63

6.59

7.1

11

9.3

4.59

1.97

3.61

8.7

12

10.6

4.29

1.97

6.61

7.8

13

8.4

7.97

1.93

7.57

9.9

14

9.6

6.19

1.18

1.42

6.9

15

10.9

6.13

2.06

10.35

10.5

16

10.1

5.71

1.78

8.53

8

17

14.8

6.4

2.4

4.53

10.3

18

9.1

6.06

3.67

12.79

7.1

19

10.8

5.09

1.03

2.53

8.9

20

10.2

6.13

1.71

5.28

9.9

21

13.6

5.78

3.36

2.96

8

22

14.9

5.43

1.13

4.31

11.3

23

16

6.5

6.21

3.47

12.3

24

13.2

7.98

7.92

3.37

9.8

25

20

11.54

10.89

1.2

10.5

26

13.3

5.84

0.92

8.61

6.4

27

10.4

3.84

1.2

6.45

9.6

多元回归计算:

y<-c(11.2,8.8,12.3,11.6,13.4,18.3,11.1,12.1,

9.6,8.4,9.3,10.6,8.4,9.6,10.9,10.1,

14.8,9.1,10.8,10.2,13.6,14.9,16.0,13.2,

20.0,13.3,10.4)

x1<-c(5.68,3.79,6.02,4.85,4.60,6.05,4.90,7.08,

3.85,4.65,4.59,4.29,7.97,6.19,6.13,5.71,

6.40,6.06,5.09,6.13,5.78,5.43,6.50,7.98,

11.54,5.84,3.84)

x2<-c(1.90,1.64,3.56,1.07,2.32,0.64,8.50,3.00,

2.11,0.63,1.97,1.97,1.93,1.18,2.06,1.78,

2.40,3.67,1.03,1.71,3.36,1.13,6.21,7.92,

10.89,0.92,1.20)

x3<-c(4.53,7.32,6.95,5.88,4.05,1.42,12.60,6.75,

16.28,6.59,3.61,6.61,7.57,1.42,10.35,8.53,

4.53,12.79,2.53,5.28,2.96,4.31,3.47,3.37,

1.20,8.61,6.45)

x4<-c(8.2,6.9,10.8,8.3,7.5,13.6,8.5,11.5,

7.9,7.1,8.7,7.8,9.9,6.9,10.5,8.0,

10.3,7.1,8.9,9.9,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 视频讲堂

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1