应用统计学学课设.docx

上传人:b****0 文档编号:12722911 上传时间:2023-04-21 格式:DOCX 页数:21 大小:130.40KB
下载 相关 举报
应用统计学学课设.docx_第1页
第1页 / 共21页
应用统计学学课设.docx_第2页
第2页 / 共21页
应用统计学学课设.docx_第3页
第3页 / 共21页
应用统计学学课设.docx_第4页
第4页 / 共21页
应用统计学学课设.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

应用统计学学课设.docx

《应用统计学学课设.docx》由会员分享,可在线阅读,更多相关《应用统计学学课设.docx(21页珍藏版)》请在冰豆网上搜索。

应用统计学学课设.docx

应用统计学学课设

学号

 

(应用统计学课程设计)

设计说明书

运用SPSS对大学生上网情况的统计分析

起止日期:

2011年6月6日至2011年6月24日

 

学生姓名

班级

09级电子商务1班

成绩

指导教师(签字)

 

管理工程系

2011年6月24日

目录

1选用的分析方法2

2描述性分析2

2.1大学生上网情况的描述性统计输出结果2

2.2数据分析2

2.2.1网龄2

2.2.2每周上网时间3

2.2.3每周计划上网时间3

2.2.4每周玩游戏时间3

3.统计图3

3.1大学生上网情况统计图输出结果3

3.2数据分析4

4统计报表4

5相关分析5

5.1大学生上网情况相关分析输出结果5

5.2数据分析6

6偏相关相关分析7

6.1大学生上网情况偏相关相关分析输出结果7

6.2数据分析8

7一元线性回归分析8

7.1大学生上网情况一元线性回归分析输出结果8

7.2数据分析9

8多元线性回归分析10

8.1大学生上网情况多元线性回归分析输出结果10

8.2数据分析11

总结12

附原始数据12

 

1选用的分析方法

在本次调查中主要运用的分析方法有:

描述性分析、统计图、统计报表、均值比较、相关分析、偏相关分析、一元线性回归分析、多元线性回归分析。

2描述性分析

2.1大学生上网情况的描述性统计输出结果

统计表

网龄(y)

每周上网时间(h)

每周计划上网时间(h)

每周玩游戏时间(h)

N

有效

40

40

40

40

缺失

0

0

0

0

均值

4.65

28.10

20.70

9.18

均值的标准误

.382

2.306

1.869

1.354

中值

4.50

26.50

15.00

5.00

众数

2

10a

15

4

标准差

2.413

14.585

11.820

8.566

方差

5.823

212.708

139.703

73.379

偏度

.481

.640

2.410

1.957

偏度的标准误

.374

.374

.374

.374

峰度

-.763

-.476

7.379

3.868

峰度的标准误

.733

.733

.733

.733

全距

9

51

60

38

极小值

1

9

10

2

极大值

10

60

70

40

186

1124

828

367

a.存在多个众数,显示最小值

b.表示最小值

2.2数据分析

2.2.1网龄

从结果中可以看出,这40位大学生网龄的均值为4.65年,平均标准误差为0.382,中位数为4.50年,众数为2年,标准差为2.413年,方差为5.823年,偏度为0.481年,偏度标准误差0.374年,峰度为-0.763年,峰度标准误差0.733年,全距位9年,极小值1年,极大值10年,合计为186年。

2.2.2每周上网时间

从结果中可以看出,这40位大学生每周上网时间的均值为28.10小时,平均标准误差为2.306,中位数为26.50小时,众数为10小时,标准差为14.585小时,方差为212.708小时,偏度为0.640小时,偏度标准误差0.374小时,峰度为-0.476小时,峰度标准误差0.733小时,全距位51小时,极小值9小时,极大值60小时,合计为1124小时。

2.2.3每周计划上网时间

从结果中可以看出,这40位大学生每周计划上网时间的均值为20.70小时,平均标准误差为1.869,中位数为15.00小时,众数为15小时,标准差为11.820小时,方差为139.703小时,偏度为2.410小时,偏度标准误差0.374小时,峰度为7.379小时,峰度标准误差0.733小时,全距位60小时,极小值10小时,极大值70小时,合计为828小时。

2.2.4每周玩游戏时间

从结果中可以看出,这40位大学生每周玩游戏时间的均值为9.18小时,平均标准误差为1.354,中位数为5.00小时,众数为4小时,标准差为8.566小时,方差为73.379小时,偏度为1.954小时,偏度标准误差0.374小时,峰度为3.868小时,峰度标准误差0.733小时,全距位38小时,极小值2小时,极大值40小时,合计为367小时。

3.统计图

3.1大学生上网情况统计图输出结果

3.2数据分析

该图反映了大一至大四年级学生的网龄、每周上网时间、每周计划上网时间和每周玩游戏时间各项的比较和趋势,且反映了各个年级不同的上网情况。

4统计报表

大学生上网情况统计表a

网龄(y)

每周上网时间(h)

每周计划上网时间(h)

每周玩游戏时间(h)

1

2

10

12

5

2

2

15

13

8

3

4

17

13

3

4

1

9

12

3

5

3

10

15

4

6

5

33

24

5

7

7

37

28

4

8

3

30

20

5

9

2

14

15

3

10

8

16

20

5

11

2

55

20

13

12

2

36

27

13

13

4

16

15

4

14

2

39

50

5

15

5

40

29

14

16

2

33

12

4

17

2

18

15

4

18

4

35

24

3

19

2

17

14

4

20

2

13

10

2

21

9

20

15

4

22

8

55

70

30

23

6

60

35

28

24

5

28

14

16

25

7

32

20

18

26

6

17

13

5

27

3

18

12

8

28

4

25

18

9

29

5

45

28

21

30

3

20

15

7

31

9

21

14

8

32

8

60

40

40

33

4

35

21

20

34

5

10

10

3

35

6

48

30

14

36

8

16

14

4

37

5

36

15

4

38

10

37

25

5

39

5

35

21

10

40

6

13

10

2

总计

N

40

40

40

40

均值

4.65

28.10

20.70

9.18

极小值

1

9

10

2

极大值

10

60

70

40

限于前100个案例。

5相关分析

5.1大学生上网情况相关分析输出结果

描述性统计量

均值

标准差

N

每周上网时间(h)

28.10

14.585

40

网龄(y)

4.65

2.413

40

 

相关性

每周上网时间(h)

网龄(y)

每周上网时间(h)

Pearson相关性

1

.284

显著性(双侧)

.076

平方与叉积的和

8295.600

389.400

协方差

212.708

9.985

N

40

40

网龄(y)

Pearson相关性

.284

1

显著性(双侧)

.076

平方与叉积的和

389.400

227.100

协方差

9.985

5.823

N

40

40

5.2数据分析

(1)输出结果文件中第一个表格为描述性统计量表。

从图中可知,参与分析的两个变量样本数均为40,每周上网时间均值为28.10小时,标准差为14.585,网龄均值为4.65年,标准差为2.413。

(2)输出结果的文件中第二个表格为相关系数及显著性检验结果。

从图中可知,每周上网时间和网龄的相关系数r=0.284显著水平为0.076,。

因此系数旁边用两个**号进行标识,表示其关系十分显著。

6偏相关相关分析

6.1大学生上网情况偏相关相关分析输出结果

 

描述性统计量

均值

标准差

N

每周上网时间(h)

28.10

14.585

40

每周玩游戏时间(h)

9.18

8.566

40

每周计划上网时间(h)

20.70

11.820

40

相关性

控制变量

每周上网时间(h)

每周玩游戏时间(h)

每周计划上网时间(h)

-无-a

每周上网时间(h)

相关性

1.000

.755

.749

显著性(双侧)

.

.000

.000

df

0

38

38

每周玩游戏时间(h)

相关性

.755

1.000

.647

显著性(双侧)

.000

.

.000

df

38

0

38

每周计划上网时间(h)

相关性

.749

.647

1.000

显著性(双侧)

.000

.000

.

df

38

38

0

每周计划上网时间(h)

每周上网时间(h)

相关性

1.000

.535

显著性(双侧)

.

.000

df

0

37

每周玩游戏时间(h)

相关性

.535

1.000

显著性(双侧)

.000

.

df

37

0

a.单元格包含零阶(Pearson)相关。

6.2数据分析

(1)输出结果文件中第一个表格为描述性统计量表。

从图中可知,参与分析的三个变量样本数均为40,其中每周上网时间均值为28.10小时,标准差为14.585,每周玩游戏时间均值为9.18小时,标准差为8.566。

每周计划上网时间均值为20.70小时,标准差为11.820。

(2)输出结果的文件中第二个表格为相关系数、偏相关系数及显著性检验结果。

从图中可知,每周上网时间和每周玩游戏时间的相关系数r=0.647,对应的显著水平为0.000,即每周上网时间和每周玩游戏时间是相关性的;以每周计划上网时间为控制变量,即在扣除每周计划上网时间影响情况下,每周上网时间和每周玩游戏时间的相关系数r=0.535,对应的显著水平为0.000,可得出结论,在扣除每周计划上网时间影响情况下,每周上网时间和每周玩游戏时间相关性显著。

7一元线性回归分析

7.1大学生上网情况一元线性回归分析输出结果

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.755a

.570

.558

5.693

a.预测变量:

(常量),每周上网时间(h)。

b.因变量:

每周玩游戏时间(h)

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

1630.085

1

1630.085

50.291

.000a

残差

1231.690

38

32.413

总计

2861.775

39

a.预测变量:

(常量),每周上网时间(h)。

b.因变量:

每周玩游戏时间(h)

系数a

模型

非标准化系数

标准系数

t

Sig.

相关性

B

标准误差

试用版

零阶

部分

1

(常量)

-3.281

1.974

-1.662

.105

每周上网时间(h)

.443

.063

.755

7.092

.000

.755

.755

.755

a.因变量:

每周玩游戏时间(h)

7.2数据分析

(1)输出结果文件的第一个表格为常用统计量,反映的是一元线性回归模型的拟合的情况,相关系数R=0.755,决定系数

=0.570,调整决定系数

0.558,回归估计的标准差为S=5.693,模型拟合效果很理想。

(2)输出结果文件的第二个表格为方差分析表。

从表中可知离差平平方和2861.775,残差平方和1231.690,回归平方和1630.085。

回归方程显著性检验中,统计量F=50.291,对应的置信水平为0.000,远比常用置信水平0.05小,因此可以认为方程是极显著的。

(3)第三个标着为回归系数分析表,是回归系数以及回归方程系数的检验结果,系数显著性采用t检验。

从表中可以看出回归方程的常数项为-3.281,回归系数为0.443.回归系数检验统计量为7.092,Sig为相伴概率值小于0.001。

由此可知回归方程为

Y=-3.281+7.092X

回归系数显著水平均为0.000,表明t统计检验量假设回归系数等于0的概率为0.000,远比常用的置信水平0.05要小,因此认为两个变量之间的线性关系是极为显著的,建立的回归方程有效。

(4)输出的图为正态分布图。

该图是用来观察标准化残差的分布是否符合正态分布,如果是,则图中散点应近乎一条直线,体重的纵坐标为因变量(每周玩游戏时间),横坐标为自变量(每周上网时间),散点代表了用建立的回归方程计算的各个每周上网时间下的每周玩游戏时间,图中各点的连线就是建立的回归直线。

8多元线性回归分析

8.1大学生上网情况多元线性回归分析输出结果

描述性统计量

均值

标准偏差

N

每周玩游戏时间(h)

9.18

8.566

40

每周上网时间(h)

28.10

14.585

40

网龄(y)

4.65

2.413

40

相关性

每周玩游戏时间(h)

每周上网时间(h)

网龄(y)

Pearson相关性

每周玩游戏时间(h)

1.000

.755

.309

每周上网时间(h)

.755

1.000

.284

网龄(y)

.309

.284

1.000

Sig.(单侧)

每周玩游戏时间(h)

.

.000

.026

每周上网时间(h)

.000

.

.038

网龄(y)

.026

.038

.

N

每周玩游戏时间(h)

40

40

40

每周上网时间(h)

40

40

40

网龄(y)

40

40

40

 

输入/移去的变量b

模型

输入的变量

移去的变量

方法

1

每周上网时间(h)a

.

输入

2

网龄(y)a

.

输入

a.已输入所有请求的变量。

b.因变量:

每周玩游戏时间(h)

模型汇总c

模型

R

R方

调整R方

标准估计的误差

1

.755a

.570

.558

5.693

2

.761b

.579

.557

5.703

a.预测变量:

(常量),每周上网时间(h)。

b.预测变量:

(常量),每周上网时间(h),网龄(y)。

c.因变量:

每周玩游戏时间(h)

Anovac

模型

平方和

df

均方

F

Sig.

1

回归

1630.085

1

1630.085

50.291

.000a

残差

1231.690

38

32.413

总计

2861.775

39

2

回归

1658.357

2

829.178

25.494

.000b

残差

1203.418

37

32.525

总计

2861.775

39

a.预测变量:

(常量),每周上网时间(h)。

b.预测变量:

(常量),每周上网时间(h),网龄(y)。

c.因变量:

每周玩游戏时间(h)

8.2数据分析

(1)输出的第一个表为参与回归分析的三个变量的描述统计表,从表中可以看出,参与分析的每周上网时间,网龄,每周玩游戏时间样本数均为40。

每周上网时间均值为28.10小时,标准差为14.585,网龄均值为4.65年,标准差为2.413,每周玩游戏时间均值为9.18小时,标准差为8.566。

(2)第二个表格为参与回归分析的三个变量的相关系数及其检验。

表中内用可分为三部分,pearsoncorrelation中给出了三个变量的两两相关系数表,因变量每周玩游戏时间与自变量每周上网时间的相关系数最大,两个变量之间也存在一定程度的相关。

Sig.(单侧)栏是三个变量两两相关的显著性检验结果表。

最底下一栏N,给出了各个变量的样本数。

(3)第三个表依次列出了模型对自变量的筛选过程,即变量进入/退出模型的情况。

第一个进入的是每周上网时间,第二个进入的是网龄。

(4)第四个表位回归方程拟合总结表,模型1每周上网时间的相关系数R=0.755,决定系数

0.570,调整决定系数

0.558,标准误差估计值为5.693;模型2网龄相关系数R=0.761,决定系数

0.579,调整决定系数为

0.557,标准误差估计值5.703。

(5)第五个表中为回归方程的方差分解及检验结果。

回归方程的统计模型1每周上网时间的F=50.291,模型2网龄的F=25.494,P=0.000,可见方程极为显著。

总结

本次课设所研究的问题是:

大学生上网情况。

采用的调查方式是发放调查问卷,在自习室发放了80份问卷,收回80份,其中有效80份,我们抽取其中不同年级、不同性别40份收集数据。

所采集数据基本可以反映我校学生的上网情况。

对于采集回来的数据我们主要分析了年级、性别、网龄、每周上网时间、每周计划上网时间、每周玩游戏时间相互间的差别与联系,可以得出:

大一学生由于宿舍没通网,上网时间偏短;大四学生面临毕业,呈现两级分化,即有的学生上网时间较长,有的几乎不上;大二、大三学生上网时间较长,并且玩游戏时间也较长。

学生普遍的都是实际上网时间超出计划上网时间,这说明比较缺乏自控力。

每周上网时间和每周玩游戏时间之间的线性关系极为显著,说明学生上网主要是玩游戏,不能正确地利用网络。

附原始数据

编号

年级

性别

网龄(y)

每周上网时间(h)

每周计划上网时间(h)

每周玩游戏时间(h)

1

大一

2

10

12

5

2

大一

2

15

13

8

3

大一

4

17

13

3

4

大一

1

9

12

3

5

大一

3

10

15

4

6

大一

5

33

24

5

7

大一

7

37

28

4

8

大一

3

30

20

5

9

大一

2

14

15

3

10

大一

8

16

20

5

11

大二

2

55

20

13

12

大二

2

36

27

13

13

大二

4

16

15

4

14

大二

2

39

50

5

15

大二

5

40

29

14

16

大二

2

33

12

4

17

大二

2

18

15

4

18

大二

4

35

24

3

19

大二

2

17

14

4

20

大二

2

13

10

2

21

大三

9

20

15

4

22

大三

8

55

70

30

23

大三

6

60

35

28

24

大三

5

28

14

16

25

大三

7

32

20

18

26

大三

6

17

13

5

27

大三

3

18

12

8

28

大三

4

25

18

9

29

大三

5

45

28

21

30

大三

3

20

15

7

31

大四

9

21

14

8

32

大四

8

60

40

40

33

大四

4

35

21

20

34

大四

5

10

10

3

35

大四

6

48

30

14

36

大四

8

16

14

4

37

大四

5

36

15

4

38

大四

10

37

25

5

39

大四

5

35

21

10

40

大四

6

13

10

2

 

《应用统计学》课程设计

组内任务分配情况说明

完成人员:

任务分配情况

序号

姓名

学号

承担主要任务

贡献等级

1

调查问卷分发,部分数据分析,报告修改

1

2

调查问卷制作,部分数据分析,报告书写

2

3

调查问卷分发,部分数据分析,数据统计

3

4

调查问卷分发,部分数据分析,数据统计

4

注:

1.“完成人员”排序要与课程设计报告书封面人员排序一致;

2.“承担主要任务”的填写要详细;

3.“贡献等级”一栏显示团队成员在课程设计任务中所作的工作量,贡献由大到小依次为1、2、3、4(贡献最大的为1,贡献最小的为4),要求每一等级为1人。

 

签字确认:

、、、。

2011年6月24日

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 冶金矿山地质

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1