应用统计学上机.docx

上传人:b****4 文档编号:24619664 上传时间:2023-05-29 格式:DOCX 页数:39 大小:463.16KB
下载 相关 举报
应用统计学上机.docx_第1页
第1页 / 共39页
应用统计学上机.docx_第2页
第2页 / 共39页
应用统计学上机.docx_第3页
第3页 / 共39页
应用统计学上机.docx_第4页
第4页 / 共39页
应用统计学上机.docx_第5页
第5页 / 共39页
点击查看更多>>
下载资源
资源描述

应用统计学上机.docx

《应用统计学上机.docx》由会员分享,可在线阅读,更多相关《应用统计学上机.docx(39页珍藏版)》请在冰豆网上搜索。

应用统计学上机.docx

应用统计学上机

应用统计学上机

工商管理学院

《应用统计学》

实验作业

 

班级

学号

姓名

上课教师

2017年11月

实验二建立数据文件

1.建立一个数据文件记录试录入以下数据,并按要求进行变量定义。

数据:

学号

姓名

性别

生日

身高(cm)

体重(kg)

英语(总分100分)

数学(总分100分)

生活费($人民币)

200201

刘一迪

1982.01.12

156.42

47.54

75

79

345.00

200202

许兆辉

1982.06.05

155.73

37.83

78

76

435.00

200203

王鸿屿

1982.05.17

144.6

38.66

65

88

643.50

1982.08.31

161.5

41.68

79

82

235.50

1982.09.17

161.3

43.36

82

77

867.00

1982.12.21

158

47.35

81

74

1982.10.18

161.5

47.44

77

69

1233.00

1982.07.06

162.76

47.87

67

73

767.80

1982.06.01

164.3

33.85

64

77

553.90

1982.09.12

144

33.84

70

80

343.00

1981.10.13

157.9

49.23

84

85

453.80

1981.12.6

176.1

54.54

85

80

843.00

200213

欧阳飞

1981.11.21

168.5

50.67

79

79

657.40

200214

贺以礼

1981.09.28

164.5

44.56

75

80

1863.90

200215

张放

1981.12.08

153

58.87

76

69

462.20

200216

陆晓蓝

1981.10.07

164.7

44.14

80

83

476.80

200217

吴挽君

1981.09.09

160.5

53.34

79

82

200218

李利

1981.09.14

147

36.46

75

97

452.80

200219

韩琴

1981.10.15

153.2

30.17

90

75

244.70

200220

黄捷蕾

1981.12.02

157.9

40.45

71

80

253.00

要求:

将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。

(1)变量名同表格名,以“()”内的内容作为变量标签。

对性别(Sex)设值标签“男=0;女=1”。

(2)正确设定变量类型。

其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。

(3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。

答案:

1准备工作。

打开SPAA

2选择变量视图,依次录入学号,姓名,性别等。

2.对大学生创业问题设计一份调查问卷。

要求格式正确,题目类型包括开放题、封闭题(单选、多选都有)、半封闭题三种类型,题目个数10-15个。

答案:

 

3.用第2题得到的调查问卷进行模拟调查(10份),并将得到的结果录入到SPSS中,

(1)将录入结果保存为xxx.sav文件,并将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。

答案:

 

实验三数据的整理

1.某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管理,收获后,测得各个地块生产的小麦的千粒重(g)数据资料如表3-1所示。

表3-1某地区小麦种植

id

甲村

id

乙村

中麦9号

豫展1号

中麦9号

豫展1号

1

2

3

4

5

43.11

42.15

37.59

38.23

40.19

48.91

45.63

41.59

44.23

37.43

6

7

8

9

10

43.87

36.71

43.59

40.83

42.51

44.75

45.67

43.15

46.71

39.55

要求:

分别按照“小麦品种”和“村”对小麦的千粒重(g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。

步骤:

1.准备工作。

打开3-1文件,通过文件--打开,将文件放入打开窗口。

2.选择数据---分类汇总。

3.打开分类汇总窗口,将小麦品种放入分组变量对话框中,将千粒重放入变量摘要对话框中。

4.选择函数选项,在函数对话框中选择均值选项

5.选择继续--确定,得出结果。

以此方式得出村对小麦千粒重的分类汇总。

2.某地20家企业的情况如表3-2所示。

表3-2企业年产值与年工资总额

编号

部门

所有制类型

年产值(万元)

职工人数(人)

年工资总额(万元)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

工业

交通

商业

交通

工业

工业

邮电通讯

商业

交通

工业

工业

交通

工业

工业

商业

邮电通讯

工业

工业

商业

交通

国有

国有

集体

个体

集体

国有

国有

个体

个体

国有

集体

个体

国有

集体

股份制

国有

国有

股份制

国有

国有

2805.58

1265.40

256.50

26.88

560.00

800.50

2580.98

125.45

590.60

950.00

1556.00

950.00

335.00

2455.08

1780.58

2500.00

775.00

3305.00

498.08

965.58

1235

605

105

20

223

568

890

65

148

325

485

354

105

680

646

485

354

1015

202

246

812.63

435.60

68.58

14.00

156.07

256.74

854.40

65.16

130.24

268.13

394.20

257.90

82.43

639.20

471.25

486.98

272.58

912.00

139.20

159.95

要求:

根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题:

(1)调用排序命令对企业按部门、年产值的主次顺序进行排序。

步骤:

1准备工作。

打开3-2文件,通过文件--打开,将文件放入文件打开窗口。

2.选择数据--排序个案。

3.打开排序个案对话框,将部门和年产值放入排序依据对话框中。

4.在排列顺序中选择降序。

5.选择确定按钮,得出结果。

(2)调用分类汇总命令分别按部门和所有制类型对年产值等指标进行分类汇总,并统计单位个数,分别以“将汇总变量添加到活动数据集”和“创建只包含汇总变量的新数据集”保存结果。

答案:

1.选择数据--分类汇总。

2.在分类汇总对话框中,将部门放入分组变量中,将年产值放入变量摘要中。

3.在保存对话框中,选择将汇总变量添加到活动数据集选项。

4.选择确定,得出结果。

1.选择数据--分类汇总。

2.在分类汇总对话框,将所有制形式放入分组变量对话框中,将年产值放入变量摘要对话框中。

3.在函数选项中,选择均值均值选项。

4.在保存对话框中,选择创建只包含汇总变量的新数据,将名称命名为所有制形式。

5.选择确定选项,得出结果。

3.根据习题2的数据文件进行“选择个案”实验练习,并回答下列问题:

(1)选择随机抽样方法,抽取约30%的个案作为样本,将此执行两次,所得到的样本是否相同?

步骤:

1.选择数据--排序个案

2.打开排序个案对话框,选择随机个案样本,在样本尺寸中选择大约,填入30.

3.选择继续--确定,得出结果。

4.重复此方式,得出结果。

分析:

得出结果不同。

(2)选择满足职工人数300人以上的个案;

步骤:

1选择数据--选择个案

2.在选择个案对话框中,选择如果条件满足选项。

3.在选择个案对话框中,输入职工人数(人)>300

4.选择继续--确定,得出结果。

(3)选择观测值在5至15之间的样本。

答案:

1.选择数据--选择个案-选择基于时间或个案全距。

2.在选择个案范围对话框中,将观测值设置为515.

3.选择继续--确定,得出结果。

 

实验四描述性统计分析和统计报告概述

1.根据数据4-1.sav,对某高班学生的体重做描述性分析,并对结果做简单的分析。

步骤:

1准备工作。

打开4-1文件,通过文件--打开将文件放入打开窗口。

2.选择分析--描述统计--描述。

3.在描述分析的对话框中,将体重放入变量对话框中。

4.选择统计量选项,勾选标准差,方差,均值等。

5.点击确定,得出结果。

 

2.根据数据4-2.sav,分析不同性别演员获得奥斯卡的年龄差异性。

步骤:

1准备工作。

打开4-2文件,通过文件--打开将文件放入打开窗口。

选择分析--描述统计---描述。

3.在打开描述对话框中,将男演员和女演员的年龄选入变量对话框。

4.选择选项,在选项对话框中,选择均值,偏值等。

5.选择确定,得出结果。

描述统计量

N

极小值

极大值

均值

标准差

偏度

峰度

统计量

统计量

统计量

统计量

统计量

统计量

标准误

统计量

标准误

男演员male

36

31

76

45.14

10.406

.898

.393

.704

.768

女演员female

36

21

80

38.94

13.546

1.503

.393

2.111

.768

有效的N(列表状态)

36

分析:

男演员获得奥斯卡奖的最小年龄为31岁,最大为76岁,女演员获得奥斯卡奖最小年龄为21岁,最大年龄沃日80岁,男演员获得奥斯卡奖的平均年龄大于女演员,且男演员获得奥斯卡的年龄差要小于女演员。

3.根据数据4-3.sav,进行下列统计和分析。

(1)对机械厂各部门职工人数进行频数分析,并绘制饼图;

步骤:

1准备工作。

打开文件4-3通过文件--打开将文件放入打开窗口。

2.选择分析--描述统计--频率。

3.在频率对话框中将车间部门放入变量对话框中。

4.选择统计量对话框,选择均值,偏值等选项。

5.在图表选项中,选择饼图。

6.选择确定,得出结果。

统计量

车间部门

N

有效

429

缺失

0

均值

2.78

中值

2.00

标准差

2.186

偏度

.787

偏度的标准误

.118

百分位数

25

1.00

50

2.00

75

4.00

分析:

从图中所知,在机器加工产的工人所占比例最多,在汽车队的工人最少。

(2)先将职工月平均工资按[200,300],[301,400],[401,500],[501,550]分为四等,再运用频数分析方法对各工资等级中职工总人数统计。

步骤:

1选择数据--选择个案。

2.在选择个案对话框中,选择如果,在弹出选择个案的对话框中,打入wage>=200&wage<=300

3.选择确定。

4.选择分析---描述统计--频率,将wage>=200&wage<=300放入变量对话框中。

5.选择确定,得出结果。

6.依次方式得出。

wage>=200&wage<=300(FILTER)

频率

百分比

有效百分比

累积百分比

有效

Selected

148

100.0

100.0

100.0

wage>=301&wage<=400(FILTER)

频率

百分比

有效百分比

累积百分比

有效

Selected

172

100.0

100.0

100.0

wage>=401&wage<=500(FILTER)

频率

百分比

有效百分比

累积百分比

有效

Selected

94

100.0

100.0

100.0

wage>=501&wage<=550(FILTER)

频率

百分比

有效百分比

累积百分比

有效

Selected

13

100.0

100.0

100.0

 

4.某研究者对某化工厂工人的工龄、性别、年龄和月工资情况进行了调查,见数据4-4.sav,试以被调查工人的工龄和性别为分组变量,对工人的月工资情况进行观测量概述。

步骤:

1.分析--报告---个案汇总

2.在个案汇总的对话框中,将工龄和性别放入分组变量对话框中,将月工资放入变量对话框中。

3.在统计量中选择均值作为单元格统计量。

4.选择选项对话框,将选项标题设置为分类汇总。

5.选择确定,得出结果。

案例处理摘要

案例

已包含

已排除

总计

N

百分比

N

百分比

N

百分比

月工资*工龄*性别

106

100.0%

0

.0%

106

100.0%

 

个案汇总

月工资

工龄

性别

N

均值

1

23

773.57

53

763.62

总计

76

766.63

2

6

958.33

24

891.67

总计

30

905.00

总计

29

811.79

77

803.53

总计

106

805.79

 

实验五单一样本t检验

1.某品牌洗衣粉生产过程中的设计重量为500克,低于这一重量被认为是不合格产品。

随机抽取了10袋洗衣粉,经过测量的洗衣粉重量数据。

假定总体服从正态分布,显著性水平为0.05,检验该样本结果能否表示该生产过程运作正常?

(基本数据见5-1.sav,洗衣粉重量)

步骤:

1.准备工作。

打开文件5-1,通过文件---打开将文件放入打开窗口。

2.分析---比较均值---单样本T检验

3.在检验对话框中,将重量放入检验对话框中。

4.将检验值设置为500.

5.选择选项按钮,将置信区间设置为95.

6.选择确定,得出结果。

单个样本统计量

N

均值

标准差

均值的标准误

重量

10

500.70

6.183

1.955

 

单个样本检验

检验值=500

t

df

Sig.(双侧)

均值差值

差分的95%置信区间

下限

上限

重量

.358

9

.729

.700

-3.72

5.12

分析:

洗衣粉的平均重量为500.7克,标准差为6.183,所得t值为0.358,样本均值和检验值差为0.729>0.05,则不能拒绝原假设,不存在显著差异。

2.我国2011年城镇单位就业人员年平均工资为41047.1元,浙江省11座城市城镇单位就业人员年平均工资如数据4-3.sav所示,假定总体服从正态分布,显著性水平为0.05,检验浙江城镇单位就业人员年平均工资和全国年平均工资水平是否有显著性差异(基本数据见5-2.sav)。

步骤:

1准备工作。

打开5-1文件,通过文件--打开将文件放入打开窗口。

2.选择分析---比较均值--单样本T检验。

3.打开单样本T检验,将平均工资放入检验变量对话框中,在选项中将置信区间设置为95.

4.将检验值设置为41047.1

5.选择继续---确定,得出答案。

单个样本统计量

N

均值

标准差

均值的标准误

平均工资

11

46137.73

5169.869

1558.774

单个样本检验

检验值=0

t

df

Sig.(双侧)

均值差值

差分的95%置信区间

下限

上限

平均工资

29.599

10

.000

46137.727

42664.56

49610.89

分析:

浙江省内城镇平均工资为46137.73,得t值为29.599,样本均值和检验值的差为0.00<0.05,则拒绝原假设,存在明显差异。

3.某班学生的高考数学成绩见数据5-3.sav,试对其做独立样本T检验,以研究该班学生不通性别学生之间成绩有误明显差别。

步骤:

1准备工作。

打开文件5-3,通过文件-打开将文件放入打开窗口。

2.选择分析--比较均值--独立样本T检验。

3.在打开独立样本T检验对画框中,将高考数学成绩放入检验变量对话框中,将性别放入分组变量对话框中,选择定义组,将性别定义成12.

4.选择确定按钮。

5.在选项中,选择均值,标准差等等。

组统计量

性别

N

均值

标准差

均值的标准误

高考数学成绩

16

126.88

11.454

2.863

16

119.88

9.018

2.254

独立样本检验

方差方程的Levene检验

均值方程的t检验

F

Sig.

t

df

Sig.(双侧)

均值差值

标准误差值

差分的95%置信区间

下限

上限

高考数学成绩

假设方差相等

.407

.529

1.921

30

.064

7.000

3.644

-.443

14.443

假设方差不相等

1.921

28.434

.065

7.000

3.644

-.460

14.460

分析:

高考数学成绩,男生平均分为126.88,女生为119.88,得出t值为1.921,所对应的p值为0.064,>0.05,则不能拒绝原假设,男女高考数学成绩不存在显著差异。

在假设方差不存在的情况下,所得p值为0.065>0.05,不能拒绝原假设,男女高考数学成绩不存在显著差异。

4为研究一种减肥药品的效果,将抽取了20名试验者进行试验,服用该产品一个疗程前后的体重,试用配对样本t检验的方法判断该药物能否引起实验者体重的明显变化。

数据见5-4.sav。

步骤:

1准备工作。

打开文件5-3,通过文件-打开将文件放入打开窗口。

2.选择分析--比较均值--配对样本T检验。

3.在配对样本对话框中,将服药前后的体重分别放入对话框中。

4.选择确定,得出结果。

成对样本统计量

均值

N

标准差

均值的标准误

对1

服药前体重

74.540

20

9.2440

2.0670

服药后体重

74.000

20

6.9309

1.5498

成对样本检验

成对差分

t

df

Sig.(双侧)

均值

标准差

均值的标准误

差分的95%置信区间

下限

上限

对1

服药前体重-服药后体重

.5400

3.1488

.7041

-.9337

2.0137

.767

19

.453

成对样本相关系数

N

相关系数

Sig.

对1

服药前体重&服药后体重

20

.964

.000

分析:

服药前的平均体重为74.54,服药后的体重为74,相对应的样本均值和检测值的差为0.00<0.05,则拒绝原假设,存在明显差异。

 

实验六统计抽样与参数估计

1.背景资料:

有几位大学生组成的调查组,为了解他们所在地区居民的收入情况,作为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表6-1所示。

表6-1样本数据单位:

万元

3.12

1.88

2.13

2.11

3.21

0.90

1.67

2.45

3.50

2.87

1.66

1.89

2.50

3.26

2.36

1.76

0.68

0.88

0.75

2.44

2.50

3.20

1.60

1.30

2.10

2.15

2.80

2.50

3.10

0.60

1.10

2.10

2.61

1.46

0.92

4.20

3.65

1.32

3.39

4.00

2.60

1.35

1.80

2.90

2.20

2.30

1.50

1.10

0.90

1.50

2.60

2.30

2.40

1.15

0.70

2.70

1.30

1.20

1.50

2.60

2.50

2.50

1.15

2.13

2.50

1.90

1.40

0.75

0.85

1.70

1.60

2.40

2.10

3.10

2.69

3.34

3.88

2.66

2.15

2.60

1.80

1.90

1.80

0.95

0.75

1.48

1.60

2.50

2.30

2.60

2.55

2.45

1.65

1.80

2.66

2.35

2.44

1.88

3.25

3.85

1.35

2.15

2.60

1.90

2.66

2.49

4.10

2.58

1.98

1.25

3.12

2.11

3.00

4.32

5.80

1.55

2.18

2.67

2.88

1.95

1.49

2.45

2.66

1.78

2.75

3.35

3.40

1.50

2.80

2.40

1.90

2.66

2.70

1.66

2.22

2.90

3.50

2.77

3.42

2.75

1.89

1.45

3.12

3.33

2.69

1.58

2.58

1.86

2.85

3.55

3.19

3.78

3.77

2.99

2.08

3.03

2.89

2.42

2.90

1.54

1.11

2.60

2.80

3.20

3.33

4.11

4.00

2.68

1.80

2.35

2.20

1.50

3.80

2.40

2.30

3.90

4.10

5.90

3

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 自然景观

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1