统计学.docx

上传人:b****5 文档编号:6199740 上传时间:2023-01-04 格式:DOCX 页数:23 大小:62.96KB
下载 相关 举报
统计学.docx_第1页
第1页 / 共23页
统计学.docx_第2页
第2页 / 共23页
统计学.docx_第3页
第3页 / 共23页
统计学.docx_第4页
第4页 / 共23页
统计学.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

统计学.docx

《统计学.docx》由会员分享,可在线阅读,更多相关《统计学.docx(23页珍藏版)》请在冰豆网上搜索。

统计学.docx

统计学

实验报告册

课程名称:

统计学

班级:

09财务管理2班

姓名:

李臣

学号:

095722029

学号:

095722029姓名:

李臣实验成绩:

实验一:

数据的图表展示

实验时间:

2011年4月26日第1-2节

实验地点:

公共实验室2

一、数据透视表的制作

根据教材P47页例3.2的原始资料资料(见实验一数据1)创建数据透视表

(1)实验要求:

编制如图3-12(P49)所示的数据透视表

(2)实验步骤:

参考教材P48-49

第1步:

在Excel工作表中建立数据清单

第2步:

选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】

第3步:

确定数据源区域

第4步:

在【向导—3步骤之3】中选择数据透视表的输出位置。

然后选择【布局】

第5步:

在【向导—布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”

第6步:

然后单击【确定】,自动返回【向导—3步骤之3】对话框。

然后单击【完成】,即可输出数据透视表

(3)实验结果:

 

 

 

家庭所在地区

 

 

 

性别

买衣物首选因素

数据

大型城市

乡镇地区

中小城市

总计

价格

求和项:

平均月生活费(元)

1100

1800

400

3300

 

 

求和项:

月平均衣物支出(元)

230

180

40

450

 

款式

求和项:

平均月生活费(元)

500

 

3000

3500

 

 

求和项:

月平均衣物支出(元)

150

800

950

 

品牌

求和项:

平均月生活费(元)

1000

800

1600

3400

 

 

求和项:

月平均衣物支出(元)

300

240

480

1020

男求和项:

平均月生活费(元)

2600

2600

5000

10200

男求和项:

月平均衣物支出(元)

680

420

1320

2420

价格

求和项:

平均月生活费(元)

700

400

2600

3700

 

 

求和项:

月平均衣物支出(元)

230

120

465

815

 

款式

求和项:

平均月生活费(元)

2100

 

1100

3200

 

 

求和项:

月平均衣物支出(元)

600

330

930

 

品牌

求和项:

平均月生活费(元)

500

800

 

1300

 

 

求和项:

月平均衣物支出(元)

50

80

130

女求和项:

平均月生活费(元)

3300

1200

3700

8200

女求和项:

月平均衣物支出(元)

880

200

795

1875

求和项:

平均月生活费(元)汇总

5900

3800

8700

18400

求和项:

月平均衣物支出(元)汇总

1560

620

2115

4295

二、频数分布表的编制

(一)使用Excel数据透视表

根据教材P51页例3.3的原始资料资料(见实验一数据2—透视表数据)编制频数分布表

(1)实验要求:

使用数据透视表编制一张如表3-4(P52)的频数分配表

(2)实验步骤:

参考教材P48-50

第1步:

选择【数据】菜单中的【数据透视表和数据透视图】

第2步:

确定数据源区域

第4步:

在【向导—3步骤之3】中选择数据透视表的输出位置。

然后选择【布局】

第5步:

在【向导—布局】对话框中,依次将“分类变量“(这里是饮料品牌)连续拖放两次:

一次拖至左边的“行”区域,一次拖至“数据”区域

第6步:

然后单击【确定】,自动返回【向导—3步骤之3】对话框。

然后单击【完成】,即可输出数据透视表

(3)实验结果:

计数项:

饮料类型

顾客性别

 

 

饮料类型

总计

果汁

1

5

6

矿泉水

6

4

10

绿茶

7

4

11

其他

2

6

8

碳酸饮料

6

9

15

总计

22

28

50

(二)使用FREQUENCY函数或直方图工具

根据教材P51页例3.3的原始资料资料(见实验一数据2—直方图与函数数据)编制频数分布表

(1)实验要求:

使用Excel中的FREQUENCY函数或直方图工具编制一张频数分配表

(2)实验步骤:

参考教材P64

第1步.选择与接受区域相临近的单元格区域,作为频数分布表输出的区域

第2步.选择统计函数中的【FREQUENCY】函数

第3步.在对话框【Date-array】输入数据区域,在【Bins-array】输入接受区

第4步.同时按下“ctrl-shift-Enter”组合键,即得到频数分布.

(3)实验结果:

需要对输出结果进行必要的编制

接收

频率

累积%

果汁

6

12.00%

矿泉水

10

32.00%

碳酸饮料

15

62.00%

绿茶

11

84.00%

其他

8

100.00%

其他

0

100.00%

三、茎叶图的制作

根据教材P61页例3.6的原始资料资料(见实验一数据3.sav)制作茎叶图

(1)实验要求:

使用SPSS的制作茎叶图

(2)实验步骤:

参考教材P64

第1步:

选择【Analyze】下拉菜单,并选择【Descriptivestatistics-Explore】选项进入主对话框

第2步:

在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可选【Histogram】以给出直方图)。

点击【Continue】回到主对话框。

点击【OK】

(3)实验结果:

销量Stem-and-LeafPlot

FrequencyStem&Leaf

3.0014.134

1.0014.9

5.0015.02334

4.0015.5689

8.0016.00112334

8.0016.55567888

13.0017.0112222233444

14.0017.55556677888999

7.0018.0012234

13.0018.5667777888999

6.0019.001244

11.0019.55666667788

5.0020.01233

5.0020.56789

6.0021.001134

2.0021.58

1.0022.3

3.0022.568

4.0023.3344

1.00Extremes(>=237)

Stemwidth:

10.00

Eachleaf:

1case(s)

四、箱线图的制作

根据教材P68页例3.7的原始资料资料(见实验一数据4.sav)制作箱线图

(1)实验要求:

使用SPSS的制作多批数据箱线图

(2)实验步骤:

参考教材P69

学号:

095722029姓名:

李臣实验成绩:

实验二:

数据的描述统计

68

89

88

84

86

87

75

73

72

68

75

82

97

58

81

54

79

76

95

76

71

60

90

65

76

72

76

85

89

92

64

57

83

81

78

77

72

61

70

81

1.实验内容:

某班40名学生的考试成绩数据如下:

学校规定:

60分以下为不及格,60~70分为及格,70~80分为中,80~90分为良,90~100分为优.

2.要求:

使用Excel或SPSS软件完成如下内容:

(1)用FREQUENCY函数将该班学生分为不及格,及格,中,良,优五组,编制一张次数分配表;

(2)采用描述统计工具计算该未分组数据的描述统计的相关指标;

(选择分析工具库中的描述统计工具)

(3)使用分组数据计算相关的指标;

依据分组表计算:

均值,方差,标准差,标准误差,众位,中位数

(4)对(3)和(4)的结果进行比较分析,看结论是否一致。

3.实验过程:

参考实验指导过程

附:

(1)使用SPSS中的相关工具完成数据分组※;

对资料进行分组:

Transform-Recode-IntoDifferentVariable

(2)使用SPSS对分组后的数据计算描述统计的相关指标※

对已分组的资料进行频数分析

对频数进行加权Data-WeightCases

求分组数据的频数分析表和描述统计量

Analyze-DescriptiveStatistics-Frequencies

实验结果:

(分别选用SPSS工具和EXCEL的描述统计工具)

(1):

按成绩分组

人数

60以下

3

60-70

6

70-80

15

80-90

12

90以上

4

合计

40

Statistics

68

平均

76.79487

标准误差

1.71332

中位数

76

众数

76

标准差

10.69968

方差

114.4831

峰度

-0.43916

偏度

-0.26523

区域

43

最小值

54

最大值

97

求和

2995

观测数

39

最大

(1)

97

最小

(1)

54

Statistics

组别

N

Valid

40

Missing

0

组别

Frequency

Percent

ValidPercent

CumulativePercent

Valid

60以下

3

7.5

7.5

7.5

60-70

6

15.0

15.0

22.5

70-80

15

37.5

37.5

60.0

80-90

12

30.0

30.0

90.0

90以上

4

10.0

10.0

100.0

Total

40

100.0

100.0

Statistics

CJFZ

N

Valid

40

Missing

0

Mean

77.0000

Median

77.5926(a)

Mode

75.00

Std.Deviation

10.66987

Variance

113.84615

Range

40.00

Minimum

55.00

Maximum

95.00

aCalculatedfromgroupeddata.

CJFZ

Frequency

Percent

ValidPercent

CumulativePercent

Valid

55.00

3

7.5

7.5

7.5

65.00

6

15.0

15.0

22.5

75.00

15

37.5

37.5

60.0

85.00

12

30.0

30.0

90.0

95.00

4

10.0

10.0

100.0

Total

40

100.0

100.0

学号:

095722029姓名:

李臣实验成绩:

实验三:

假设检验与方差分析

假设检验—实验内容与步骤

一、双样本等方差假设

实验内容:

甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:

cm)分别服从正态分布,并且有12=22。

为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。

在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?

(数据见假设检验数据1)

实验步骤:

参考实验指导

结果输出与分析:

t-检验:

双样本等方差假设

 

变量1

变量2

平均

19.925

20.14285714

方差

0.216428571

0.272857143

观测值

8

7

合并方差

0.242472527

假设平均差

0

df

13

tStat

-0.854848035

P(T<=t)单尾

0.204056849

t单尾临界

1.770933383

P(T<=t)双尾

0.408113698

t双尾临界

2.160368652

 

H0:

U1-U2=0H1:

U1-U2≠0a=0.05n1=8n2=7

t=-0.854848035<0,不能拒绝H0,没有证据表明两台机床加工的零件直径不一致

二、双样本异方差假设

实验内容:

“多吃谷物,将有助于减肥。

”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,一类为经常的谷类食用者(n1),一类为非经常谷类食用者(n2)。

然后测度每人午餐的大卡摄取量。

经过一段时间的实验,得到如右结果:

检验该假设(=0.05)(数据见假设检验数据2)

实验步骤:

参考实验指导和教材P230例11

结果输出与分析:

t-检验:

双样本异方差假设

 

变量1

变量2

平均

583

629.25

方差

2431.428571

3675.460526

观测值

15

20

假设平均差

0

df

33

tStat

-2.486888876

P(T<=t)单尾

0.009059379

t单尾临界

1.692360258

P(T<=t)双尾

0.018118757

t双尾临界

2.034515287

 

H0:

u1-u20H1:

u1-u2<0a=0.05n1=15,n2=20

t=-2.486888876拒绝H0,多吃谷物将有助于减肥。

三、成对双样本均值假设

实验内容:

一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。

为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:

在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?

(数据见假设检验数据3)

实验步骤:

参考实验指导和教材P235例10.15

结果输出与分析:

t-检验:

成对双样本均值分析

 

训练前

训练后

平均

101.25

91.4

方差

63.40277778

50.48888889

观测值

10

10

泊松相关系数

0.963753015

假设平均差

8.5

df

9

tStat

1.941268615

P(T<=t)单尾

0.042068932

t单尾临界

1.833112923

P(T<=t)双尾

0.084137865

t双尾临界

2.262157158

 

H0:

u1–u2≤8.5H1:

u1–u2>8.5a=0.05df=10-1=9

T=1.941268615拒绝H0,该俱乐部的宣称可信。

方差分析—实验内容与步骤(EXCEL)

一、单因素方差分析(参考教材P276)

实验内容:

教材例10.1

实验步骤:

①将数据输入工作表中

②选择菜单“工具”—“数据分析”,打开“数据分析”对话框

③选择其中的“方差分析:

单因素方差分析”,打开对话框

4正确填写相关信息后,点“确定”。

输出结果与分析:

SUMMARY

观测数

求和

平均

方差

列1

7

343

49

116.6667

列2

6

288

48

184.8

列3

5

175

35

108.5

列4

5

295

59

162.5

方差分析

差异源

SS

df

MS

F

P-value

Fcrit

组间

1456.609

3

485.5362

3.406643

0.038765

3.12735

组内

2708

19

142.5263

总计

4164.609

22

 

 

 

 

H0:

u1=u2=…=ui=…=ukH1:

u1(i=1,2,…,k)不全相等F>Fa,所以拒绝原假设,

表明行业对投诉次数的影响是显著的。

二、双因素方差分析(无交互作用)(参考教材P285)

实验内容:

教材例10.3

实验步骤:

参考单因素方差分析

输出结果与分析:

方差分析:

无重复双因素分析

SUMMARY

观测数

求和

平均

方差

行1

5

1721

344.2

233.7

行2

5

1739

347.8

295.7

行3

5

1685

337

442.5

行4

5

1424

284.8

249.2

列1

4

1356

339

1224.667

列2

4

1321

330.25

1464.25

列3

4

1357

339.25

822.9167

列4

4

1273

318.25

1538.917

列5

4

1262

315.5

241.6667

方差分析

差异源

SS

df

MS

F

P-value

Fcrit

13004.55

3

4334.85

18.10777

9.46E-05

3.490295

2011.7

4

502.925

2.100846

0.143665

3.259167

误差

2872.7

12

239.3917

总计

17888.95

19

 

 

 

 

H0:

u1,u2,u3,u4全相等H1:

u1,u2,u3,u4不全相等,F

表明不能认为地区对销售量有显著影响。

三、双因素方差分析(有交互作用)(参考教材P290)

实验内容:

教材例10.5

实验步骤:

①选择“工具”下拉菜单,并选择【数据分析】选项

②在分析工具中选择【方差分析:

可重复双因素分析】,然后选择【确定】

③当对话框出现时

在【输入区域】方框内键入数据区域(A1:

C11)

在【】方框内键入0.05(可根据需要确定)

在【每一样本的行数】方框内键入重复试验次数(5)

在【输出区域】中选择输出区域

选择【确定】

输出结果与分析:

方差分析:

可重复双因素分析

SUMMARY

路段1

路段2

总计

高峰

 

 

 

观测数

5

5

10

求和

127

105

232

平均

25.4

21

23.2

方差

1.3

2.5

7.066667

非高峰

 

 

 

观测数

5

5

10

求和

97

76

173

平均

19.4

15.2

17.3

方差

5.3

6.7

10.23333

总计

 

 

 

观测数

10

10

求和

224

181

平均

22.4

18.1

方差

12.93333

13.43333

方差分析

差异源

SS

df

MS

F

P-value

Fcrit

样本

174.05

1

174.05

44.06329

5.7E-06

4.493998

92.45

1

92.45

23.40506

0.000182

4.493998

交互

0.05

1

0.05

0.012658

0.911819

4.493998

内部

63.2

16

3.95

总计

329.75

19

 

 

 

 

H0:

μ1=…μi=…=μk;H1:

μi(i=1,2…k)不全相等,用于检验“时段”的P-value=0.0000

μ1=…μj=…=μr;H1:

μj(i=1,2…r)不全相等,用于检验“路段”的P-value=0.0002a=0.05,因此不拒绝原假设,没有证据表明时段和路段的交互作用对行车时间有显著影响。

学号:

095722029姓名:

李臣实验成绩:

实验四:

相关与回归分析

某产品的产量和单位成本的关系如下:

月份

1

2

3

4

5

6

产量(千件)

2

3

4

3

4

5

单位成本(元/件)

73

72

71

73

69

68

要求:

(1)判断产量和单位成本之间的相关关系

(2)估计单位成本对产量的回归直线,并解释每个参数的实际含义

(3)当产量为6000件时,单位成本的理论值为多少?

(4)计算估计标准误差

(5)对线型关系进行假设检验(a=0.05)

(6)对回归系数进行假设检验(a=0.05)

实验步骤:

参考给定的实验步骤

将原始数据输入到Excel工作表的B2:

C7单元格。

然后按下列步骤进行操作:

(1):

选择“工具”下拉菜单

(2):

选择“数据分析”选项

(3):

在分析工具中选择“回归”,然后选择“确定”

(4):

当对话框出现时

在“Y值输入区域”方框内键入B2:

B7

在“X值输入区域”方框内键入C2:

B7

在“输出选项”中选择输出区域,选择D3

SUMMARYOUTPUT

回归统计

MultipleR

0.909091

RSquare

0.826446

Ad

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1