统计学课内实验分析报告详解+心得.docx
《统计学课内实验分析报告详解+心得.docx》由会员分享,可在线阅读,更多相关《统计学课内实验分析报告详解+心得.docx(21页珍藏版)》请在冰豆网上搜索。
统计学课内实验分析报告详解+心得
统计学课内实验报告(详解+心得)
————————————————————————————————作者:
————————————————————————————————日期:
一.实验目的及要求
(一)目的
实验一:
EXCEL的数据整理与显示
1.了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;
2.熟悉EXCEL用于预处理的基本菜单操作及命令;
3.熟悉EXCEL用于整理与显示的基本菜单操作及命令。
实验二:
EXCEL的数据特征描述、抽样推断
熟悉EXCEL用于数据描述统计、抽样推断
实验三:
时间序列分析
掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。
实验四:
一元线性回归分析
掌握EXCEL用于相关与回归分析的基本操作及命令。
(二)要求
1、按要求认真完成实验任务中规定的所有练习;
2、实验结束后要撰写格式规范的实验报告,正文统一用小四号字,必须有页码;
3、实验报告中的图表制作要规范,图表必须有名称和序号;
4、实验结果分析既要简明扼要,又要能说明问题。
二、实验任务
实验一
根据下面的数据。
1.1用Excel制作一张组距式次数分布表,并绘制一张条形图(或柱状图),反映工人加工零件的人数分布情况。
从某企业中按随即抽样的原则抽出50名工人,以了解该企业工人生产状况(日加工零件数):
117108110112137122131118134114124125123
127120129117126123128139122133119124107
133134113115117126127120139130122123123
128122118118127124125108112135509
1.2整理成频数分布表,并绘制直方图。
1.3假设日加工零件数大于等于130为优秀。
实验二
百货公司6月份各天的销售额数据如下(单位:
万元)
257276297252238310240236265278
271292261281301274267280291258
272284268303273263322249269295
(1)计算该百货公司日销售额的均值、众数、中位数;
(2)计算该百货公司日销售额的极差、标准差;
(3)计算日销售额分布的偏态系数和峰度系数。
实验三
根据实验一数据,
(1)计算特征值;
(2)在95.45%的概率保证度下,判断该企业职工的平均日加工零件数及优秀率的区间。
实验四
1、综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,对某小区居民用电量(千度)季节数据的构成要素进行分解,并作出图形进行分析。
月度
第一年
第二年
第三年
第四年
1
501
574
585
542
2
447
469
455
438
3
345
366
352
341
4
354
327
341
427
5
374
412
388
358
6
359
353
332
355
7
365
381
392
376
8
437
460
429
441
9
353
344
361
382
10
295
311
291
377
11
454
453
395
398
12
457
486
491
473
实验五
综合运用统计学中相关与回归分析的内容,根据下列数据作出一个相关回归模型。
某地区1996~2011年国民生产总值和财政收入资料单位:
亿元
年份
国内生产总值
财政收入
1996
18667.82
2937.1
1997
21781.5
3149.48
1998
26923.48
3483.37
1999
35333.92
4348.95
2000
48197.86
5218.1
2001
60793.73
6242.2
2002
71176.59
7407.99
2003
78973.04
8651.14
2004
84402.28
9875.95
2005
89677.05
11444.08
2006
99214.55
13395.23
2007
109655.2
16386.04
2008
120332.7
18903.64
2009
135822.8
21715.25
2010
159878.3
26396.47
2011
183084.8
31649.29
三、实验地点
院机房
四.实验内容及结果
实验一:
(一)实验图表:
1.工人人数与零件个数分组表
零件数(个)
工人数(人)
107-114
7
114-121
11
121-128
20
128-135
8
135-142
4
合计
50
工人人数—零件个数分布图
2..工人人数与生产零件个数频率分布表
零件数
次数
频率
人数(人)
比重(%)
107-114
7
14%
114-121
11
22%
121-128
20
40%
128-135
8
16%
135-142
4
8%
合计
50
100%
工人加工零件直方图
3.假设日加工零件数大于等于130为优秀
加工零件数
人数
≥130
9
<130
41
则优秀率=9/50=0.18=18%
(二)实验结果与分析
1、首先,组距式分组,需要先整体把握所有数据,把最大值和最小值找出来,再计算全距,因为总共50人,直接分为5组,这样刚好组距为7,于是就得出工人人数与零件个数分组表。
2、再根据这个表的数据和步骤,得出条形图。
从这个条形图可以很直观的看出,工人生产零件个数在121-128件之间的人数最多,总共20人,工人生产零件个数在135-142之间的人数最少,总共4人,其余分组人数大致相同。
3、根据上述资料整理得出工人人数与生产零件个数频率分布表,同时也做出条形图,可以很直观的看出,工人生产零件个数在121-128件之间的人数最多,占40%,工人生产零件个数在135-142之间的人数最少,占8%。
4、根据资料,找出日加工零件数大于等于130的人数为9人,所以得出优秀率为18%。
实验二:
(一)实验图表:
1、在相应方格中输入命令,得到所要求的数值
均值:
众数:
中位数:
2、在相应方格中输入命令,得到所要求的数值
极差:
标准差:
3、在相应方格中输入命令,得到所要求的数值
偏态系数:
峰度系数:
(2)实验结果与分析
通过这个实验,也让我对数据描述统计、数值运算有了很深的了解和理解,并且明白EXCEL的好处,特别是对统计数据的重要性,也熟悉了这方面的一些基本菜单操作及命令。
实验三:
(一)实验图表:
1、在相应方格中输入命令,得到各特征值。
单位总量:
50标志总量:
6131最大值:
139最小值:
107:
平均值:
122.62中位数:
123几何平均数:
122.3569519
调和平均数:
:
122.0936216变异统计的平均差:
6.3552
变异统计的标准差:
8.108675123变异统计中的方差:
65.75061224
变异统计中的峰度:
-0.45441358变异统计中的偏度:
0.0723531
2、抽样推断
极限误差=CONFIDENCE(0.072353,8.108675123,50)=2.06056494
日加工零件的置信区间为(120.559435,124.680565)
优秀率的置信区间(0.07081514,0.28918486)
3、假设检验
t=(样本均值单元格-115)/(样本标准差单元格/SQRT(样本容量单元格))=(122.62-115)/(8.108675123/50)=6.644924838
因为α=0.05,自由度为49,则TINV(0.05,49)=2.009575199所以其临界值为2.009575119
(二)实验结果与分析
这组数据的最大值为139,最小值为107。
企业职工的平均日加工零件数为为122.62,标准差为8.108675123,整体的波动幅度不大。
在95%的置信度下,估计该企业职工的日加工零件的置信区间为(120.559435,124.680565),优秀率的置信区间(0.07081514,0.28918486),其临界值为2.009575119。
抽样推断分析法是经济分析中广泛应用的一种统计分析方法。
本实训使我进一步巩固统计抽样推断的基础知识与基本技能,熟练掌握抽样推断分析的基础知识与运用条件,熟练掌握抽样推断分析的基本技能与计算过程。
抽样推断是在抽样调查的基础上进行的统计方法,主要内容为:
参数估计和假设检验。
输入正确的数据也是成为整个统计学实验的基础。
实验四:
(一)实验图表:
1.
(1)输入“年/季度”、“时间标号”:
年
季度
第一年
第二年
第三年
第四年
第一季度
559
574
585
542
447
469
455
438
345
366
352
341
第二季度
354
327
341
427
374
412
388
358
359
353
332
355
第三季度
365
381
392
376
437
460
429
441
353
344
361
382
第四季度
295
311
291
377
454
453
395
398
457
486
491
473
(2)点击“数据分析”→“移动平均”,输入区域为“用电量”,间隔4,输出“移动平均值”;同样的办法对“移动平均值”进行2步平均,输出“中心化后的移动平均值”:
414.5
434
433.25
437
397.25
413.75
408.625
414
380
393.5
384
391
369
379
368.625
380.625
358
364.5
353.25
370.25
360.5
366.375
358.25
374.625
363
368.25
363.25
379
373.375
384.875
374.25
380.75
383.75
401.5
385.25
382.5
381.125
393
381.875
385.5
378.5
384.5
378.5
388.5
370.5
379.25
373.375
391.25
362.5
374
368.25
394
373.625
383
368.625
396.75
384.75
392
369
399.5
387.25
395.25
376.75
403.5
389.75
398.5
384.5
407.5
(3)对称一下“移动平均值”和“中心化后的移动平均值”,用移动平均值的第一项对准第四期,中心化后的移动平均值的第一项对准移动平均值的第一项,然后用“用电量”除以“中心化后的移动平均值”,得到:
1.043423
1.048943
1.060263
1.055556
1.02981
1.038259
1.041709
1.027258
0.993065
0.99488
0.98604
0.988321
0.972213
0.956804
0.9706
0.995404
1.006888
1.021628
1.008838
0.992218
1.021592
1.013843
1.013726
0.992971
0.970224
0.976501
0.998983
0.993069
0.993544
1.00822
0.97943
0.990087
(4)把得到的数据复制到“季节指数计算表”中,得到:
月份
各月平均指数/100
指数平均值
第一年
第二年
第三年
第四年
平均数
调整指
1
1.048943
1.008838
0.98112
1.012967
1.011455
2
1.038259
1.013726
0.96314
1.005042
1.00354
3
0.99488
0.998983
0.94096
0.978274
0.976814
4
0.956804
0.97943
0.984299
0.973511
0.972058
5
1.043423
1.021628
1.055556
1.040202
1.038649
6
1.02981
1.013843
1.027258
1.023637
1.022109
7
0.993065
0.976501
0.988321
0.985962
0.98449
8
0.972213
1.00822
0.995404
0.991946
0.990465
9
1.006888
1.060263
0.992218
1.01979
1.018268
10
1.021592
1.041709
0.992971
1.018757
1.017236
11
0.970224
0.98604
0.993069
0.983111
0.981643
12
0.993544
0.9706
0.990087
0.984744
0.983274
合计
8.030759
12.11769
12.03586
3.869519
12.01794
12
(5)做出折线图如下:
用各年各月的用电量除以对应的季节指数,得到:
月份
第一年
第二年
第三年
第四年
1
353.189
567.499
578.3748
535.8618
2
445.423
467.345
453.395
436.4549
3
353.189
374.6877
360.3553
349.0942
4
364.1758
336.3998
350.8022
439.2743
5
360.0831
396.6691
373.5622
344.6785
6
351.2346
345.3644
324.8186
347.3211
7
370.75
387.0024
398.1757
381.9236
8
441.2069
464.4282
433.1298
445.2453
9
346.667
337.8287
354.5237
375.147
10
290.0015
305.7304
286.0693
370.6121
11
462.4899
461.4712
402.3866
405.4427
12
464.7738
494.2671
499.3522
481.046
2、
(1)完善“用电量”和“季节指数”后,计算“用电量”/“季节指数”,得到:
月平均用电量
季节指数
用电量/季节指数
553.25
1.011455
546.9844031
452.25
1.00354
450.6546824
351
0.976814
359.3316064
362.25
0.972058
372.6630631
383
1.038649
368.7482489
349.75
1.022109
342.1846733
378.5
0.98449
384.4630215
441.75
0.990465
382.1436441
360
1.018268
353.5416427
318.5
1.017236
313.1033506
425
0.981643
432.9476195
476.75
0.983274
484.8597644
(2)点击“数据分析”→“回归”,Y值输入区域为季节分离后的时间序列,X值输入区域为时间标号,输出:
SUMMARYOUTPUT
回归统计
MultipleR
0.221792
RSquare
0.049192
AdjustedRSquare
-0.04589
标准误差
68.5633
观测值
12
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
2432.1
2432.1
0.517366
0.488435
残差
10
47009.26
4700.926
总计
11
49441.36
Coefficients
标准误差
tStat
P-value
Lower95%
Intercept
426.1084
42.19779
10.09788
1.45E-06
332.0859
XVariable1
-4.12404
5.733551
-0.71928
0.488435
-16.8992
(3)最终计算得出:
第五年各月预测值
月份
预测值
1
553.25
2
452.25
3
351
4
362.25
5
383
6
349.75
7
378.5
8
441.75
9
360
10
318.5
11
425
12
476.75
3、做出折线图(用电量)如下:
4、销售额预测图
(二)实验结果与分析
第五年各月用电量的波动不大,主要维持在400度上下波动,其中6月份和10月份用电量最少。
1月份和12月份用电量最多。
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
统计学主要又分为描述统计学和推断统计学。
给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。
另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。
我们学习统计学和进行这个实验的目的是运用统计思想进行分析的能力,在实践工作中,要善于利用统计的思维方式进行思考,在纷繁复杂的社会实践中,要学会发现数字、分析数字,并使用数字说话;掌握基本的统计方法,要掌握统计工作中涉及到基本统计概念和基本统计计算方法,能够阅读常规的统计报告,了解统计指标的含义。
同时,能够自己处理常见的统计问题;锻炼统计计算的能力。
在掌握统计方法的基础上,要培养动手计算的能力。
其中涉及到运用数学公式和使用计算机进行计算的有关技能。
实验五
(一)实验图表:
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
财政收入a
.
输入
a.已输入所有请求的变量。
b.因变量:
国内生产总值
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.981a
.963
.960
9840.648
a.预测变量:
(常量),财政收入。
b.因变量:
国内生产总值
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.492E10
1
3.492E10
360.631
.000a
残差
1.356E9
14
9.684E7
总计
3.628E10
15
a.预测变量:
(常量),财政收入。
b.因变量:
国内生产总值
系数a
模型
非标准化系数
标准系数
B
标准误差
试用版
t
Sig.
1
(常量)
18547.588
4234.350
4.380
.001
财政收入
5.477
.288
.981
18.990
.000
a.因变量:
国内生产总值
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
34632.98
191878.89
83994.73
48251.351
16
残差
-15965.164
13046.399
.000
9506.969
16
标准预测值
-1.023
2.236
.000
1.000
16
标准残差
-1.622
1.326
.000
.966
16
a.因变量:
国内生产总值
模型摘要
模型拟合
拟合统计量
均值
SE
最小值
最大值
平稳的R方
1.957E-15
1.957E-15
1.957E-15
R方
.995
.995
.995
RMSE
3274.261
3274.261
3274.261
MAPE
3.248
3.248
3.248
MaxAPE
6.262
6.262
6.262
MAE
2682.826
2682.826
2682.826
MaxAE
7130.199
7130.199
7130.199
正态化的BIC
16.376
16.376
16.376
模型拟合
拟合统计量
百分位
5
10
25
50
75
平稳的R方
1.957E-15
1.957E-15
1.957E-15
1.957E-15
1.957E-15
R方
.995
.995
.995
.995
.995
RMSE
3274.261
3274.261
3274.261
3274.261
3274.261
MAPE
3.248
3.248
3.248
3.248
3.248
MaxAPE
6.262
6.262
6.262
6.262
6.262
MAE
2682.826
2682.826
2682.826
2682.826
2682.826
MaxAE
7130.199
7130.199
7130.199
7130.199
7130.199
正态化的BIC
16.376
16.376
16.376
16.3