统计学课程实验任务书Word文档下载推荐.docx

上传人:b****7 文档编号:22530573 上传时间:2023-02-04 格式:DOCX 页数:21 大小:292.88KB
下载 相关 举报
统计学课程实验任务书Word文档下载推荐.docx_第1页
第1页 / 共21页
统计学课程实验任务书Word文档下载推荐.docx_第2页
第2页 / 共21页
统计学课程实验任务书Word文档下载推荐.docx_第3页
第3页 / 共21页
统计学课程实验任务书Word文档下载推荐.docx_第4页
第4页 / 共21页
统计学课程实验任务书Word文档下载推荐.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

统计学课程实验任务书Word文档下载推荐.docx

《统计学课程实验任务书Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学课程实验任务书Word文档下载推荐.docx(21页珍藏版)》请在冰豆网上搜索。

统计学课程实验任务书Word文档下载推荐.docx

六、讨论与结论

实验二:

EXCEL的数据特征描述、抽样推断

熟悉EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。

根据学生实验数据,

(1)计算特征值;

(2)判断该企业职工的平均日加工零件数及优秀率的区间;

(3)假设检验(如果以往该企业的工人日加工零件数为115,优秀率为5%,显著性水平为5%)。

1、在相应方格中输入命令,得到各特征值。

COUNT(B4:

B53)并回车,得到50个数据中的单位总量。

SUM(B4:

B53)并回车,得到50个数据中的标志总量。

MAX(B4:

B53)并回车,得到50个数据中的最大值。

MIN(B4:

B53)并回车,得到50个数据中的最小值。

AVERAGE(B4:

B53)并回车,得到50个数据中的平均值。

MEDIAN(B4:

B53)并回车,得到50个数据中的中位数。

GEOMEAN(B4:

B53)并回车,得到50个数据中的几何平均数。

HARMEAN(B4:

B53)并回车,得到50个数据中的调和平均数。

AVEDEV(B4:

B53)并回车,得到50个数据中的变异统计的平均差。

STDEV(B4:

B53)并回车,得到50个数据中的变异统计的标准差。

VAR(B4:

B53)并回车,得到50个数据中的变异统计中的方差。

KURT(B4:

B53)并回车,得到50个数据中的变异统计中的峰度。

SKEW(B4:

B53)并回车,得到50个数据中的变异统计中的偏度。

2、抽样推断

在单元格中输入CONFIDENCE(α所在单元格,标准差所在单元格,样本容量单元格),点得到极限误差,从而得到日价格零件数和优秀率的置信区间。

单元格中键入“=(样本均值单元格-115)/(样本标准差单元格/SQRT(样本容量单元格))”,得到t值;

单元格中键入“=TINA(0.05,49)”得到α=0.05,自由度为49的临界值。

实验三:

时间序列分析

掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。

综合运用统计学时间序列中的移动平均、季节指数运算、时间序列因素分解、图形展示等知识,对某小区居民用电量(千度)季节数据的构成要素进行分解,并作出图形进行分析。

月度

第一年

第二年

第三年

第四年

1

559

574

585

542

2

447

469

455

438

3

345

366

352

341

4

354

327

427

5

374

412

388

358

6

359

353

332

355

7

365

381

392

376

8

437

460

429

441

9

344

361

382

10

295

311

291

377

11

454

453

395

398

12

457

486

491

473

时间序列分析中的移动平均分析原理、季节指数原理等。

1.

(1)输入“年/季度”、“时间标号”,复制各季度销售额到“销售额”。

(2)点击“数据分析”→“移动平均”,输入区域为“销售额”,间隔4,输出“移动平均值”;

同样的办法对“移动平均值”进行2步平均,输出“中心化后的移动平均值”。

(3)对称一下“移动平均值”和“中心化后的移动平均值”,然后用“销售额”除以“中心化后的移动平均值”求出“比值”。

(4)将“比值”中的数据复制到“季节指数计算表”中,计算完成表。

(5)点击“图标向导”→“折线图”,输入区域为季节指数中的数值,修改完成图表。

2.

(1)完善“销售额”和“季节指数”并计算“销售额”/“季节指数”,完成季节分离后的时间序列。

(2)点击“数据分析”→“回归”,Y值输入区域为季节分离后的时间序列,X值输入区域为时间标号,输出。

(3)利用计算出的趋势模型和季节比率,对该小区第五年用电量数据进行预测。

3.点击“图表向导”→“折线图”,数据区域为“用电量”、“季节分离后的时间序列”和“回归后的趋势”,系列产生在“列”,完善标题、X轴、Y轴,完成,再修改完成图。

4.用与图3相同的方法绘制销售额预测图。

五、实验结果与数据处理

实验四:

掌握SPSS用于相关与回归分析的基本操作及命令。

综合运用统计学中相关与回归分析的内容,根据下列数据作出一个。

我国1990~2005年国民生产总值和财政收入资料

年份

国内生产总值

财政收入

1990

18667.82

2937.1

1991

21781.5

3149.48

1992

26923.48

3483.37

1993

35333.92

4348.95

1994

48197.86

5218.1

1995

60793.73

6242.2

1996

71176.59

7407.99

1997

78973.04

8651.14

1998

84402.28

9875.95

1999

89677.05

11444.08

2000

99214.55

13395.23

2001

109655.2

16386.04

2002

120332.7

18903.64

2003

135822.8

21715.25

2004

159878.3

26396.47

2005

183084.8

31649.29

SPSS

相关与回归分析的原理等。

按照附件中的一元线性回归方程的建立与检验方式利用上述数据运行程序。

附:

一元回归分析(在实验报告中不要打印这部分)

在数学关系式中只描述了一个变量与另一个变量之间的数量变化关系,则称其为一元回归分析。

其回归模型为

 

y称为因变量,x称为自变量,

称为随机误差,a,b称为待估计的回归参数,下标i表示第i个观测值。

如果给出a和b的估计量分别为

,则经验回归方程:

一般把称为残差

,残差

可视为扰动的“估计量”。

例子:

湖北省汉阳县历年越冬代二化螟发蛾盛期与当年三月上旬平均气温的数据如表1-1,分析三月上旬平均温度与越冬代二化螟发蛾盛期的关系。

表1-1三月上旬平均温度与越冬代二化螟发蛾盛期的情况表

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

三月上旬平均温度

8.6

8.3

9.7

8.5

7.5

8.4

7.3

5.4

5.5

越冬代二化螟发蛾盛期(6月30日为0)

1)准备分析数据

在数据编辑窗口中输入数据。

建立因变量历期“历期”在SPSS数据编辑窗口中,创建“年份”、“温度”和“发蛾盛期”变量,并把数据输入相应的变量中。

2)启动线性回归过程。

击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图1-1所示的线性回归过程窗口。

3)设置分析变量

设置因变量:

本例为“发蛾盛期”变量,用鼠标选中左边变量列表中的“发蛾盛期”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就自动调入“Dependent”显示栏里。

设置自变量:

选择一个变量作为自变量进入“Independent(S)”框中。

用鼠标选中左边变量列表中的“温度”变量,然后点击“Independent(S)”栏左边的

8向右拉按钮,该变量就自动调入“Independent(S)”显示栏里。

注:

SPSS中一元回归和多元回归以及多元逐步回归都是使用同一过程,所以该栏可以输入多个自变量。

设置控制变量

“SelectionVariable”为控制变量输入栏。

控制变量相当于过滤变量,即必须当该变量的值满足设置的条件时,观测量才能参加回归分析。

当你输入控制变量后,单击“Rule”按钮,将打开如图1-2所示的对话。

图1-2“Rule”对话框

在“Rule”对话框中,右边的“Value”框用于输入数值,左边的下拉列表中列出了观测量的选择关系,其中各项的意义分别为:

“equalto”等于。

“notequalto”不等于。

“lessthan”小于。

“lessthanorequal”小于或等于。

“greaterthan”大于。

“greaterthanorequal”大于或等于。

本例的控制变量是“计算”,将它选入“SelectionVariable”变量栏里,在“Rule”对话框中选择“equalto”=1。

选择标签变量

“CaseLabels”框用于选择观测量的标签变量。

在输出结果中,可显示该观测量的值,通过该变量的值可查看相应的观测量。

本例子选择“年份”为标签变量。

选择加权变量:

在主对话框中单击“WLS”按钮,将在主对话框下方展开一个输入框,该框用于输入加权变量。

本例子没有加权变量,因此不作任何设置。

4)回归方式

在“Method”框中选择一种回归分析方式。

其中,各项的意义为:

全进入“Enter”所选择的自变量将全部进入建立的回归方程中,该项为默认方式。

逐步进入“Stepwise”根据“Options”对话框中的设置,在方程中加入或剔除单个变量直到所建立的方程中不再含有可加入或剔除的变量为止。

后进入“Remove”将进入方程中的自变量同时剔除。

先进入“Backward”自变量框中所有的变量同时进入方程中,然后根据“Options”对话框中的设置,剔除某个变量,直到所建立的方程中不再含有可剔除的变量为止。

条件进入“Forward”根据“Options”对话框中的设置,在方程中每次加入一个变量,直至加入所有符合条件的变量为止。

本例子是一元回归,只能选第一项。

5)设置输出统计量

单击“Statistics”按钮,将打开如图1-3所示的对话框。

该对话框用于设置相关参数。

其中各项的意义分别为:

图1-3“Statistics”对话框

①“RegressionCoefficients”回归系数选项:

“Estimates”输出回归系数和相关统计量。

“Confidenceinterval”回归系数的95%置信区间。

“Covariancematrix”回归系数的方差-协方差矩阵。

本例子选择“Estimates”输出回归系数和相关统计量。

②“Residuals”残差选项:

“Durbin-Watson”Durbin-Watson检验。

“Casewisediagnostic”输出满足选择条件的观测量的相关信息。

选择该项,下面两项处于可选状态:

“Outliersoutsidestandarddeviations”选择标准化残差的绝对值大于输入值的观测量;

“Allcases”选择所有观测量。

本例子都不选。

③其它输入选项

“Modelfit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。

“Rsquaredchange”输出由于加入和剔除变量而引起的复相关系数平方的变化。

“Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。

“Partandpartialcorrelation”相关系数和偏相关系数。

“Collinearitydiagnostics”显示单个变量和共线性分析的公差。

本例子选择“Modelfit”项。

7)保存分析数据的选项

在主对话框里单击“Save”按钮,将打开如图1-5所示的对话框。

图1-5“Save”对话框

①“PredictedValues”预测值栏选项:

Unstandardized非标准化预测值。

就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量,存放根据回归模型拟合的预测值。

Standardized标准化预测值。

Adjusted调整后预测值。

S.E.ofmeanpredictions预测值的标准误。

本例选中“Unstandardized”非标准化预测值。

②“Distances”距离栏选项:

Mahalanobis:

距离。

Cook’s”:

Cook距离。

Leveragevalues:

杠杆值。

③“PredictionIntervals”预测区间选项:

Mean:

区间的中心位置。

Individual:

观测量上限和下限的预测区间。

在当前数据文件中新添加一个以字符“LICI_”开头命名的变量,存放预测区间下限值;

以字符“UICI_”开头命名的变量,存放预测区间上限值。

ConfidenceInterval:

置信度。

本例选中“Individual”观测量上限和下限的预测区间。

④“SavetoNewFile”保存为新文件:

选中“Coefficientstatistics”项将回归系数保存到指定的文件中。

本例不选。

⑤“ExportmodelinformationtoXMLfile”导出统计过程中的回归模型信息到指定文件。

⑥“Residuals”保存残差选项:

“Unstandardized”非标准化残差。

“Standardized”标准化残差。

“Studentized”学生氏化残差。

“Deleted”删除残差。

“Studentizeddeleted”学生氏化删除残差。

⑦“InfluenceStatistics”统计量的影响。

“DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。

“StandardizedDfBeta(s)”标准化的DfBeta值。

“DiFit”删除一个特定的观测值所引起的预测值的变化。

“StandardizedDiFit”标准化的DiFit值。

“Covarianceratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。

本例子不保存任何分析变量,不选择。

8)其它选项

在主对话框里单击“Options”按钮,将打开如图1-6所示的对话框。

图1-6“Options”设置对话框

①“SteppingMethodCriteria”框用于进行逐步回归时内部数值的设定。

其中各项为:

“UseprobabilityofF”如果一个变量的F值的概率小于所设置的进入值(Entry),那么这个变量将被选入回归方程中;

当变量的F值的概率大于设置的剔除值(Removal),则该变量将从回归方程中被剔除。

由此可见,设置“UseprobabilityofF”时,应使进入值小于剔除值。

“UesFvalue”如果一个变量的F值大于所设置的进入值(Entry),那么这个变量将被选入回归方程中;

当变量的F值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。

同时,设置“UseFvalue”时,应使进入值大于剔除值。

②“Includeconstantinequation”选择此项表示在回归方程中有常数项。

本例选中“Includeconstantinequation”选项在回归方程中保留常数项。

③“MissingValues”框用于设置对缺失值的处理方法。

“Excludecaseslistwise”剔除所有含有缺失值的观测值。

“Exchudecasespairwise”仅剔除参与统计分析计算的变量中含有缺失值的观测量。

“Replacewithmean”用变量的均值取代缺失值。

本例选中“Excludecaseslistwise”。

9)提交执行。

在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。

10)结果分析

结果:

表1-2给出了回归的方法是全回归模式,模型编号为1,自变量是“温度”,因变量是“发蛾盛期”。

表1-2

表1-3是回归模型统计量:

R是相关系数;

RSquare相关系数的平方,又称判定系数,判定线性回归的拟合程度:

用来说明用自变量解释因变量变异的程度(所占比例);

AdjustedRSquare调整后的判定系数;

Std.ErroroftheEstimate估计标准误差。

表1-3

表1-4回归模型的方差分析表,F值为11.748,显著性概率是0.009,表明回归极显著。

表1-4

表1-5回归模型系数表,以及t检验结果。

表1-5分析:

从上面的回归分析结果表明:

三月上旬平均温度与越冬代二化螟发蛾盛期的关系极为密切,相关系数0.7713;

同时方差分析表明,其显著性水平为0.009。

根据回归系数表6-5,可写出回归方程如下:

其中x代表三月上旬平均温度;

代表越冬代二化螟发蛾盛期(其值加上7月0日为实际日期)。

预测值的回归误差可用剩余均方估计:

预测

由于在分析时使用了控制变量“计算”,数据中第11个记录的数据在建立回归方程时,并没有使用它,是留作用于预测的。

所以,在选择了保存预测值选项,用模型预测的结果可以在数据窗口中看到(图1-7)。

图6-7分析过程执行后的数据窗口

在图6-7中得知,用1971年三月上旬平均温度4.3,预测值为7.1天,95%的置信区间是3.5~10.6天,预测值的有关统计量见表1-6。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 其它课程

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1