ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:261.43KB ,
资源ID:3335244      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3335244.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学实验.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

统计学实验.docx

1、统计学实验统计学课程实验指导【试验目的】能够使学生在学习统计学原理课程时,掌握统计学中的计算过程,理论联系实际。由于Excel是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现它的统计计算功能。通过该试验课程的学习,使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算,并通过案例的学习,培养学生一定的解决实际问题的能力。【试验内容】Excel中的统计分析功能,包括算术平均数、加权平均数、方差、标准差、协方差、相关系数、统计图形、随机抽样、参数点估计、区间估计、假设检验、方差分析、移动平均、指数平滑、回归分析。【试验计划】两个教学周,上试验课一次,时

2、间一小时。【试验地点】学院办公楼二层计算机机房试验一: 描述性统计在Excel中的操作程序此分析工具用于生成对输入区域中数据的单变值分析,提供有关数据趋中性和易变性的信息。(-)“描述统计”对话框输入区域在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。分组方式如果需要指出输入区域中的数据是按行还是按列排列,请单击“逐行”或“逐列”。标志位于第一行/列如果输入区域的第一行中包含标志项,请选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,请选中“标志位于第一列”复选框;如果输入区域没有标志项,则该复选框不会被选中,Microsoft Ex

3、cel 将在输出表中生成适宜的数据标志。平均数置信度如果需要在输出表的某一行中包含均值的置信度,请选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。例如,数值 95% 可用来计算在显著性水平为 5% 时的均值置信度。第 K 大值如果需要在输出表的某一行中包含每个区域的数据的第 k 个最大值,请选中择此复选框,然后在右侧的编辑框中,输入 k 的数值。如果输入 1,则这一行将包含数据集中的最大数值。第 K 小值如果需要在输出表的某一行中包含每个区域的数据的第 k 个最小值,请选中此复选框,然后在右侧的编辑框中,输入 k 的数值。如果输入 1,则这一行将包含数据集中的最小数值。输出区域在此输

4、入对输出表左上角单元格的引用。此工具将为每个数据集产生两列信息。左边一列包含统计标志项,右边一列包含统计值。根据所选择的“分组方式”选项的不同,Microsoft Excel 将为输入表中的每一行或每一列生成一个两列的统计表。新工作表组单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。如果需要给新工作表命名,请在右侧编辑框中键入名称。新工作簿单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。汇总统计如果需要 Microsoft Excel 在输出表中生成下列统计结果,请选中此复选框。这些统计结果有:平均值、标准误差(相对于平均值)、中值、

5、众数、标准偏差、方差、峰值、偏斜度、极差(全距)、最小值、最大值、总和、总个数、Largest (#)、Smallest (#) 和置信度。(二)实例应用: 某老师对几名学生的五次考试成绩进行分析,以便对这几个学生在学习方面的问题加以解决。使用“描述统计”分析工具对其数据进行分析。(数据文件名:描述统计.xls)操作步骤:1、 打开数据“描述统计.xls”。如下:2、选择“数据分析”对话框中“描述统计”,跳出“描述统计”对话框。2、 在“输入区域”编辑框中键入三列数据所在的单元格区域引用($A$4:$F$8)。3、 单击“逐行”选项。4、 选中“标志位于第一行”选项。5、 在“输出选项”下单击

6、“新工作表组”选项,并在对应编辑框中输入新工作表的名称。如:“描述统计结果”。6、 选中“汇总统计”。7、 选中“平均数置信度”,并在其相应的编辑框中输入“95”。8、 选中“第K大值”和“第K小值”,并在其相应编辑框中输入“1”。9、 单击“确定”。10、数据输出在新创建的工作表“协方差分析结果”中的“A1:J18”区域。如下: 在数据输出的工作表中,可以看出每个学生的的成绩的各种分析结果。其中第3行至第18行分别为:平均值、标准误差、中值、标准误差、样本方差、峰值、偏度、最大值、最小值、和、计数、第1大值、第1小值、95%概率保证程度的置信度。根据“标准偏差”值可以看出王华的成绩离散程度最

7、大,即是说其成绩极不稳定,刘明的成绩是最稳定的。若取中值进行分析则是王华的成绩最好。平均值为刘明最佳。总体上而言,王华的成绩应该是最好的,只是最后一次的成绩太差,造成了较大的影响。试验二: 统计直方图在Excel中的操作程序在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,用于统计有限集中某个数值元素的出现次数。例如,在一个有 20 名学生的班级里,可以确定以字母打分(如 A、B-等)所得分数的分布情况。直方图表会给出字母得分的边界,以及在最低边界与当前边界之间某一得分出现的次数。出现频率最多的某个得分即为数据组中的众数。“直方图”对话框接收区域(可选)在此输入接收区域

8、的单元格引用,该区域应包含一组可选的用来定义接收区间的边界值。这些值应当按升序排列。只要存在的话,Microsoft Excel 将统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中。所有小于第一个边界值的数值将一同计数,同样所有大于最后一个边界值的数值也将一同记数。如果省略此处的接收区域,Microsoft Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。柏拉图选中此复选框,可以在输出表中同时按降序排列频率数据。如果此复选框被清除,Microsoft Excel 将只按升序来排列数据,即省略输出表

9、中最右边的三列数据。累积百分率选中此复选框,可以在输出表中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略累积百分比。图表输出选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。实例应用: 学生历次考试成绩统计,按照一定区间生成频数分布表,使用“直方图”分析工具来完成。(数据文件名:直方图.xls)操作步骤:1、 打开数据“直方图.xls”,如图2、 选择“数据分析”对话框中“直方图”,跳出“直方图”对话框。3、 在“输入区域”对应编辑框输入学生成绩数据的引用。($B$2:$B$15)4、 在“接受区域”对应编辑框输入数据划分单元格的引用。($A$18

10、:$A$22)5、看是否在输入栏里是否选择了标志单元格,考虑选定“标志”。在输出选项中选择“新工作表组”,在其对应编辑框中输入输出工作表名称,如;“图表输出”。选择“帕拉图”、“累积百分率”、“图表输出”选项。5、 单击确定。结果输出如下 在图中显示的统计结果中,可以看见输出的内容分为两部分,一部分是数据表示形式,一部分是直方图形式。在数据表部分,显示每个区间中的人数及累计百分率数值。通过该统计结果,我们可以知道,在第一次考试中有6人在10085分之间,5人在8575之间,1人在7565之间,1人在65以下。试验三: 协方差和相关系数在Excel中的计算1、协方差此分析工具及其公式用于返回各数

11、据点的一对均值偏差之间的乘积的平均值。协方差是测量两组数据相关性的量度。可以使用协方差工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正协方差);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负协方差);还是两个集合中的数据互不相关(协方差为零)。“协方差”对话框 输入区域在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。实例应用: 用协方差分析工具分析某公司历史“推销费用”、“销售额”、“营业人员”三项数据之间是否存在相关。(数据文件名:协方差.xls)操作步骤:1、打开数据“协方差.xls

12、”,如下:2、选择“数据分析”对话框中“协方差”,跳出“协方差”对话框。3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($B$1:$D$9)。6、 单击“逐列”选项。7、 选中“标志位于第一行”选项。8、 在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。如:“协方差分析结果”。9、 单击“确定”。10、 数据输出在新创建的工作表“协方差分析结果”中的“A1:D4”区域。如下: 在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的协方差矩阵。明显,对角线上为各自方差;其他,三个变量相互之间协方差分别为:202.125、199.5、610.5,

13、说明三个变量之间存在较显著的相关性,不是相互独立的。2、相关系数此分析工具及其公式可用于判断两组数据集(可以使用不同的度量单位)之间的关系。总体相关性计算的返回值为两组数据集的协方差除以它们标准偏差的乘积:可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关性为零)。“相关系数”对话框输入区域在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。实例应用: 对某厂销售额、营业人员

14、、以及推销费用的历史数据进行相关分析。(数据文件名:相关系数.xls)操作过程:1、 打开数据“相关系数.xls”。如下:2、 在数据分析对话框中选择“相关系数”后,跳出“相关系数”对话框。3、 在“输入区域”编辑框中输入三列数据所在的单元格区域引用($B$1:$D$9)。4、 单击“逐列”选项。5、 选中“标志位于第一行”选项。6、 在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。如:“相关分析结果”。7、 单击确定。8、 数据输出在新创建的工作表“相关分析结果”中的“A1:D4”区域。如下: 在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的相关

15、系数矩阵。明显,对角线上变量与自己完全正相关,值为1;其他,三个变量相互之间相关系数分别为:0.989786、0.993619、0.996674,数值非常接近1,说明三个变量之间存在较显著的相关关系。试验四: t 统计检验在Excel中的操作程序“分析工具库”中提供了三种工具,可用来检验各种样本总体的均值。(-)“t - 检验:双样本等方差假设”分析此分析工具可以进行双样本学生氏 t - 检验。此 t- 检验先假设两个数据集的平均值相等,故也称作齐次方差 t - 检验。可以使用 t - 检验来确定两个样本均值实际上是否相等。“t - 检验:双样本等方差假设”对话框变量 1 的区域在此输入需要分

16、析的第一个数据区域的单元格引用。该区域必须由单列或单行的数据组成。变量 2 的区域在此输入需要分析的第二个数据区域的单元格引用。该区域必须由单列或单行的数据组成。假设平均差在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。在此输入检验的置信度。该值必须在范围 01 之间。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 检验两组实验测试数据是否有差异。(数据文件名:双样本等方差假设.xls)操作步骤:1、 打开“双样本等方差假设.xls”,如下2、 选择“数据分析”中的“t - 检验:双样本等方差假设”,跳出“t - 检验:双样本等方差假设”对话框。

17、3、 在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。4、 “输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表名称。如:“t检验分析结果”。5、 6、 单击确定。输出如下 根据图中所示工作表显示的计算结果数据,可一直到两个温度下产品的轻度不受影响(即可认为两种温度下强度祥等)。(二)“t - 检验:双样本异方差假设”分析此分析工具及其公式可以进行双样本学生氏 t 检验。此 t - 检验先假设两个数据集的方差不等,故也称作异方差 t - 检验。可以使用 t - 检验来确定两个样本均值实际上是否相等。当进行分析的样本组不同时,可使用此检验。如果某

18、一样本组在某次处理前后都进行了检验,则应使用“成对检验”。用于确定检验统计值 t 的公式如下:下面的公式用于估计自由度。因为计算结果通常不为整数,从 t 分布表中查找临界值时,应使用最接近的整数。“t - 检验:双样本异方差假设”对话框假设平均差在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。在此输入检验的置信度。该值必须在范围 01 之间。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 提出零假设为强度有变化,检验两组实验测试数据是否有差异。(数据文件名:双样本异方差假设.xls)操作步骤:7、 打开“双样本异方差假设.xls”,如下8、 选择

19、“数据分析”中的“t - 检验:双样本异方差假设”,跳出“t - 检验:双样本异方差假设”对话框。9、 在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。10、“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表名称。如:“t检验分析结果”。10、 单击确定。输出如下 根据图中所示工作表显示的计算结果数据,原假设不成立,可以知道两个温度下产品的强度不受影响(即可认为两种温度下强度相等)。(三)t - 检验:平均值的成对二样本分析此分析工具及其公式可以进行成对双样本学生氏 t - 检验,用来确定样本均值是否不等。此 t -检验并不假设两个总体的方差

20、是相等的。当样本中出现自然配对的观察值时,可以使用此成对检验,例如对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。注意 由此工具生成的结果中包含有合并方差,亦即数据相对于平均数据离散值的累积测量值,可以由下面的公式得到:“t - 检验:平均值的成对二样本分析”对话框假设平均差在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。在此输入检验的置信度。该值必须在范围 01 之间。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 采用与前相同数据,操作过程一样,结果如下:试验五: z统计检验在Excel中的操作程序此分析工具可以进行方差已知的双样

21、本均值 z - 检验。此工具用于检验两个总体均值之间存在差异的假设。例如,可以使用此检验来确定两种汽车模型性能之间的差异情况。“z - 检验:双样本平均差检验”对话框变量 1 的方差(已知)在此输入变量 1 输入区域的总体方差。变量 2 的方差(已知)在此输入变量 2 输入区域的总体方差。实例应用: 比较不同两地区水源矿物质含量是否相同。(数据文件名:Z检验.xls)操作步骤:1、 打开数据“Z检验.xls”,如下2、 选择“数据分析”中的“z - 检验:双样本平均差检验”,跳出“z - 检验:双样本平均差检验”对话框。3、 在“变量1的区域”、“变量2的区域”对应的编辑框中键入A、B地区数据

22、所在单元格的引用。4、 在“变量1的方差”、“变量2的方差”编辑框中分别键入A、B方差5和8。5、 在“输出选项”下单击“新工作表组”选项,并在其对应编辑框中键入新工作表名称,如:“z检验分析结果”。6、 单击确定,数据结果如下 可以看到Z值为-1.61245,双尾临界值为1.959961,因此,可以接受零假设,认为两地水源矿物质含量无显著差异。试验六: F统计检验在Excel中的操作程序此分析工具可以进行双样本 F - 检验,用来比较两个样本总体的方差。例如,可以对参加游泳比赛的两个队的时间记分进行 F- 检验,查看二者的样本方差是否不同。“F - 检验:双样本方差分析”对话框变量 1 的区

23、域在此输入对需要分析的第一列或第一行数据的引用。变量 2 的区域在此输入对需要分析的第二列或第二行数据的引用。在此输入检验的置信度。该值必须在范围 01 之间。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 对测试产品在不同温度下强度的实验数据进行“F - 检验双样本方差分析”,以检查两种数据下测得的数据方差是不是相等。(数据文件名:F - 检验:双样本方差分析.xls)操作步骤:1、 打开“F - 检验:双样本方差分析.xls”数据,如图2、 选择“数据分析”对话框中“F - 检验:双样本方差分析”,跳出“F - 检验:双样本方差分析”对话框。3、 在变量1

24、的区域、变量2的区域所对应的编辑框中输入所要引用的单元格的引用。4、 置信度对应数据框输入0.05。5、 在输出数据对应的编辑框中输入,输出单元格的引用。6、 单击确定。试验七: 方差分析 (anova)在Excel中的操作程序“分析工具库”中提供了三种工具,可用来分析方差。具体使用哪一工具则根据因素的个数以及待检验样本总体中所含样本的个数而定。(一)“Anova:单因素方差”分析此分析工具通过简单的方差分析(anova),对两个以上样本均值进行相等性假设检验(抽样取自具有相同均值的样本空间)。此方法是对双均值检验(如 t-检验)的扩充。“Anova:单因素方差分析”对话框输入区域在此输入待分

25、析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。在此输入计算 F 统计临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 检验某市职工工资总额与商品零售总额是否存在线性关系(数据文件名:单因素方差分析.xls)。操作步骤:1、打开数据“单因素方差分析.xls”,如下:2、选择“数据分析”对话框中“单因素方差分析”,跳出“单因素方差分析”对话框。3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($B$1:$C$11)。4、 单击“逐列”选项。5、 选中“标志位于第一行”选项。6、 在“输出选项”下单击“新工

26、作表组”选项,并在对应编辑框中输入新工作表的名称。如:“方差分析结果”。7、 单击“确定”。8、 数据输出在新创建的工作表“方差分析结果”中,如下:通过图中显示数据,用户可以看到F值远大于“Fcrit”得知,因此零假设不被接受,说明年度职工工资总额对当前社会商品零售总额是显著的线性相关。(二)“Anova:可重复双因素”分析此分析工具是对单因素 anova 分析的扩展,即每一组数据包含不止一个样本。“Anova:可重复双因素分析”对话框输入区域在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。每一样本的行数在此输入包含在每个样本中的行数。每个样本必须

27、包含同样的行数,因为每一行代表数据的一个副本。在此输入需要用来计算 F 统计的临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 测试产品不同温度下的强度,将原来8次测试值改为每次试验得到4个测试值,而实验进行了2次。对两次试验得到的数据进行样本均值相等的假设检验。操作步骤:1、打开数据“双因素方差分析.xls”,选择“可重复双因素方差分析数据”工作表,如下:2、选择“数据分析”对话框中“可重复双因素方差分析”,跳出“可重复双因素方差分析”对话框。3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($A$1:$C$9)。4、在“每一样本的行

28、数”对应编辑框中填入4。5、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。如:“方差分析结果”。11、 单击“确定”。12、 数据输出在新创建的工作表“可重复双因素分析结果”中,如下: 在山图所示结果中给出了3个F值,分别用于不同样本之间的均值相等性假设检验。如果只是进行不同温度下的两组数据之间的均值相等性假设检验,则可以取“列”所对应的F值,并于同一行中所对应的“Fcrit”值进行比较,从而可以判断出该两组数据的均值相等性假设成立。(三)“Anova:无重复双因素”分析此分析工具通过双因素 anova 分析(但每组数据只包含一个样本),对两个以上样本均值进行相等

29、性假设检验(抽样取自具有相同均值的样本空间)。此方法是对双均值检验(如 t-检验)的扩充。“Anova:无重复双因素分析”对话框输入区域在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。标志如果在输入区域中没有标志项,则本复选框不会被选中,Microsoft Excel 将在输出表中生成适宜的数据标志。在此输入需要用来计算 F 统计的临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平(舍弃真实假设)。实例应用: 无重复双因素方差分析在使用时,不需人为将样本数据进行划分,而是自动将样本数据按照其所在的行为分为多个样本进行分析,这是和可

30、重复双因素分析的区别所在。 采用无重复双因素方差分析与可重复双因素方差分析操作上差不多,将上例采用无重复双因素方差分析得出结果如下: 通过上图所示数据结果,可以看到他对给定样本的每一行都计算了平均值及方差,并根据特定的计算方法求得F值。虽然他求得的F值与其他两种分析工具求得的值不同,但三种方差分析工具的根本使用思想是一致的,将最终结果中“列”所对应的F值与“Fcrit”相比较,可以判断出样本均值相等性假设可以成立。试验八: 长期变动趋势在Excel中的操作程序1、移动平均此分析工具及其公式可以基于特定的过去某段时期中变量的均值,对未来值进行预测。预测值的计算公式如下:式中 N 为进行移动平均计

31、算的过去期间的数目 Aj 为期间 j 的实际值 Fj 为期间 j 的预测值移动平均值提供了由所有历史数据的简单的平均值所代表的趋势信息。使用此工具可以预测销售量、库存或其它趋势。“移动平均”对话框输入区域在此输入待分析数据区域的单元格引用。该区域必须由包含四个以上数据单元格的单列组成。间隔在此输入用来进行移动平均计算的间隔数。默认间隔为 3。输出区域在此输入对输出表左上角单元格的引用。如果选中了“标准误差”复选框,Microsoft Excel 将生成一个两列的输出表,其中右边的一列为标准误差值。如果没有足够的历史数据来进行预测或计算标准误差值,Microsoft Excel 会在某些单元格中返回错误值 #N/A。此分析工具的输出区域必须与输入区域在同一工作表中。因此,“新工作表组”和“新工作

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1