统计学实验指导书.docx
《统计学实验指导书.docx》由会员分享,可在线阅读,更多相关《统计学实验指导书.docx(22页珍藏版)》请在冰豆网上搜索。
统计学实验指导书
统计学
实
验
指
导
书
重庆工商大学统计学院
2006/4
第一章前言3
1.1背景3
1.2适用范围3
第二章运行环境4
2.1硬件环境4
2.2软件环境4
第三章实验目的和任务5
3.1实验的目的5
3.2实验的任务5
第四章实验内容6
4.1实验一Excel基本操作6
4.2实验二直方图工具10
4.3实验三季节变动时间序列的分解分析14
4.1实验四利用Excel绘制散点图,分析相关系数17
4.1实验五线性回归分析19
第一章前言
1.1背景
自20世纪60年代以后,统计学的发展有三个明显的趋势:
第一,随着数学的发展,统计学依赖和吸收的数学方法越来越多;第二,向其他学科领域渗透,或者说以统计学为基础的边缘学科不断形成。
2003年度诺贝尔经济学奖授予两位著名计量经济学家罗伯特·恩格尔(RobertF.Engle)和克莱夫·格兰杰(CliveGranger)。
20世纪80年代两位获奖者发明了新的统计方法来处理许多经济时间数列中两个关键属性:
时变性(time-varyingvolatility)和非平稳性(nonstationarity),恩格尔研究方向主要是利率、汇率和期权的金融计量分析,提出谱分析回归等创新性统计方法;格兰杰的研究涉及统计和经济计量学,特别是时间序列分析、预测、金融、人口统计学、方法论等领域。
这足以证明统计方法应用的领域越来越广泛,可以应用于各行各业的数据分析,使统计学成了一门“万能”的方法论学科。
美国SCIENCFY有一篇文章列出近百年来最有用的科学,统计高居前十名。
随着统计学应用日益广泛和深人,由于受计算机和新兴科学的影响,使统计学越来越依赖于计算技术,成为数量分析的方法论科学。
这一时期统计学的研究和应用范围越来越广。
比如海洋学中水面的高程,电磁能(特别是无线电波)的流量,工业过程的状态,生物的状态,都能用计算机收集;没有计算机这些是不实际或不可能的。
计算机节省了大量人力,特别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量时。
由于计算机软件SPSS和SAS可用于所有通常的检验,特别是关于方差分析,则节省更多时间。
而且随着统计学发展的越来越快,它与计算机科学结合也就越紧密,也就会带来更大的社会效益。
因此,在高等学校尤其是财经、经贸、商业类高校的《统计学》教学中为了使学生能够对所学知识和方法有更好地掌握,必须做好试验方面的教学。
1.2适用范围
我院设计的统计实验以及开发的实验环境主要用于统计、国际贸易、电子商务、企业管理与信息系统、旅游管理、行政管理等专业本科《统计学》课程的辅助教学。
另外,此套实验也适用于统计机构、市场调查公司进行基础培训。
第二章运行环境
2.1硬件环境
Ø50个客户端同时在线时,本软件对服务器的要求:
◆CPU主频≥900MHZPⅢ及以上芯片
◆内存≥256M
◆硬盘转速≥7200转/分建议使用SCSI硬盘
Ø100个客户端同时在线时,本软件对服务器的要求:
◆CPU主频≥1.8GHZ缓存>1M至强系列芯片推荐使用双CPU
◆内存≥1G
◆硬盘建议使用SCSI硬盘
Ø另外,推荐服务器安装RAID卡,以保证数据的安全性。
2.2软件环境
Ø服务器端
◆操作系统:
MicrosoftWindowsXP
◆数据库系统:
MicrosoftSQLServer2000
◆运行平台:
IIS5.0以上
Ø客户端:
◆Windows98及以上版本,IE浏览器要求5.0以上,Microsoftword2000以上。
Ø由于本软件为B/S架构,维护较为方便,只需要保证服务器的正常运行就可以。
第三章实验目的与任务
3.1实验目的
长期以来,我国高等教育中《统计学》课程的教学由于各种客观条件的限制只能以理论教学为主,缺乏对于实践的操作。
这种传统教学模式已不能适应新形式的需要。
因为随着统计学在经济、社会生活中更广泛和深入的应用以及市场调查分析方法的成熟与完善,脱离实际的教学难以使学生对统计学有更深刻的感性认识,也难以使他们在今后的工作中熟练使用统计的方法和软件。
所以许多高校重视实践教学环节的开发和改革,希望能在教学中使用可靠的实验系统,给学生提供一个高效的模拟实习环境。
正是基于这种现实,我院在统计学实验中设计的实验项目应使学生熟练掌握统计软件的基本操作,利用统计软件对简单的经济和社会问题进行具体分析,激发他们学习统计学的兴趣,从感性层面更牢固地掌握统计学的知识和方法,为他们将来在工作中熟练运用统计工具解决问题打下良好的基础。
3.2实验任务
《统计学》是一门基础课程,教学面向的学生也较多,因此本门课实验建议不使用难以掌握的软件,一般使用MicrosoftExcel作为实验教学软件。
具体实验任务如下:
1.掌握Excel的基本操作;
2.掌握Excel的主要函数;
2.掌握统计图表的编制,尤其要熟练掌握直方图的绘制方法;
3.掌握一元线性回归的分析方法,了解t检验、F检验的内涵;
4.掌握季节变动的分析方法。
第四章实验内容
4.1Excel基本操作
一、Excel操作方法概述
要完成任一项Excel操作一般都可以找到三种操作方法:
鼠标操作、菜单操作和键盘命令操作。
例如,想要将A1单元格的数据复制到A2单元格去,有如下几种操作方法:
(一)鼠标操作法:
先用鼠标选中A1单元格,然后缓慢移动鼠标到A1单元格的右下角,当鼠标的形状变为黑色实心“十”字形之后(以后称之为“添充柄”),拖动鼠标到A2单元格,然后放开鼠标,则A1的数据就复制到A2单元格了。
(二)菜单操作法:
先用鼠标选中A1单元格,选择“编辑”菜单中的“复制”命令,然后用鼠标选中A2单元格,再选择“编辑”菜单中的“粘贴”命令,数据就复制到A2单元格了。
(三)键盘命令操作法:
直接用鼠标选中A2单元格,从键盘输入“=A1”命令,则复制即告完成。
以上是Excel中很典型的三种操作方法。
在实际使用过程中,应根据实际情况,尽量选择三种方法中最简洁的操作方法,以提高操作速度。
二、文件基本操作
(一)新建文件:
进入“文件”菜单栏,选择“新建”即可创建一个新的Excel文件。
(二)打开文件:
进入“文件”菜单栏,选择“打开”子菜单,可在Excel中打开一个已经存在的数据文件。
它可以是Excel的数据文件,也可是Excel兼容的其它软件的数据文件。
可在不同窗口中同时打开多个数据文件,通过“窗口”菜单下方的不同选项,进行不同窗口的切换。
(三)保存文件:
进入“文件”菜单栏,选择“保存”命令,可保存当前数据文件。
如果选择“另存为”,可将当前工作簿存为一个新的文件。
保存文件的格式可以是Excel的数据文件,也可是Excel兼容的其它软件的数据文件。
(四)文件打印:
进入“文件”菜单栏,选择“打印”,可打印当前的工作簿文件。
打印之前,可以选择“文件”菜单栏的“页面设置”和“打印预览”选项,进行打印前的页面设置操作和打印效果的预先浏览。
三、数据的输入输出操作
(一)数据的手动输入
建立一个新的Excel文件之后,便可进行数据的输入操作。
Excel中以单元格为单位进行数据的输入操作。
一般用上下左右光标键,Tab键或用鼠标选种某一单元格,然后输入数据。
Excel中的数据按类型不同通常可分为四类:
数值型,字符型,日期型,和逻辑型。
Excel根据输入数据的格式自动判断数据属于什么类型。
如日期型的数据输入格式为“月/日/年”,“月-日-年”或“时:
分:
秒”。
要输入逻辑型的数据,输入“true”(真)或“false”(假)即可。
若数据由数字与小数点构成,Excel自动将其识别为数字型,Excel允许在数值型数据前加入货币符号,Excel将其视为货币数值型,Excel也允许数值型数据用科学记数法表示,如2╳109在Excel中可表示为2E+9。
除了以上三种格式以外的输入数据,Excel将其视为字符型处理。
(二)公式生成数据
Excel的数据中也可由公式直接生成。
例如:
在当前工作表中A1和B1单元格中已输入了数值数据,欲将A1与B1单元格的数据相加的结果放入C1单元格中,可按如下步骤操作:
用鼠标选定C1单元格,然后输入公式“=A1+B1”或输入“=SUM(a1:
b1)”,回车之后即可完成操作。
C1单元格此时存放实际上是一个数学公式“A1+B1”,因此C1单元格的数值将随着A1、B1单元格的数值的改变而变化。
Excel提供了完整的算术运算符,如+(加)-(减)*(乘)/(除)%(百分比)^(指数)和丰富的函数,如SUM(求和)、CORREL(求相关系数)、STDEV(求标准差)等,供用户对数据执行各种形式的计算操作,在Excel帮助文件中可以查到各类算术运算符和函数的完整使用说明。
(三)复制生成数据
Excel中的数据也可由复制生成。
实际上,在生成的数据具有相同的规律性的时候,大部分的数据可以由复制生成。
可以在不同单元格之间复制数据,也可以在不同工作表或不同工作簿之间复制数据,可以一次复制一个数据,也可同时复制一批数据,为数据输入带来了极大的方便。
普通单元格的复制结果与公式单元格的复制结果相差较大,下面分别予以说明。
1.普通单元格指的是非公式的单元格。
普通单元格的复制,一般可以按如下步骤进行:
(1)拖动鼠标选定待复制的区域,选定之后该区域变为黑色。
Excel可以进行整行、整列或整个表格的选定操作,例如,如果要选定表格的第一列,可直接用鼠标单击列标“A”,如果要选定表格的第一行,可直接用鼠标单击行标“1”,如果要选定整个表格,可直接点击全选按扭,如图4-1所示:
图4-1
(2)选定完区域之后,用鼠标右击该区域,选择“复制”,将区域内容复制到粘贴版之中。
可以发现该区域已被虚线包围。
(3)用鼠标右击目标区域,选择“粘贴”,则单元格区域的复制即告完成。
2.公式单元格的复制,一般可分为两种,一种是值复制,一种是公式复制。
值复制指的是只复制公式的计算结果到目标区域,公式复制指的是仅复制公式本身到目标区域。
下面对它们的操作步骤分别予以说明。
(1)值复制:
①拖动鼠标选定待复制区域。
②用鼠标右击选定区域,选择“复制”选项。
③用鼠标右击目标区域,再单击“选择性粘贴”子菜单。
出现复制选项,选定“数值”选项,然后用鼠标单击“确定”按扭,则公式的值复制即告完成。
(2)公式复制:
公式复制是Excel数据成批计算的重要操作方法,要熟练公式复制的操作首先要区分好两个概念:
单元格的相对引用与绝对引用。
Excel中的公式中一般都会引用到别的单元格的数值,如果你希望当公式复制到别的区域之时,公式引用单元格不会随之相对变动,那么你必须在公式中使用单元格的绝对引用。
如果你希望当公式复制到别的区域之时,公式引用单元格也会随之相对变动,那么你必须在公式中使用单元格的相对引用。
在公式中如果直接输入单元格的地址,那么默认的是相对引用单元格,如果在单元格的地址之前加入“$”符号那么意味着绝对引用单元格。
例如,在当前工作表中A1和B1单元格中已输入了数值数据,用鼠标选定C1单元格,然后输入公式“=A1+B1”,此公式引用的便是两个相对的单元格A1、B1,也就是说,如果将该公式复制到C2的单元格,公式所引用的单元格的地址将随着发生变化,公式将变为“=A2+B2”,如果将该公式复制到F100的单元格,那么公式将变为“=D100+E100”,这就是相对引用的结果,公式的内容随着公式的位置变化而相对变化。
如果在C1单元格输入的是“=$A$1+$B$1”那么此公式引用的便是绝对的单元格,不论将公式复制到何处,公式的内容都不会发生变化。
当然,绝对引用和相对引用亦可在同一公式之中混合交叉使用,例如,如果在C1单元中输入的是公式“=A$1+B$1”,那么意味着,公式的内容不会随着公式的垂直移动而变动,而是随着公式的水平移动而变动,如果将该公式复
制到F100单元格,那么公式将变为,“=D$1+E$1”。
可以作这样的归纳:
公式中“$”符号后面的单元格坐标不会随着公式的移动而变动,而不带“$”符号后面的单元格坐标会随着公式的移动而变动。
在实际的使用中,如果能把单元格的相对引用与绝对引用灵活应用到
Excel的公式之中,能为数据成批准确运算带来极大的方便。
四、数据的移动操作
数据的移动操作可按如下步骤进行:
(一)拖动鼠标选定待移动区域。
(二)用鼠标右击选定区域,选择“剪切”选项。
(三)用鼠标右击目标区域,选择“粘贴”,则单元格区域的移动即告完成。
与数据的复制操作不同,公式单元格的移动操作不存在值移动或公式移动的区别,也不存在绝对引用已相对引用的区别,移动操作将把公式单元格的公式内容原原本本移动到目标区域,不作任何改动。
五、数据的删除操作
数据的删除操作可按如下步骤进行:
(一)拖动鼠标选定待删除区域。
(二)用鼠标右击选定区域,选择“删除”,即可删除单元格区域的内容。
如果不小心删除了不该删除的区域,可以通过“编辑”菜单的“撤消”命令来恢复被删除的内容。
“撤消”操作是Excel中较常用到的操作,如果不小心实施了错误的操作,那么可以通过“撤消”操作使工作表恢复原样。
六、与其它软件交换数据的方法
在Excel中可以打开其它类型的数据文件,如FOXPRO系列的DBF数据库文件,文本文件,lotus1-2-3的数据文件等。
具体操作方法如下:
(一)在“文件”菜单中选择“打开”子菜单。
(二)在“打开文件”对话框中选择所要打开的文件的类型及其所在的目录。
(三)用鼠标双击该文件名,并按Excel提示步骤操作即可打开该文件。
Excel文件同样也可存为其它类型的数据文件,具体操作方法如下:
(一)编辑好文件后,在“文件”菜单中选择“另存为”子菜单。
(二)在“另存为”对话框中选择所要打开文件的类型及其所在的目录。
(三)输入文件名之后,用鼠标单击“保存”按扭即可。
4.2统计制图
(一)直方图的绘制
1.简介:
直方图用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。
例如,在一个有50名学生的班级里,可以通过直方图确定考试成绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区域”框中。
2.操作步骤:
(1)用鼠标点击表中待分析数据的任一单元格。
(2)选择“工具”菜单的“数据分析”子菜单。
(3)用鼠标双击数据分析工具中的“直方图”选项。
(4)出现“直方图”对话框,对话框内主要选项的含义如下:
输入区域:
在此输入待分析数据区域的单元格范围。
接收区域(可选):
在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。
这些值应当按升序排列。
只要存在的话,Excel将统计在各个相邻边界值之间的数据出现的次数。
如果省略此处的接收区域,Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。
标志:
如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel将在输出表中生成适宜的数据标志。
输出区域:
在此输入结果输出表的左上角单元格的地址。
如果输出表将覆盖已有的数据,Excel会自动确定输出区域的大小并显示信息。
柏拉图:
选中此复选框,可以在输出表中同时显示按降序排列频率数据。
如果此复选框被清除,Excel将只按升序来排列数据。
累积百分比:
选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。
如果清除此选项,则会省略以上结果。
图表输出:
选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。
所选数据如图4—2所示。
图4—2
(5)按需要填写完“直方图”对话框之后,按“确定”按扭即可。
3.结果说明:
完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。
输出结果如图4—3所示。
图4—3
(二)折线图的绘制
1.简介:
折线图主要用于比较几类数据变动的方向和趋势,表现数据在不同时期发展变化的不同。
如上例,可以将学生分为5组,用折线图反映每组中的学生成绩的变化情况。
2.操作步骤:
(1)用鼠标点击“数据”下的“图表向导”符号。
(2)点击“图表向导”中“标准类型”中的“折线图”。
(3)在“子图表类型”中选择适当的类型,并点击下一步。
(4)点击并框定数据区域。
(5)连续点击下一步,直至完成。
结果如图4-4所示。
图4-4
(三)饼图的绘制
1.简介:
饼图的主要作用是显示各部分数据所占的比例。
比如计算某集团十个分厂产值完成的结构相对数,以饼图的形式来反映各单位的完成情况。
2.操作步骤:
(1)计算各厂的合计产值,并计算各厂在总产值中所占比例。
(2)用鼠标点击“数据”下的“图表向导”符号。
(3)点击“图表向导”中“标准类型”中的“饼图”。
(4)在“子图表类型”中选择适当的类型,并点击下一步。
(5)在“数据区域”项选择各厂的百分比数据,在“系列”的“分类标志”项选择各厂的名称,并点击下一步。
(6)在“标题”项中的“图表标题”项输入“各厂完成产值百分比”,在“数据标志”项点击“百分比”,继续下一步。
(7)点击完成。
所得图表如图4-5所示。
图4-5
4.3季节变动时间序列的分解分析
(一)简介:
分解分析法是分析时间序列常用的统计方法。
季节时间序列是趋势变动(T)、季节变动(S)、随机变动(I)综合影响的结果,分解过程要从原始序列中消除随机变动,然后分别识别出季节变动和趋势变动的变化模式。
下面结合具体例子介绍在Excel中如何实现时间序列的分解分析。
如图4—6所示,表中A1至B13单元格是1996至1998年各季度某海滨城市旅游人口数(千人),试预测1999年各季度旅游人口数。
(二)操作步骤:
1.计算一次移动平均,消除随机波动。
在C3单元格填入公式“=AVERAGE(B2:
B5)”,然后用“填充柄”将公式复制到C4:
C11单元格。
2.中心化移动平均数。
在D4单元格输入公式“=AVERAGE(C3:
C4)”,然后用“填充柄”将公式复制到D5:
D11单元格。
3.计算各个季节指数。
在E4单元格输入公式“=B4/E4”,然后用“填充柄”将公式复制到E5:
E11单元格。
4.计算平均季节指数。
在F4单元格中输入公式“=AVERAGE(E4,E8)”,
然后用“填充柄”将公式复制到F5:
F7单元格。
图4—6
5.计算调整后的季节指数。
为了让季节指数的总平均为1,必须对季节指数加以调整。
在G4单元格中输入公式“=F4/AVERAGE($F$4:
$F$7)”,然后用“填充柄”将公式复制到G5:
G7单元格。
G4:
G7就是最终计算出的季节指数,按G4:
G7给出的4个季度的季节指数,将季节指数填充到G2:
G13的其它单元格。
6.消除旅游人数序列中的季节变动。
在H2单元格中输入“=B2/F2”,
然后用“填充柄”将公式复制到H3:
H13单元格。
则H列就是消除季节
变动之后的旅游人数时间序列。
7.对消除季节变动的旅游人数进行回归分析。
在I列填入时间序号1至12,如图4—6所示。
选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。
按图4—7所示的方式填写对话框。
然后单击“确定”按扭,即可得到剔除了季节波动的时间序列的线性趋势模型。
估计结果如图4—8所示,其中B35单元格是线性趋势模型的截距,B36单元格是斜率。
图4—7
图4—8
8.预测。
在G14:
G17单元格中分别填入刚才计算出的四个调整后的季节指数,在B14单元格中输入公式“=($B$35+I14*$B$36)*G14”,然后利用“填充柄”将公式复制到B15:
B17单元格,B14:
B17单元格中就是1999年各个季度旅游人数的预测值,如图4—9所示。
图4—9
4.4利用Excel绘制散点图,分析相关系数
(一)利用Excel绘制散点图
1.简介:
散点图是观察两个变量之间关系程度最为直观的工具之一,利用Excel的图表向导,可以非常方便的创建并且改进一个散点图,也可以在一个图表中同时显示两个以上变量之间的散点图。
2.操作步骤:
数据如图4-10所示,
图4-10
可按如下步骤建立变量x-y,x-z的散点图:
(1)拖动鼠标选定数值区域A2:
C12,不包括数据上面的标志项。
(2)选择“插入”菜单的“图表”子菜单,进入图表向导。
(3)选择“图表类型”为“散点图”,然后单击“下一步”。
(4)确定用于制作图表的数据区。
Excel将自动把你前面所选定的数据区的地址放入图表数据区的内。
(5)在此例之中,需要建立两个系列的散点图,一个是x-y系列的散点图,一个是x-z系列的散点图,因此,必须单击“系列”标签,确认系列1的“X值”方框与“数值方框”分别输入了x,y数值的范围,在系列2的“X值”方框与“数值方框”分别输入了x,z数值的范围。
在此例中,这些都是Excel已经默认的范围,所以,可忽略第5步,直接单
击“下一步”即可。
(6)填写图表标题为“X-Y与X-Z散点图”,X轴坐标名称为“X”与Y轴坐标名称“Y/Z”,单击“下一步”。
(7)选择图表输出的位置,然后单击“完成”按扭即生成图4-11的图表。
图4-11
3.结果说明:
如图附-4所示,Excel中可同时生成两个序列的散点图,并分为两种颜色显示。
通过散点图可观察出两个变量的关系,为变量之间的建立模型作准备。
(二)相关系数分析
1.简介:
此分析可用于判断两组数据之间的关系。
可以使用“相关系数”分析方法来确定两个区域中数据的变化是否相关,即一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零)。
2.操作步骤:
采用图附-3表中的数据,可按如下步骤计算变量x,y,z之间的相关系数。
(1)用鼠标点击表中待分析数据的任一单元格。
(2)选择“工具”菜单的“数据分析”子菜单。
(3)用鼠标双击数据分析工具中的“相关系数”选项。
(4)填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵,结果如图4-12所示。
图4-12
(三)结果说明:
以上下三角矩阵计算出三个变量x,y,z两两之间的相关系数,如变量x,y之间的相关系数为:
0.929167,所以可以判断x,y之间存在着较高的正线性相关关系。
4.5线性回归分析
(一)简介:
线性回归分析通过对一组观察值使用“最小二乘法”直线拟
合,用来分析单个因变量是如何受一个或几个自变量影响的。
例子如图4—13所示,表中是我国1987年至1997年的布匹人均产量和人均纱产量,
试用线性回归分析的方法分析两组数据之间的关系。
图4—13