ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:299.31KB ,
资源ID:17694845      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/17694845.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

统计学.docx

1、统计学四川师范大学经济与管理学院统计分析实训报告册课程名称专 业班 级学生姓名学 号指导老师实训一 Excel软件基本统计(描述统计)操作实训一、实训目的利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。二、实训内容 (一)基本函数使用(用函数工具指令完成此项内容)1,要求表1 某班学生期末成绩单学号性别数学语文外语学号性别数学语文外语0301女8886720311男5665720302男7588900312男8278880303男8076630313女7276630304男7592780

2、314男7880860305女6570580315男8077660306女7250800316女6578810307女9188950317男9876800308男6876810318男6077660309女7277790319女7067680310女9588960320男827875(1) 计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的3个同学;(2) 求这3 门课的平均分和标准差、最大值、最小值、峰度、偏度;(3) 将数学成绩按5级分类汇总统计(优、良、中、及格和不及格)人数。2,实训步骤第一种方法(1) 通过函数“AVERAGE”算出平均分;“数据”中的“降序”排序

3、 ;(2) 通过函数“AVERAGE /STDEV.P/MAX/MIN/SKEW/QURT”算出平均分/标准差/最大值/最小值/偏度/峰度;(3) 先用“IF”将成绩划分等级,再“数据”中的“降序”排序 ;“数据”中的“分类汇总”汇总。第二种方法利用“数据分析”的“描述统计”获得平均分/标准差/最大值/最小值/偏度/峰度。 3,实训结果与分析第一种方法(1) 将所有数据列向分布,在第一位同学的外语成绩的单元格直接输入“=average(K3:M3)”或者采用插入函数和选择区域的方式输入,再单击Enter并下拉,就可以算出平均分;选择平均分数据,再在“数据”中选择“降序”,就对数据进行了排序,可

4、获得最高分和最低分。三位最高和最低的平均分为(310,女,93)(307,女,91.33)(317,男,84.67)(306,女,67.33)(305,女,64.33)(311,男,64.33)所以,可以看出该班同学这次考试成绩极差即差距大。(2)在数学成绩下的单元格输入“=AVERAGE(C3:C26)”或者采用插入函数和选择区域的方式输入并右拉,就可以算出平均分;同样在平均分下的单元格输“=STDEV.P/MAX/MIN/SKEW/QURT(C3:C26)”或者采用插入函数和选择区域的方式输入并右拉,就可以算出标准差/最大值/最小值/偏度/峰度。数学成绩的平均分为76.2,最大值为98,最

5、小值为56,标准差为10.88393,离散系数为0.142834,偏度为0.255195,峰度为-0.31207。语文成绩的平均分为77.12,最大值为92,最小值为50,标准差为1,离散系数为0.119732,偏度为-1.05791,峰度为2.503167。外语成绩的平均分为76.85,最大值为96,最小值为58,标准差为10.5843,离散系数为0.137727,偏度为0.098244,峰度为-0.78075。所以,该班学生三门成绩的平均分相差较小;数学和外语、语文成绩的离散程度递减;数学和外语成绩呈右偏分布,语文成绩成左偏分布,且偏斜程度从大到小为语文,数学和外语;数学与外语成绩呈扁平分

6、布,语文成绩呈尖峰分布。(3)首先在第一行成绩的右边空白单元格输入“=IF(K390,优,IF(K380,良,IF(K370,中,IF(K360,及格,不及格) ”再下拉(完成对数学成绩的等级分类),用“数据”中的“排序或升降序”排序;最后选择所有数据后单击“数据”中的“分类汇总”设置条件即可。数学成绩优、良、中、及格和差的人数分别为3、3、8、4和2,其所占比率为15%、15%、40%、20%和10%,所以该班数学成绩主要集中在中等水平,优秀率和不及格率较低。第二种方法单击“工具”中的“数据分析”,再选择“描述统计”,然后在对话框中输入输入区域和输出区域,勾选想要知道的数据。(二)利用描述统

7、计工具进行指标分析1,要求现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、3107、3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、2874、2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、3133、3176、1459、1097、1396,使用描述统计工具对工资进行统计。2,实训步骤单击“工具”中的“数据分析”,再选择“描述统计”,然后在对话框中输入输入区域和输出区域,勾选想要知道的数据。3,实训结果与分析得到的描述统计的数据为平均工资为190

8、2.23,标准误差为141.76,中位数为1694.5,众数为1097,标准差为776.45,方差为602881.2,峰度为-0.67,偏度为0.83,最小值为1082,最大值为3569,极差=2487。所以工资水平一般,集中趋势点较低,差距较大,离散程度较高,分布呈右偏和扁平分布,且偏斜程度和扁平程度较大。三、实训总结学会了利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作:运用函数AVERAGE/STDEV.P/MAX/MIN/SKEW/QURT或者使用数据分析分别计算平均数/标准差/最大值/最小值/偏度/峰度;运用数据选项卡中有关命令排序、汇总。注意点:评价一组数据的离散程度

9、可以使用极差、标准差、方差、峰度等,一组数据分布倾斜方向以及程度可以使用偏度,但评价不同水平或计量单位的几组数据用离散系数。实训二 统计分组和统计表、统计图的制作一、实训目的掌握用Excel进行统计分组。掌握频数分布表和直方图数据分析基本技巧和操作方法。利用统计图表工具进行数据直观分析。掌握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。二、实训内容(一)函数法进行统计分组、编制频数分布表、绘制直方图1,要求在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不

10、同的函数。某区共有30家企业,他们类型情况如下表,试编制此区企业类型的频数分布表,并生成直方图和拆线图(要求合并在一张图上)。 某地区企业类型情况表企业编号企业类型企业编号企业类型1中型企业16中型企业2大型企业17大型企业3大型企业18小型企业4小型企业19小型企业5小型企业20中型企业6小型企业21小型企业7中型企业22小型企业8大型企业23中型企业9中型企业24小型企业10小型企业25中型企业11中型企业26大型企业12小型企业27中型企业13小型企业28大型企业14大型企业29小型企业15中型企业30小型企业2,实训步骤(1) 用函数“=COUNTIF”或“FREQUENCY”或“数据

11、分析”制作频率分布表;(2) 采用“插入”直方图生成直方图,再利用“选择数据”生成相同的直方图,最后“更换图表类型”。3,实训结果与分析 1)频率分布表第一种方法(COUNTIF)首先将数据列向分布,其次在空白的单元格中输入企业类型等文本,然后在“大型企业”下面的单元格中输入“=COUNTIF($B$2:$B$31,大型企业)”或在“公式”中“插入函数”(中型企业和小型企业只需复制后再更改内容)第二种方法(FREQUENCY)将数据列项分布,在第一个企业类型的右边单元格输入“=IF(I2=大型企业,1,IF(I2=中型企业,2,3)” 或在“公式”中 “插入函数”,然后拖动鼠标下拉,就可以把文

12、本转换为数据。在两个列向空白的单元格中输入分段点,即文本企业类型转换的数值型数据“1”“2”,选中“1”“2”下面的单元格和右边单元格,单击“插入函数”选择“FREQUENCY”在第一个输入域输入引入的数据区域,第二个输入域输入分段点区域,或者直接输入=“ FREQUENCY(引入的数据区域,分段点区域)”然后单击“Ctrl+Shif+Enter”即可。第三种方法(数据分析)将数据列项分布,在第一个企业类型的右边单元格输入“=IF(I2=大型企业,1,IF(I2=中型企业,2,3)” 或在“公式”中“插入函数”,然后拖动鼠标下拉,就可以把文本转换为数据。在两个列向空白的单元格中输入分段点,即文

13、本企业类型转换的数值型数据“1”“2”,然后选择“数据分析”中的“直方图”(不勾选累计频率)单击“确定”。2)直方图和折线图及其合并选择频率分布表,在“插入”选项卡中选择“柱形图”或者在上面用数据分析制作频率分布图时勾选“图表输出”。右击生成的图表,在“选择数据”中单击“添加”并填入“序列值”(7,10,13)就生成一个同样但不同颜色的柱形图,再右击一个柱形图,然后选择“更改图形类型”中的“折线图”生成折线图。再右击剩下的柱形图,选择“设置数据系列格式”,把间 距调为无间距就生成了直方图。最后在出现的活动选项卡“设计”和“格式”或者在图形右边浮动的工具栏或者右击图表出现的浮动工具栏中增添内容和

14、更改样式。大型企业7个,中型企业10个,小型企业13个,所以,小型企业最多,中型企业次之,大型企业最少,企业的总体规模不大,集中在中小企业。(二)其它图形1,要求根据某地三大产业产值的情况基本数据,绘制该地三个产业的产值的条形图 、饼图、折线图。年份第一产业第二产业第三产业199053.229.81719954433.722.3200035.635.429200426.143.630.3200524.545.130.4200622.645.831.6200720.146.833.1200819.247.633.22,实训步骤选中所有数据,单击“插入”,在图表中选择条形图,折线图以及饼图中环形图

15、,最后在出现的活动选项卡“设计”和“格式”或者在图形右边浮动的工具栏或者右击图表出现的浮动工具栏中增添内容和更改样式。3,实训结果与分析从饼状图的面积可以看出,第一产业的每年的面积越来越小,第一产业的在逐年减少,第二三产业的每年的面积越来越大,第二三产业在逐年不断发展;从条形图可以看出,1995年以前,第一产业长度最长,是最大的产值产业,第二产业在1995-2000年长度超过第一产业,成为最大的产值产业,第三产业也在2000-2004年产值超过第一产业;从折线图可以看出,从2000年以后,第二、三产业的增速加快。三、实训总结我学会了如何用excel制作频率分布表和直方图、折线图、条形图等各种图

16、形,并从获得的表和图形中利用数据进行分析,如:通过插入函数COUNTIF 或FREQUENCY或者利用工具数据分析生成频率分布表;利用插入或数据分析的工具生成直方图。注意:FREQUENCY相比COUNT IF,只能用于数值型数据,共同计算多个数据频率时,不能点击Enter或者确定,只能按Ctrl+Shift+Enter获得;其次在分析图表的数据时,应注意横纵坐标的刻度尺,而且获取不同数据可以采用不同的图表,如饼图便于研究数据的结构,折线图便于研究数据的趋势;最后,我们要学会利用图表数据进行预测。实训三 置信区间估计与假设检验应用实训一、实训目的掌握Excel软件中假设检验方法(单样本t检验)

17、及置信区间应用二、实训内容在正常生产情况下,某厂生产的一种无缝钢管服从正态分布。从某日生产的钢管中随机抽取10根,测得其内径分别为:53.8、54.0、55.1、54.2、52.1、54.2、55.0、55.8、55.4、55.5(单位:mm)(一)区间估计。1,要求请建立该批无缝钢管平均内径95%的置信区间?2,实训步骤(1) 通过“数据分析”或函数AVERAGE和STDEV.S获得平均数和标准差;(2) 通过查表或者通过函数“T.INV.2T”得到的t/2进行一定运算获得置信区间。3,实训结果与分析(1) 将数据列向录入表格中,选择“数据分析”中的“描述统计”,在输入区域输入数据所在区域,

18、输出区域选择一个空白单元格,分组方式选择逐列,勾选“汇总统计”和“平均数置信度”,并在填写区域输入“95”,或者通过函数AVERAGE和STDEV.S,“T.INV.2T(0.05,9)”即可获得平均数54.51和标准误差与临界值的积0.783。(2) 那么置信区间为平均数54.51加减一个标准误差与临界值的积0.783,即置信区间为(53.727,55.293)。(3) 所以,在置信水平95%下,该批无缝钢管平均内径介于53.727mm到55.293mm。(二)假设检验1,要求若该日无缝钢管的内径服从均值为54mm的正态分布。试在5%的显著性水平下检验该日产品的生产是否正常?2,实训步骤统计

19、量检验(1)通过“数据分析”或函数AVERAGE和STDEV.S获得平均数和标准差;(2)通过计算公式获得标准化的统计量;(3)再通过查表或者函数T.INV.2T获得临界值。P值检验通过函数“TDIST”获得P值,再与比较。3,实训结果与分析统计量检验(1) 由于需要检验到该日产品的生产是不正常,所以设H0:=54H1:54(2)通过函数“AVERAGE(A1:A10) /STDEV.S(A1:A10)”或者选择“数据分析”中的“描述统计”计算样本均值54.51和样本标准差s=1.09;(3)再通过输入“(B4-B6)/(B8/SQRT(9)”计算标准化的统计量t=1.397;(4)最后通过查

20、t分布表或者函数“T.INV.2T(0.05,9)”计算出临界值t/2=2.26。(5)临界值t/2=2.26标准化的统计量t=1.397,则不拒绝原假设,即在5%的显著性水平下检验该日产品的生产是不正常的。P值检验 (1) 选择“公式”中的“插入函数”中的“TDIST”,在“X文本框”中输入查表或者函数 “T.INV.2T(0.05,9)”得到的临界值t/2=2.26,在“Deg freedom”输入自由度“9”,在“tails”输入“1”就可以得到p/2值为0.05;(2) p/2=0.05/2=0.025,则不拒绝原假设,即在5%的显著性水平下检验该日产品的生产是不正常的。三、实训总结我

21、学会了用函数STDEV.S/T.INV.2T/ TDIST计算标准差/临界值/p值,并如何运用STDEV.S/T.INV.2T/ TDIST和数据分析进行区间估计和假设性检验。注意点:进行区间估计时,须清楚是大样本还是小样本,若是大样本,还须清楚已知还是未知,若是小样本,须清楚总体正态还是非正态分布。计算临界值时,单尾采用函数T.INV.,双尾采用函数T.INV.2T,但其输入的显著性水平不变。实训四 方差分析应用实训一、目的要求掌握Excel软件中方差分析应用(单因素方差分析和双因素方差分析)二、实训内容(一)单因素方差分析1,要求某城市东西南北5个地区发生交通事故的次数如下表所示。由于是随

22、机抽样,有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、发生事故少(如东部)。试以=5%的显著水平检验各地区平均每天交通事故次数是否相等?表1 某城市5个地区交通事故发生次数东部北部中部南部西部15171411-1210131714-1014131512-1497108713129141092,实训步骤利用“数据分析”中“单因素方差分析”, 获得有关数据“F”(检验统计量)“ F crit ”临界值)“P-value”(P值)。3,实训结果与分析(1) 提出假设H0:东=南=西=北=中H1:i不完全相等(2)选择“数据分析”中“单因素方差分析”,在输入数据区域(不包含

23、文本型数据)“输入区域”,“分组方式”选中“列”,选中“标志位于第一行”,然后在“”和“输出区域”中分别输入“0.05”一个空白的单元格。单击“确定”就可获得有关数据:“SSA=82.64”“SSE=118.02”“MSE=20.66”“MSA=215.62”“F=3.68”(检验统计量)“ F crit=2.84”临界值)“P-value=0.02”(P值);(3)统计量检验F=3.68 F crit=2.84,即:检验统计量处于拒绝域中;P值检验P-value=0.02F critR=4.76;P值检验P-valueR=3.34E-05=0.05,拒绝原假设,不同水温下产量不相等,所以水温

24、对产量的影响显著。施肥对产量统计量检验FC=0.2=0.05,不拒绝原假设,不同施肥方式下产量相同,所以水温对产量的影响不显著。三、实训总结学会了运用EXCEL中的单因素和双因素方差分析来判断不同因素下的几组数据的均值是否相等,进而推测不同因素是否对数据有影响。注意点:当“输入区域”包含了水平所在区域,则要勾选“标志”;我们利用方差分析,可以比多次假设性检验更快判断多组数据的平均是否都相等,即总体水平是否相等,也可以来检验一个因素是否对结果有影响。实训五 相关与回归分析实训一、实训目的掌握Excel软件中回归分析及相关分析应用二、实训内容零售商要了解每周的广告费X及消费额Y之间的关系,记录如表

25、所示。表1 每周广告费X与消费额Y数据表X402025185045402255483852Y385400395365475440490420560525480510(一)1,要求画出散点图;2,实训步骤选择所有数据,单击“插入”中“图表”的“散点图”,生成散点图 。实训结果与分析广告费与消费额的紧密程度较高,呈线性相关关系,而且是广告费越多,消费额越大的正相关关系。(二)1,要求计算相关系数,并进行相关系数的显著性检验(=5%);2,实训步骤(1) 运用“数据”中的“相关系数”或者函数“CORREL”或“PEARSON”进行相关系数的计算;(2) 通过将用函数“T.INV.2T”得到的临界值t

26、/2和运算公式获得的统计量t进行比较来相关系数显著性检验。3,实训结果与分析相关系数第一种方法单击“数据”中的“选择数据”,然后选择“相关系数”,在“输入区域”输入数据区域,勾选“分组方式”的“逐行”和“标志位于第一列”,最后勾选和输入“输出区域”可获得相关系数。第二种方法插入函数“CORREL”,在“Array1”和“Array2”分别输入自变量区域和因变量区域,就生成相关系数。才第三种方法插入函数“PEARSON”,在“Array1”和“Array2”分别输入自变量区域和因变量区域,就生成相关系数。因为r=0.8236370.8,所以广告费与销售额相关程度较大,且呈正相关关系。相关系数的显著性检验(1) 提出假设H0:=0H1: 0(2) 通过函数

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1