1、应用统计学上机应用统计学上机 工商管理学院应用统计学实验作业班 级 学 号 姓 名 上课教师 2017年11月实验二 建立数据文件1.建立一个数据文件记录试录入以下数据,并按要求进行变量定义。数据:学号姓名性别生日身高(cm)体重(kg)英语(总分100分)数学(总分100分)生活费($人民币)200201刘一迪男1982.01.12156.4247.547579345.00200202许兆辉男1982.06.05155.7337.837876435.00200203王鸿屿男1982.05.17144.638.666588643.50男1982.08.31161.541.687982235.5
2、0男1982.09.17161.343.368277867.00女1982.12.2115847.358174女1982.10.18161.547.4477691233.00女1982.07.06162.7647.876773767.80女1982.06.01164.333.856477553.90女1982.09.1214433.847080343.00男1981.10.13157.949.238485453.80男1981.12.6176.154.548580843.00200213欧阳飞男1981.11.21168.550.677979657.40200214贺以礼男1981.09.28
3、164.544.5675801863.90200215张放男1981.12.0815358.877669462.20200216陆晓蓝女1981.10.07164.744.148083476.80200217吴挽君女1981.09.09160.553.347982200218李利女1981.09.1414736.467597452.80200219韩琴女1981.10.15153.230.179075244.70200220黄捷蕾女1981.12.02157.940.457180253.00要求:将录入结果截图粘贴在作业题目答案处(变量视图和数据视图)。(1)变量名同表格名,以“()”内的内容
4、作为变量标签。对性别(Sex)设值标签“男=0;女=1”。(2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。(3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。答案:1准备工作。打开SPAA2选择变量视图,依次录入学号,姓名,性别等。2.对大学生创业问题设计一份调查问卷。要求格式正确,题目类型包括开放题、封闭题(单选、多选都有)、半封闭题三种类型,题目个数10-15个。答案:3.用第2题得到的调查问卷进行模拟调查(10份),并将得到的结果录入到SPSS中,(1)将录入结果保存为xxx.sav文件,并将录入结果截图粘贴在作业题目答
5、案处(变量视图和数据视图)。答案:实验三 数据的整理 1. 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管理,收获后,测得各个地块生产的小麦的千粒重(g)数据资料如表3-1所示。 表3-1 某地区小麦种植id甲村id乙村中麦9号豫展1号中麦9号豫展1号1234543.1142.1537.5938.2340.1948.9145.6341.5944.2337.4367891043.8736.7143.5940.8342.5144.7545.6743.1546.7139.55要求:分别按照“小麦
6、品种”和“村”对小麦的千粒重(g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。步骤:1.准备工作。打开3-1文件,通过文件-打开,将文件放入打开窗口。2.选择数据-分类汇总。3.打开分类汇总窗口,将小麦品种放入分组变量对话框中,将千粒重放入变量摘要对话框中。4.选择函数选项,在函数对话框中选择均值选项5.选择继续-确定,得出结果。以此方式得出村对小麦千粒重的分类汇总。2.某地20家企业的情况如表3-2所示。 表3-2 企业年产值与年工资总额编号部门所有制类型年产值(万元)职工人数(人)年工资总额(万元)1234567891011121314151617181920工业交通商
7、业交通工业工业邮电通讯商业交通工业工业交通工业工业商业邮电通讯工业工业商业交通国有国有集体个体集体国有国有个体个体国有集体个体国有集体股份制国有国有股份制国有国有2805.581265.40256.5026.88560.00800.502580.98125.45590.60950.001556.00950.00335.002455.081780.582500.00775.003305.00498.08965.58123560510520223568890651483254853541056806464853541015202246812.63435.6068.5814.00156.07256.
8、74854.4065.16130.24268.13394.20257.9082.43639.20471.25486.98272.58912.00139.20159.95要求:根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题:(1)调用排序命令对企业按部门、年产值的主次顺序进行排序。步骤:1准备工作。打开3-2文件,通过文件-打开,将文件放入文件打开窗口。2.选择数据-排序个案。3.打开排序个案对话框,将部门和年产值放入排序依据对话框中。4.在排列顺序中选择降序。5.选择确定按钮,得出结果。(2)调用分类汇总命令分别按部门和所有制类型对年产值等指标进行分类汇总,并统计单位个数,分
9、别以“将汇总变量添加到活动数据集”和“创建只包含汇总变量的新数据集”保存结果。答案:1.选择数据-分类汇总。2.在分类汇总对话框中,将部门放入分组变量中,将年产值放入变量摘要中。3.在保存对话框中,选择将汇总变量添加到活动数据集选项。4.选择确定,得出结果。1.选择数据-分类汇总。2.在分类汇总对话框,将所有制形式放入分组变量对话框中,将年产值放入变量摘要对话框中。3.在函数选项中,选择均值均值选项。4.在保存对话框中,选择创建只包含汇总变量的新数据,将名称命名为所有制形式。5.选择确定选项,得出结果。3. 根据习题2的数据文件进行“选择个案”实验练习,并回答下列问题:(1)选择随机抽样方法,
10、抽取约30%的个案作为样本,将此执行两次,所得到的样本是否相同?步骤:1.选择数据-排序个案2.打开排序个案对话框,选择随机个案样本,在样本尺寸中选择大约,填入30.3.选择继续-确定,得出结果。4.重复此方式,得出结果。分析:得出结果不同。(2)选择满足职工人数300人以上的个案;步骤:1选择数据-选择个案2.在选择个案对话框中,选择如果条件满足选项。3.在选择个案对话框中,输入职工人数(人) 3004.选择继续-确定,得出结果。(3)选择观测值在5至15之间的样本。答案:1.选择数据-选择个案-选择基于时间或个案全距。2.在选择个案范围对话框中,将观测值设置为5 15.3.选择继续-确定,
11、得出结果。实验四 描述性统计分析和统计报告概述1. 根据数据4-1.sav,对某高班学生的体重做描述性分析,并对结果做简单的分析。步骤:1准备工作。打开4-1文件,通过文件-打开将文件放入打开窗口。2.选择分析-描述统计-描述。3.在描述分析的对话框中,将体重放入变量对话框中。4.选择统计量选项,勾选标准差,方差,均值等。5.点击确定,得出结果。2. 根据数据4-2.sav,分析不同性别演员获得奥斯卡的年龄差异性。步骤:1准备工作。打开4-2文件,通过文件-打开将文件放入打开窗口。选择分析-描述统计-描述。3. 在打开描述对话框中,将男演员和女演员的年龄选入变量对话框。4. 选择选项,在选项对
12、话框中,选择均值,偏值等。5.选择确定,得出结果。描述统计量N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误男演员 male36317645.1410.406.898.393.704.768女演员female36218038.9413.5461.503.3932.111.768有效的 N (列表状态)36分析:男演员获得奥斯卡奖的最小年龄为31岁,最大为76岁,女演员获得奥斯卡奖最小年龄为21岁,最大年龄沃日80岁,男演员获得奥斯卡奖的平均年龄大于女演员,且男演员获得奥斯卡的年龄差要小于女演员。3. 根据数据4-3.sav,进行下列统计和分析。(1)对机械
13、厂各部门职工人数进行频数分析,并绘制饼图;步骤:1准备工作。打开文件4-3通过文件-打开将文件放入打开窗口。2.选择分析-描述统计-频率。3.在频率对话框中将车间部门放入变量对话框中。4.选择统计量对话框,选择均值,偏值等选项。5.在图表选项中,选择饼图。6.选择确定,得出结果。统计量车间部门N有效429缺失0均值2.78中值2.00标准差2.186偏度.787偏度的标准误.118百分位数251.00502.00754.00分析:从图中所知,在机器加工产的工人所占比例最多,在汽车队的工人最少。(2)先将职工月平均工资按200,300,301,400,401,500,501,550分为四等,再运
14、用频数分析方法对各工资等级中职工总人数统计。步骤:1选择数据-选择个案。2.在选择个案对话框中,选择如果 ,在弹出选择个案的对话框中,打入wage = 200& wage = 200& wage = 200 & wage = 301 & wage = 401 & wage = 501 & wage 0.05,则不能拒绝原假设,不存在显著差异。,2我国2011年城镇单位就业人员年平均工资为41047.1元,浙江省11座城市城镇单位就业人员年平均工资如数据4-3.sav所示,假定总体服从正态分布,显著性水平为0.05,检验浙江城镇单位就业人员年平均工资和全国年平均工资水平是否有显著性差异(基本数据
15、见5-2.sav )。步骤:1准备工作。打开5-1文件,通过文件-打开将文件放入打开窗口。2.选择分析-比较均值-单样本T检验。3.打开单样本T检验,将平均工资放入检验变量对话框中,在选项中将置信区间设置为95.4.将检验值设置为41047.15.选择继续-确定,得出答案。单个样本统计量N均值标准差均值的标准误平均工资1146137.735169.8691558.774单个样本检验检验值 = 0 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限平均工资29.59910.00046137.72742664.5649610.89分析:浙江省内城镇平均工资为46137.73,得t值为2
16、9.599,样本均值和检验值的差为0.000.05,则不能拒绝原假设,男女高考数学成绩不存在显著差异。在假设方差不存在的情况下,所得p值为0.0650.05,不能拒绝原假设,男女高考数学成绩不存在显著差异。4为研究一种减肥药品的效果,将抽取了20名试验者进行试验,服用该产品一个疗程前后的体重,试用配对样本t检验的方法判断该药物能否引起实验者体重的明显变化。数据见5-4.sav。步骤:1准备工作。打开文件5-3,通过文件-打开将文件放入打开窗口。2.选择分析-比较均值-配对样本T检验。3.在配对样本对话框中,将服药前后的体重分别放入对话框中。4.选择确定,得出结果。成对样本统计量均值N标准差均值
17、的标准误对 1服药前体重74.540209.24402.0670服药后体重74.000206.93091.5498成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1服药前体重 - 服药后体重.54003.1488.7041-.93372.0137.76719.453成对样本相关系数N相关系数Sig.对 1服药前体重 & 服药后体重20.964.000分析:服药前的平均体重为74.54,服药后的体重为74,相对应的样本均值和检测值的差为0.000.05,则拒绝原假设,存在明显差异。实验六 统计抽样与参数估计1. 背景资料:有几位大学生组成的调查
18、组,为了解他们所在地区居民的收入情况,作为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表6-1所示。 表6-1 样本数据 单位:万元3.121.882.132.113.210.901.672.453.502.871.661.892.503.262.361.760.680.880.752.442.503.201.601.302.102.152.802.503.100.601.102.102.611.460.924.203.651.323.394.002.601.351.802.902.202.301.501.100.901.502.602.3
19、02.401.150.702.701.301.201.502.602.502.501.152.132.501.901.400.750.851.701.602.402.103.102.693.343.882.662.152.601.801.901.800.950.751.481.602.502.302.602.552.451.651.802.662.352.441.883.253.851.352.152.601.902.662.494.102.581.981.253.122.113.004.325.801.552.182.672.881.951.492.452.661.782.753.353.401.502.802.401.902.662.701.662.222.903.502.773.422.751.891.453.123.332.691.582.581.862.853.553.193.783.772.992.083.032.892.422.901.541.112.602.803.203.334.114.002.681.802.352.201.503.802.402.303.904.105.903
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1