1、统计学课后答案第一章:数据与统计学思考与练习:思考题:1。什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学.统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.试举出日常生活或工作中统计数据及其规律性的例子.3.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。4。获取
2、直接统计数据的渠道主要有哪些?5。简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差.非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回.最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数.装满的油漆罐应为4.536 kg。要求:(1)描述总体; (2)描述研究变量; (3)描述样本;(4)描述推断.答:(1)总
3、体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4。53650226。8 kg。7.“可乐战是描述市场上“可口可乐与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好.要求:(1)描述总体;(2)描述研究变量;(3)描述样本; (4)一描述推断.答:(1)总体:市场上的“
4、可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好.第二章、统计数据的描述思考与练习思考题1。描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。2.解释洛伦
5、兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度.3.说明基尼系数的含义和用途基尼系数,或译坚尼系数,是20世纪初意大利经济学家基尼,根据劳伦茨曲线所定义的判断收入分配公平程度的指标。是比例数值,在0和1之间,是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。国际上常用基尼系数定量测定社会居民收入分配的差异程度。4.一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度.常用
6、的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。5.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。6。对于比率数据的平均,为什么采用几何平均?答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采用几何平均。7。简述众数、中位数和均值的特点和应用场合。答:众数、中位数和均值是分布集中趋势的三个主要测度,
7、众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响.8。标准差和方差反映数据的什么特征?9。举出均值和标准差应用的例子.10。为什么要计算离散系数?答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标.11。描述茎叶图和箱线图的画法,并说明它们的用途。练习题1。为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本.服务质量的等级分别表示为:
8、A.好;B。较好;C.一般;D.差;E。较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。解:(1)由于表2。21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D18
9、18E1515合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导条形图选择子图表类型完成(见Excel练习题2。1)。即得到如下的条形图:2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:
10、销售收入在125万元以上为先进企业,115万125万元为良好企业,105万115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为15287=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内的原则,用划记法统计各组内数据的个数-企业数,也可以用Excel
11、进行排序统计(见Excel练习题2。2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率()向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312。522.530。017.510。07。55142633374012.535.065.082。592。
12、5100.04035261473100.087.565。035。017。57.5合计40100。0- (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率()先进企业良好企业一般企业落后企业11119927。527。522.522。5合计40100。03。某百货公司连续40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374426384442363737493942323635 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:全部
13、数据中,最大的为49,最小的为25,知数据全距为4925=24; 为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率()253030353540
14、4045455046159610。015。037.522.515.0合计40100.0 直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2。3)4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:70071672871968570969168470571870671571272269170869069270770170872969468169568570666173566566871069369767465869866669669870669269174769968
15、2698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较.解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据排序确定,即完成数据排序的工作。(见Excel练习题2。4)(2
16、)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2。4) 100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率()650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.4)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相
17、同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147将直方图与茎叶图对比,可见两图十分相似。5。下面是北方某城市12月份各天气温的记录数据:32-4711-1789-67-141815-96-10549368-12-161915-2225241921-8-6-15111219-252418172414221396015-4-93324-4
18、161756-5(1)指出上面的数据属于什么类型;(2)对上面的数据进行适当的分组;(3)绘制直方图,说明该城市气温分布的特点。解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据.(2)分组如下: 由于全部数据中,最大的为9,最小的为25,知数据全距为9(25)=34; 为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或Excel排序法,见Ex
19、cel练习题2。5)统计各组内数据的个数天数,并填入表内,得到频数分布表如下表;北方某城市12月份各天气温分组天数(天)2520820158-15101010514-50140545107合计(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2。5)6.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄181921212224252930343539404445591。934.734。117。26.42.71.81.2(1)对这个年龄分布作直方图;(2)从直
20、方图分析成人自学考试人员年龄分布的特点.解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导柱形图选择子图表类型完成.即得到如下的直方图:(见Excel练习题2。6)(2)年龄分布的特点:自学考试人员年龄的分布为右偏。7。下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373737474747575757575767677777778787980808285858686909292929396B班:35394044444851525254555656575757585960616162636466686870
21、70717173747479818283838485909191949596100100100(1)将两个班的考试成绩用一个公共的茎制成茎叶图;(2)比较两个班考试成绩分布的特点。解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:A班树茎B班数据个数树 叶树叶数据个数03592144044842975122456677789121197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比较可知:A班考试成绩的分布比较集中,且平均
22、分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征.月份北京长春南京郑州武汉广州成都昆明兰州西安149707657777279655167241687157758083654167347507768818081584974450397267758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104
23、759755372807876456511665982777872787153731256578265827582715272资料来源:中国统计年鉴1998,中国统计出版社1998,第10页。解:箱线图如下:(特征请读者自己分析)9。某百货公司6月份各天的销售额数据如下(单位:万元):257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差. 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9) =274。1(万元)或点选单元格后,点击“自动求和“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274。1.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1