1、贾俊平统计学第六版试探题答案第一章:1、什么是统计学?统计学是一门搜集、分析、表述、说明数据的科学和艺术。2、描述统计:研究的是数据搜集、汇总、处置、图表描述、归纳与分析等统计方式。推断统计:研究的是如何利用样本数据来推断整体特点。3、统计学据能够分成哪几种类型,个有什么特点?依照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观看值,结果表现为数值。按搜集方式不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而搜集到的数据;不操纵条件; 社会经济领域 实验
2、数据:在实验中搜集到的数据;操纵条件;自然科学领域。按时刻不同,分为:截面数据、时刻序列数据 截面数据:在相同或近似相同的时刻点上搜集的数据。 时刻序列数据:在不同时刻搜集的数据。4、举例说明整体、样本、参数、统计量、变量这几个概念。整体:是包括全数研究个体的集合,包括有限整体和无穷整体(范围、数量判定)样本:从整体中抽取的一部份元素的集合。参数:用来描述整体特点的归纳性数字气宇。(平均数、标准差、比例等)统计量:用来描述样本特点的归纳性数字气宇。(平均数、标准差、比例等)变量:是说明样本某种特点的概念,其特点:从一次观看到下一次观看结果会呈现出差别或转变。(商品销售额、受教育程度、产品质量品
3、级等)(对一千灯泡进行寿命测试,那么这千个灯泡确实是整体,从中抽取一百个进行检测,这一百个灯泡的集合确实是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特点的数值确实是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特点的数值确实是统计量,变量确实是说明现象某种特点的概念,比如说灯泡的寿命。)5、变量能够分为哪几类?分类变量:说明事物类别;取值是分类数据。顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特点;取值是数值型数据。变量也能够分为:随机变量和非随机变量;体会变量和理论变量6、举例说明离散型变量和持续型变量。离散型变量:只能取有限个、可数值的变量。(
4、企业个数、产品数量)持续型变量:能够在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。市场调查、人口普查等。8、请举出应用统计学的几个领域。社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。第二章:1、什么是二手资料?利用二手资料需要注意些什么?什么是二手资料:已经存在的;跟研究内容有关的;他人所做的调查或研究;会被咱们利用的,资料。注意:需要进行评估:考虑原始数据搜集人、搜集目的、搜集途径、搜集时刻及数据来源。2、比较概率抽样和非概率抽样的特点。举例说明什么情形下适合采纳概率抽样,什么情形下适合采纳非概率抽样。概率抽样:以必然的入样
5、概率,依照必然的随机性原那么选取样本(即样本被选中的概率已知或可计算);技术含量高、本钱高。 用于描述性、说明性、推断性研究;研究目的在于把握对象整体的数字特点,取得整体参数的置信区间。非概率抽样:不依照入样概率和随机性原那么,而依照方便、滚雪球或配额等抽样形式选取样本;技术含量低、本钱低、时效快、操作简便。 用于探讨性研究;研究目的在于发觉问题,为更深切的数量分析提供预备。下面题目(略)除自填式,面访式和式还有什么搜集数据的方法实验式和观看式等自填式,面访式和式各自的优势和弱点自填式;优势:1调查组织者治理容易2本钱低,可进行大规模调查3对被调查者,可选择方便时刻答卷,减少回答灵敏问题压力。
6、缺点:1返回率低2不适合结构复杂的问卷,调查内容有限3调查周期长4在数据搜集进程中遇见问题不能及时调整。面访式;优势:1回答率高2数据质量高3在调查进程中遇见问题能够及时调整。缺点:1本钱比较高2搜集数据的方式对调查进程的质量操纵有必然难度3关于灵敏问题,被访者会有压力。式;优势:1速度快2对调查员比较平安3对访问进程的操纵比较容易。缺点:1实施地域有限2调查时刻不能太长3利用的问卷要简单4被访者不肯回答时,不易劝服。如何操纵调查中的回答误差关于明白得误差,学习必然的心理学知识,经历误差,缩短所涉及的时刻范围,成心识误差,做好被调查者的心理工作,要遵守职业道德,为被调查者保密,尽可能在问卷中不
7、涉及灵敏问题。怎么减少无回答关于随机误差,要提高样本容量,关于系统误差,只有做好预备工作并做好补救方法。比如说要一百份的问卷答复,就要做好一百二十到一百三十的问卷预备,进行面访式的时候要尽可能的劝服不肯意回答的被访者,以小物品的馈赠提高答复率。第三章:1、数据的预处置包括哪些内容?数据从完整性和准确性方面调查原始数据(完整性:单位、个体是不是遗漏;准确性:检查错误、异样值)数据挑选:依照需要找出符合特定条件的某类数据。数据排序:按必然顺序将数据排列,表现数据特点或趋势。2、分类数据和顺序数据的整理和图示方式各有哪些?分类数据:整理:制作频数散布表,用比例、百分比、比率进行描述性分析。 图示:条
8、形图、帕累托图、饼图。顺序数据:整理:制作频数散布表,用比例、百分比、比率进行描述性分析。 图示:积存频数、累计频率散布图、环形图、条形图、帕累托图、饼图。3、数值型数据的分组方式有哪些?简述组距分组的步骤。分组方式:单变量分组:把每一个变量值做为一组(只适合离散型变量,变量值较少) 组距分组:将全数变量值依次划分为假设干区间,一个区间变量值做为一组。 (组距分组又分为:等距分组、异距分组)分组步骤:确信组数(5,15);确信各组组距(5倍数;组距最大变量值-最小变量值);依照分组整理成频数散布表。4、直方图与条形图有何区别?1、条形图用于展现分类数据;直方图用于展现数值型数据。2、条形图用长
9、度表示个类别频数,宽度固定(无心义);直方图用面积表示各组频数,长度表每组频数(或频率),宽度为组距(成心义)。3、条形图各矩形分开排列,直方图各矩形持续排列。(分组数据具有持续性)5、绘制线图应注意哪些问题?时刻在横轴,观测值在纵轴;横轴纵轴长度比例可能为10:7;纵轴下端一样从0开始,数据与0距离过大的话用折断符。6、饼图与环形图有什么不同?饼图:只能绘制一个样本或整体各部份的比例。条形图:能够同时绘制多个样本或整体各部份的比例。中间有一空洞,每一个样本或整体数据表现为一个环。7、茎叶图与直方图相较有什么优势?他们的应用处合是什么?茎叶图在给出数据散布情形的同时,又能给出每一个原始数据(保
10、留了原始数据的信息);直方图用于大量量数据,茎叶图用于小批量数据。八、辨别图标好坏的准那么有哪些?显示数据、强调数据间的比较、有对图形的统计描述和文字描述、幸免歪曲、把读者注意力集中于数据内容上、效劳于一个明确的目的。8、制作统计表应注意哪几个问题?合理安排统计表结构;表头一样包括表号,总题目和表中数据的单位等内容;表中的上下两条横线一样用粗线,中间的其他用细线;在利用统计表时,必要时可在下方加注释,注明数据来源。公式:组中值=(上限+下限)/2第四章:1、一组数据的散布特点能够从哪进几个方面进行测度?能够从以下三方面进行测度:集中趋势:反映个数据向其中心值的靠拢或集中程度;离散程度:反映各数
11、据远离其中心值的趋势;散布形状:数据散布的峰态和偏态;2、如何明白得平均数在统计学中的地位?平均数在统计学中具有重腹地位:是集中趋势的最要紧测度,是一组数据的重心所在;是数据误差彼此抵消的结果,利用了全数数据信息,具有无偏性;只适用于数值型数据,不适用于分类或顺序数据。3、简述四分位数的计算方式:四分位数是一组数据排序后处于25%和75%位置上的值。具体计算方式是:n/4;3n/44、关于比例数据的平均什么缘故采纳几何平均?关于比例数据采纳几何平均比采纳算数平均更合理。5、简述众数、中位数和平均数的特点和应用处合。众数:要紧用于分类数据集中趋势的气宇;是一组数据的峰值; 优势:不受极值的阻碍。
12、 缺点:具有不唯一性;只有数据量较大时才有成效中位数:要紧用于顺序数据集中趋势的气宇;是一组数据中间位置的代表制; 优势:不受极值的阻碍;数据散布偏斜程度较大时是一个不错的选择。平均数:要紧用于数值型数据集中趋势的气宇;是一组数据的重心所在。 优势:利用了所有数据信息;数据误差彼此抵消,具有无偏性; 缺点:易受极值阻碍;当数据散布偏斜程度较大时期表性差。6、简述异众比率、四分位差、方差或标准差的应用处合。异众比率:分类数据的离散程度测度;四分位差:顺序数据的离散程度测度;方差:数值型数据的离散程度测度7、标准分数有哪些用途?标准分数:Xi-/s 即:(变量值减去其平均数)/标准差标准分数给出了
13、一组数据中各数据的相对位置(其离平均数的距离用标准差衡量)用途:在对多个具有不同量纲的变量进行处置时,需要对变量进行标准化处置; 检查一组数据中是不是有离群值。8、什么缘故要计算离散系数?离散系数=标准差/平均数缘故:方差和标准差反映的是数据离散程度的绝对值:一方面,受原变量值自身水平高低的阻碍(与变量平均数大小有关);另一方面,与原变量值得计量单位有关,计量单位不同,离散程度也不同。因此,为排除变量值水平高低和变量值单位对离散程度的阻碍,要计算离散系数。9、测度数据散布形状的统计量有哪些?峰态系数、偏态系数。第六章:1、什么是统计量?什么缘故要引进统计量?统计量什么缘故不含任何未知参数?概念
14、:设(X1,X2Xn)是从整体X中抽取的容量为n的样本,若是由此构造一个函数T(X1,X2Xn),不依托于任何未知参数,那么称函数T(X1,X2Xn)是一个统计量。什么缘故:为了使统计推断成为可能。2、什么是顺序统计量?设(X1,X2Xn)是从整体X中抽取的容量为n的样本,假设样本(X1,X2Xn)是知足如下条件的函数:每当样本取得一个观测值x1,x1xn时,其由小到大的排序中,第i个值x(i)就作为顺序统计量Xi的观测值,而X(1),X(2)X(n)就称为顺序统计量。3、什么是充分统计量?统计加工进程中一点信息都不损失的统计量称为充分统计量。4、什么是自由度?独立变量的个数。5、简述三个重要
15、散布及正态散布间的关系。卡方散布:设X1,X2,Xn是n个彼此独立的随机变量,且XiN(0,1),那么X=X12+Xn2为服从以n为自由度的卡方散布。F散布:设XX2(m),Y2X2(n),且X,Y彼此独立,记Z=X/m/Y/n,那么ZF(m,n)Z散布:设XN(0,1),YX2(n),且X,Y彼此独立,记T=X/(Y/n)(1/2),有Tt(n)6、什么是抽样散布?样本统计量(随机变量)的概率散布是一种理论概率散布。7、简述中心极限定理的意义。中心极限定理:设从均值为,方差为o2的任意任意整体中抽取样本量为n的样本,当n充分大时,样本均值X的抽样散布近似服从均值为,方差为o2/n的正态散布。
16、第七章:1、说明估量量与估量值。估量量:用于估量整体参数的随机变量。估量值:估量整体参数时计算出来的估量量的具体值。2、简述评判估量量好坏的标准。无偏性:估量量抽样散布的数学期望=整体参数有效性:对同一参数的两个无偏点估量量,拥有更小标准差的估量量更有效。一致性:随着样本容量的增大,估量量的值愈来愈接近整体参数。3、如何明白得置信区间?由样本统计量所构造的整体参数的估量区间。4、说明95%的置信区间。95%的置信区间值通过某种方式构造的估量区间中,有95%的区间包括整体参数的真值。5、Za/2是标准正态散布上侧面积为a/2的z值,公式是统计整体均值时的边际误差。6、说明独立样本和匹配样本的含义
17、。独立样本:两个样本是从两个整体中独立抽取的,即一个样本中的元素与另一个样本中的元素彼此独立。(想工人)匹配样本:一个样本中的数据与另一个样本中的数据彼此对应。7、简述样本量与置信水平、整体方差、估量误差的关系。样本量越大,置信水平越高,整体方差和估量误差越小。第八章:1、假设查验和参数估量有什么相同点和不同点?相同点:是统计推断的两部份;都运用样本对整体进行推断。不同点:推断角度不同。参数估量:用样本统计量估量整体参数,整体参数估量前未知。 假设查验:对整体参数提出假设,用样本信息验证假设成立否。2、什么是假设查验中的显著性水平?统计显著是什么意思?显著性水平:原假设正确时却被拒绝的概率或风
18、险。统计显著:指拒绝原假设,即求出的值落在小概率区间上(拒绝域内)3、什么是假设查验中的两类错误?错误(弃真错误):原假设为真,却被咱们拒绝了。错误(取伪错误):原假设为假,却被咱们同意了。4、两类错误之间存在什么样的数量关系?在样本量必然的情形下,二者是此消彼长的关系。5、说明假设查验中的P值。当原假设为真时所取得的样本观看值或更极端值显现的概率。(它的大小取决于三个因素,一个是样本数据与原假设之间的不同,一个是样本量,再一个是被假设参数的整体散布。)6、显著性水平与P值有何区别?显著性水平:原假设为真时拒绝原假设的概率,即拒绝域,大小由研究者自己决定。P值:原假设为真时所得的样本观看结果或
19、更极端值显现的概率,是实测的显著性水平。7、假设查验依据的大体原理是什么?假设查验基于小概率原理:即小概率事件在一次实验中是几乎不可能发生的,而一旦发生,咱们就有理由拒绝原假设。8、在单侧查验中,原假设和备择假设的方向应该如何确信?将想搜集证据予以支持的假设作为备择假设;将想搜集证据予以否定的假设作为原假设,同时原假设应基于普遍的社会体会基础。备择假设的方向与想要证明的正确性的方向一致。备择假设和原假设互斥,且等号总在原假设上。 1、什么是方差分析?它研究的是什么?方差分析:通过验证个整体的均值是不是相等来判定分类型自变量对数值型因变量是不是有显著阻碍。研究内容:研究的是分类型自变量和数值型因
20、变量之间的关系(有无阻碍)。2、要查验多个整体均值是不是相等时,什么缘故不作两两比较,而用方差分析方式?提高查验效率:两两查验太过繁琐。增加分析靠得住性,排除错误累计概率,减少查验误差。(多次查验会增加犯错误的概率)3、方差分析包括哪些类型?他们有何区别?单因素方差分析和双因素方差分析。区别:单因素方差分析:一个分类型自变量对一个数值型因变量的阻碍;双因素方差分析:涉及两个分类型自变量。4、方差分析中有哪些大体假定?正态整体;方差齐性;观测值独立5、简述方差分析的大体思想。方差分析是通过对误差来源的分析判别不同整体均值是不是相等,进而分析自变量对因变量的阻碍。6、说明因子和处置的含义。因子:也
21、称因素,是查验对象;处置:也称水平,是因素的不同表现。7、说明组内误差和组间误差的含义。组内误差(SSE)是指每一个水平或组的个样本数据与其组平均值误差的平方和,反映了每一个样本各观测值的离散状况;组间误差(SSA)是指各组平均值i与总平均值的误差平方和,反映各样本均值之间的不同程度。8、说明组内方差和组间方差的含义。组内方差指因素的同一水平(同一个整体)下样本数据的方差;组间方差指因素的不同水平(不同整体)下各样本之间的方差。9、简述方差分析的大体步骤。(1)提出假设(一样提法形式如下:H0:1=2=3=i=.k,自变量对因变量没有显著阻碍, H1:i (i=1,2,3.,k)不全相等,自变
22、量对因变量有显著阻碍)(2)构造查验统计量(包括:计算各样本的均值,计算全数观测值的总均值,计算各误差平方和,计算统计量)(3)统计决策。(将统计量的值F与给定的显著性水平 的临界值F 进行比较,作出对原假设H0的决策)(F=MSA/MSE)10、是什么是交互作用?交互作用是指几个因素搭配在一路会对因变量产生一种新的效应的作用。1一、方差分析中多重比较的作用是什么?通过对各整体均值之间的配对照较来进一步查验到底哪些均值之间存在不同。12、说明无交互作用和有交互作用的双因素方差分析。无交互作用双因素方差分析:两个分类型自变量关于因变量的阻碍是彼此独立的。有交互作用双因素方差分析:除行因素和列因素对实验数据的单独阻碍外,两个因素的搭配还会对结果产生一种新的阻碍13、说明R2的作用和含义。,即关系强度,也确实是自变量关于因变量不同的说明程度。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1