1、对于左偏分布,平均数、中位数和众数之间的关系是( )。某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是( )。社会工作一班男生的平均体重为55千克,社会工作二班男生的平均体重为52千克,两个班级男生体重的标准差均为5千克,那么( )。甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示:(1)
2、计算乙单位员工月收入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?在标准正态分布中,值越小,则( )。某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的考试分数服从正态分布,可以判断成绩在72-92之间的学生大约占全班学生的( )。一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)男生中有多少比重的人体重在55千克-65千克之间?(2)女生中有多少比重的人体重在40千克-60千克之间?备注:(1)=0.8413,(2)=0.9772随机现象总体与样本参数与统计量
3、抽样分布置信水平置信区间中心极限定理认为不论总体分布是否服从正态分布,从均值为、方差为2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为( )、方差为( )的正态分布。在假设检验中,不拒绝虚无假设意味着( )。为估计某地区每个家庭日均生活用水量为多少,抽取了450个家庭的简单随机样本,得到样本均值为200升,样本标准差为50升。(1)试用95%的置信水平,计算该地区家庭日均用水量的置信区间。(2)在所调查的450个家庭中,女性为户主的为180个。以95%的置信水平,计算女性为户主的家庭比例的置信区间。注:Z0.025=1.96下表是某高校大学生
4、对学校食堂情况的满意度调查的二维表,请将以下二维表转换成含百分比的二维表:对消费的回归分析中,学历、年龄、性别、收入都是自变量,其中收入的回归系数为2.8,这表明( )。回归平方和(SSR)反映了y的总变差中( )。在回归方程中,若回归系数等于0,这表明( )。某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差平方和SSE=450。(1)写出销售量y与广告费用x之间的线性回归方程。(2)假如明年计划投入广告费用为50万,根据回归方程估计明年汽车销售量。(3)计算判定系数R2,
5、并解释它的意义。简要说明卡方的拟合优度检验和独立性检验的含义。简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系。t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验。卡方检验主要用于对两个分类变量之间的相关性进行统计检验,判断变量之间是否存在显著关系。例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两独立样本t检验。如果我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显
6、著差异。下列哪种情况不适合用方差分析( )。从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为( )。某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表,请完成方差分析表。二、答案部分第一章题目1.分层抽样题目2.自变量的变化是以因变量的变化为前提题目3.样本题目4.系统抽样第三章题目1.5.5小时题目2.66.10%题目3.条形图的矩形通常是紧密排列的题目4.(1)在对数据进行分组时,如果各组组距相等,则称为等距分组。例如,分
7、析某班同学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分为70-75分,75-80分,80-85分,85-90分,90-95分,95-100分。(2)如果各组组距不相等,则称为不等距分组。例如,在分析人口时,往往将人口分为婴幼儿组(0-6岁),少年儿童组(7-17岁),中青年组(18-59岁),老年人组(60岁及以上),该分类中各组组距不相等,这就是不等距分组。第四章题目1.题目2.正确答案是:社会统计方法及SPSS软件的应用题目3.正确答案是:39题目4.正确答案是:第4题目5.Thecorrectanswersare:中位数平均数众数,众数中位数平均数题目6
8、.正确答案是:系统抽样第五章题目1.甲的离散程度小,稳定性水平高题目2.二班学生体重的离散程度大题目3.第六章题目1.离散趋势越小题目2.95%题目3.(1)P(55X65)=(6560)/5(5560)/5=(1)(-1)=(1)1(-1)=2(1)-1由题得,(1)=0.8413,所以2(1)1=0.6826,即68%的男生体重在55千克-65千克之间。(2)P(5565)=(6050)/5(4050)/5=(2)(-2)=(2)1(-2)=2(2)-1由题得,(2)=0.9772,所以2(2)1=0.9544,95%的女生体重在40千克-60千克之间。第七章题目1.随机现象就是在同一组条
9、件下,每次试验可能出现某一结果,也可能不出现,也就偶然现象。题目2.一般地,把所研究对象的全体元素组成的集合称为总体(或称母体),而把组成总体的每个元素成为称为个体。为了了解总体X的分布规律或某些特征,必须对总体进行抽样观察,即从总体中,随机抽取个个体,记为,并称此为来自总体的容量为的样本。题目3.参数(parameter)是研究者想要了解的总体的某种特征值。统计量(statistic)是根据样本数据计算出来的一个量。题目4.抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。题目5.置信水平(confidencelevel)就是将构
10、造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。题目6.置信区间(confidenceinterval)是在区间估计中,由样本统计量所构造的总体参数的估计区间,它有估计量加减抽样误差构成,我们将区间的最小值称为置信下限,区间的最大值称为置信上限。题目7.正确答案是:2/n题目8.正确答案是:没有证据证明虚无假设是错误的题目9.第八章第九章题目1.正确答案是:收入每增加1元,消费增加2.8元由于x与y之间的线性关系引起的y的变化部分自变量x对因变量y的影响是不显著的题目4.第十章题目1.(1)X2检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显著差异
11、时,称为拟合优度检验。例如,不同职业的人群中对某项改革措施的支持率是否一致。(2)X2检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关系,则称为独立,我们用X2判断它们之间是否关联,这时称为独立性检验。例如,对性行为的态度是否与受教育程度有关。第十一章题目1.X检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显著差异时,称为拟合优度检验。X检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关系,则称为独立,我们用扩判断它们之间是否关联,这时称为独立性检验。第十二章题目1.年龄对收入的影响题目2.432,71形考任务3 试题及答案
12、这种调查方法属于()。以下关于因变量与自变量的表述不正确的是( )。某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( )。以下关于条形图的表述,不正确的是( )某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是( )。下表是某
13、单位工作人员年龄分布表,该组数据的中位数出现在第()组。对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间( )。下列哪种情况不适合用方差分析(非概率抽样二维表卡方检验请举例说明简述相关系数的取值与意义简述什么是简单回归分析?其作用是什么(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?(1)=0.8413,(2)=0.9772为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下方差分析表:(1)计算上面方差
14、分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?题目1.系统抽样题目2.因变量是由于其他变量的变化而导致自身发生变化的变量题目3.线图题目4.条形图的矩形通常是紧密排列的题目5.数学题目6.甲的离散程度小,稳定性水平高题目7.第5组题目8.相关程度越小题目9.由于x与y之间的线性关系引起的y的变化部分题目10. 年龄对收入的影响题目11.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。题目12.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属
15、于两个变量的不同类的数据,也称为列联表题目13.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例题目14.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布题目15.(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。学历(3)定距变量:当变量值不仅可以将个体区分为不同类型并
16、进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。智商(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。收入题目16.相关系数的取值在-11之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关题目17.(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变
17、化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。题目18.题目19:形考任务4 试题及答案以下关于因变量与自变量的表述不正确的是(某班级学生平均每天上网时间可以分为以下六组:以下关于条形图的表述,不正确的是( )。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。在假设检验中,不拒绝虚无假设意味着(根
18、据一个样本均值求出的90%的置信区间表明(在回归方程中,若回归系数等于0,这表明(中心极限定理认为不论总体分布是否服从正态分布,从均值为、方差为2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为()、方差为()的正态分布。整群抽样Z值误差减少比例判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的(5)上月网购次数其作用是什么?如何对配对样本进行t检验。为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得
19、到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。题目1.自变量是引起其他变量变化的变量题目2.5.5小时题目4.第5组题目6.没有证据证明虚无假设是错误的题目7.总体均值有90%的概率会落入该区间内题目8.自变量x对因变量y的影响是不显著的题目9.,2/n题目10.年龄对收入的影响题目11.整群抽样:先将总体按照某种标志或
20、特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。题目12.Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X)/题目13.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。题目14.误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差()与总误差的比值称为误差减少比例,简称PRE。题目15.判断以下随机变量是
21、定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名:定性(2)每月的网络服务费:定量、连续变量(3)每月上网时间:(4)上网的目的:(5)上月网购次数:定量、离散变量题目16.(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。题目17.配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。题目18:A:960,B:7008,C:3,D:36,E:168,F:1.90
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1