统计学复习题整理仅供参考Word文件下载.docx
《统计学复习题整理仅供参考Word文件下载.docx》由会员分享,可在线阅读,更多相关《统计学复习题整理仅供参考Word文件下载.docx(17页珍藏版)》请在冰豆网上搜索。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
6、相关系数:
两变量之间存在的相互关系就是相关关系,这种相关关系定量的度量,就是相关系数。
7、拒绝域:
它是指概率分布中这样一个区域(横轴上):
当统计推断时,所计算的统计量落入这个区域之内就会导致零假设的拒绝,所以这个区域称为零假设的拒绝域。
8、接受域:
9、临界值:
(XX:
在正常值与异常值之间的值称为临界值)
10、样本:
在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。
11、标准差:
为方差的平方根值,有一表示资料的变异度,其单位与观察值的单位相同。
12、抽样分布:
统计量的概率分布称为抽样分布。
13、自由度:
指资料中能自由变动的观测值个数。
14:
总体:
指研究对象的全体,由具有共同性质的个体组成。
15、参数:
从总体中计算所得的用以描述总体特征的数值,称为参数。
16、统计量:
从样本中计算所得的数值称为统计量。
17:
、单尾检验:
选择备择假设HA:
μ>μ0或HA:
μ<μ0,都是一方情况被排除后对另一方情况是否存在所作的推断进行的显著性测验称为单尾检验
18、双尾检验:
μ≠μ0是两种可能均存在,用以推断两均数是否相等的显著性测验称为双尾检验
19、Ⅰ型错误:
如果假设是正确的,却错误地拒绝了它,统计上称为Ⅰ型错误。
20、Ⅱ型错误:
如果假设是错误的,却错误地接受了它,统计上称为Ⅱ型错误。
21、决定系数:
指由X引起的Y的平方和U所占Y变数总平方和SSy的比率(或由Y引起的X的平方和U’所占X变数总平方和SSx的比率),决定系数是相关系数的平方。
二、填空(5题共10分)
1.变量之间的相关关系主要有两大类:
(因果关系),(平行关系)
2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数)、(调和平均数)
3.样本标准差的计算公式(
)
4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生)
5.在标准正态分布中,P(-1≤u≤1)=(0.6827)(其他两个为0.9545、0.9973)
(已知随机变量1的临界值为0.1587)
6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(自变量),Y称为(依变量)
1、显著性检验又称假设检验,是统计学的核心内容。
2、随机实验的每一个可能的结果称为变数。
3、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是0.05
和0.01
4、当随机变量的正态分布的µ
=0,Ϭ=1时,正态分布就转化成标准正态分布。
5、数据资料按其性质不同各分为计数资料和计量资料两种。
6、小概率事件原理判定的基础是原假设。
7、试验设计的三大基本原则是设置重复、随机化和局部控制。
三、选择(5题共10分)
1、下列数值属于参数的是:
A
A、总体平均数B、自变量C、依变量D、样本平均数
2、下面一组数据中属于计量资料的是D
A、产品合格数B、抽样的样品数C、病人的治愈数D、产品的合格率
3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是C
A、12B、10C、8D、2
4、变异系数是衡量样本资料A程度的一个统计量。
A、变异B、同一C、集中D、分布
5、方差分析适合于,A数据资料的均数假设检验。
A、两组以上B、两组C、一组D、任何
6、在t检验时,如果t=t0、01,此差异是:
B
A、显著水平B、极显著水平C、无显著差异D、没法判断
7、生物统计中t检验常用来检验A
A、两均数差异比较B、两个数差异比较C、两总体差异比较D、多组数据差异比较
8、平均数是反映数据资料B性的代表值。
A、变异性B、集中性C、差异性D、独立性
9、在假设检验中,是以C为前提。
A、肯定假设B、备择假设C、原假设D、有效假设
10、抽取样本的基本首要原则是B
A、统一性原则B、随机性原则C、完全性原则D、重复性原则
11、统计学研究的事件属于D事件。
A、不可能事件B、必然事件C、小概率事件D、随机事件
12、下列属于大样本的是A
A、40B、30C、20D、10
13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是D
A、0.11B、8.64C、2.88D、0.32
14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是B。
A、正比关系B、反比关系C、加减关系D、没有关系
15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是B
A、18B、12C、10D、5
16、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是A
A、9、1和8B、1、8和9C、8、1和9D、9、8和1
17、观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为D
A、偶然误差B、系统误差C、疏失误差D、统计误差
18、下列那种措施是减少统计误差的主要方法。
B
A、提高准确度B、提高精确度C、减少样本容量D、增加样本容量
19、相关系数显著性检验常用的方法是C
A、t-检验和u-检验B、t-检验和X2-检验C、t-检验和F检验D、F检验和X2-检验
20、判断整体中计数资料多种情况差异是否显著的统计方法是B
A、t-检验B、F-检验C、X2-检验D、u-检验
4、在均数假设检验中,当样本的个数大于30时,通常选择B检验。
A、t-检验B、u-检验C、F-检验D、都可以
6、百分数检验中,只有np和nq都大于D时,可用u或t检验。
A、30B、20C、10D、5
14、多重比较是对各个处理间的差异显著性检验的一种方法,它是对各处理的D间进行多重比较。
A、统计数B、变数C、F值D、平均数
15、在X2检验中,当自由度为A时,需要对在X2检验的连续性进行矫正。
A、1B、2C、3D、4
16、已回归方程的决定系是0.81,那么此回归方程的相关系数是B。
A、0.6561B、0.9C、0.59D、0.81
17、下列数值属于参数的是:
19、抽取样本的基本首要原则是B
20、一组成组数据资料,每组具有10个观察值。
该配对资料的自由度是D
A、20B、19C、18D、9
四、计算(2题共40分)
(着重看置信区间、回归)
五、简答(2题共20分)
1、算术均值特征
(1)、离均差总和等于零。
(2)、离均差平方和最小
2、标准差、标准误、(变异系数)的区别和联系
(1)联系:
以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数的“标准差”定名为均数的标准误,简称标准误。
(2)区别:
标准差表示个体值的散布情形,即某一变量变异程度的大小;
而标准误则说明样本均数的参差情况,即均数的抽样误差大小。
3、概率是怎么样的,与频率有什么联系
概率是随机事件发生可能性大小的数值度量,古典定义为在随机试验中,如果基本事件的总和n为有限多个,且每个基本事件的发生是等可能的,事件A由其中m个基本事件所组成,则事件A的概率为P(A)=A中包含的基本事件数/基本事件总数=m/n。
联系:
⑴事件的频率与概率是度量事件出现可能性大小的两个统计特征数;
⑵当试验次数无限增大时,事件发生的频率会逐渐稳定于概率附近,概率的值可能是频率的某个具体值,也可能不是频率的具体的某个值;
⑶频率具有稳定性,概率具有确定性。
4、二项分布和泊松分布间的特征和联系(区别和联系)
二项分布特征:
均值为np,方差为npq,取值范围为0—n,两个参数
泊松分布特征:
均值=方差,即μ=σ=,
(1)区别:
二项分布的形状由n和p来决定,它由一族;
泊松分布只决定于它的总体均值μ,它也有一族。
②当n增大时,无论p的大小,二项分布都趋于对称;
随着μ的增大,泊松分布逐渐趋于对称。
③二项分布的参数为:
μ=np,σ2=npq;
泊松分布的参数为:
μ=σ2。
(2)联系:
1泊松分布是二项分布的特例,是特殊的二项分布;
除了泊松分布特有的条件外,其它的条件与普通的二项分布相同。
分布都为单峰。
5、一般正态分布的特点。
曲线为一个单峰钟形曲线,关于x=μ称轴
曲线在x=μ处达到最高点,然后往左右两个方向下降,无限逼近x轴
③曲线在x=μ+-σ处各有一个拐点
曲线以参数μ和σ2的不同表现为一系列曲线。
μ决定曲线在x轴的位置,而σ2决定分布的曲线的形状;
σ2越小,曲线越陡,σ2越大,曲线越平坦
6、统计假设的基本步骤
(1)、提出测验的假设和标准
(2)、选择测验方法和计算统计量
(3)、确定概率P值和做出统计推断
7、方差分析的基本思想
答:
ANOVA的基本思想是ANOVA法不变的灵魂。
其基本思想可概括为:
按照变异原因将试验资料的总变异和总自由度剖分为各个原因变异组分。
总变异基本上可剖分为两大块:
一块是处理因素的变异组分,另一是误差因素的变异组分。
然后将处理变异组分同误差变异组分相比较,即可做出统计推断。
8、统计推断为什么不能避免犯错误?
因为统计推断是建立在概率论的基础之上的,统计推断过程实际上就是运用小概率原理的过程,所以统计结论具有概率性而不具有完全的确定性。
也即是说一切统计推断都有可能犯错误。
9、适应性、独立性检验有何异同
相同:
不同:
其一,研究目的不同前者是研究实际次数与理论次数是否相符合,后者是研究两因素间是相互独立还是相互关联的问题;
其二,前者只按某一因素的属性类别归组,后者根据因素水平数的多少按行、列两向排成联列表;
其三,前者理论次数的计算是按已知的属性分配理论比例进行,后者在计算理论次数时无已知的理论比例,理论次数的计算是在因素相互独立的前提下推算出来的。
10、回归分析注意问题
①研究两个变量间是否存在相关关系,所建立的回归方程有无实际意义,必须结合相关专业知识及客观规律等
②利用回归方程估测时,变量的定义域相一致
③利用回归方程预测依变量时,自变量不能超出实际观察值范围,前后时间段内发生的情况的回归分析情况相似
④两变量间的一元回归分析,必须严格控制其他因素的干扰
⑤为提高精确度,变量观察值尽量多
11、实验设计的基本要点
①试验目的要明确;
②试验对象、试验条件要有代表性;
③试验条件要相对一致;
④试验结果要可靠;
⑤试验结果应具有重演性