华南理工 网络 统计学原理Word文件下载.docx
《华南理工 网络 统计学原理Word文件下载.docx》由会员分享,可在线阅读,更多相关《华南理工 网络 统计学原理Word文件下载.docx(23页珍藏版)》请在冰豆网上搜索。
12.12.考试成绩用“百分制”度量,这是按定比尺度划分的。
13.13.将全部人口分为男女两部分,男性所占比重就是比率相对数。
14.14.动态数列就是将某同时期的各指标数值按照组别进行排序得到的数列。
15.15.“企业数”、“年龄”都是离散变量。
16.16.“性别”、“产品等级”属于数量变量。
17.17.数据的加工处理方法、数据分布特征的概括与分析方法等属于描述统计学的内容。
18.18.人的身高、体重、机器设备台数等都是连续变量。
19.19.离散变量的变量值只能按整数计算,不可能有小数。
第二章统计数据的搜集与整理
1.1.统计数据的直接来源主要有专门组织的调查和科学试验两个渠道。
2.2.由《中国统计年鉴》获得的数据属于直接的统计数据。
3.3.普查具有调查费用低、时效性高、适应面广、准确性高等特点。
4.4.普查一般要规定统一的标准调查时间,以避免调查数据的重复或遗漏。
5.5.普查是为某一特定目的而专门组织的经常性的全面调查,普查能够获得各个领域的全面、广泛的数据。
6.6.为消除组距不同对频数分布的影响,需要计算频数密度。
频数密度才能准确反映频数分布的实际情况。
7.7.由于组距不同,频数密度不能准确反映频数分布的实际情况。
8.8.等距分组由于各组的组距相等,各组频数的分布不受组距大小的影响。
9.9.等距分组各组频数的分布受组距大小的影响。
10.10.使用组中值作为该组数据的代表值时,必须假定各组数据在本组内呈均匀分布或者在组距中值两侧呈对称分布。
11.11.只有在组距中值两侧呈对称分布,才能使用组中值作为该组数据的代表值。
12.12.邮寄调查是一种标准化调查。
13.13.调查对象和调查单位解决的是“向谁调查,由谁提供所需数据得问题”。
14.14.从变量值小的一方向变量值大的一方累加频数,称为向上累积。
15.15.电话调查具有时效快、费用低的特点,问题数量适宜较多。
16.16.品质数据得汇总方法与数量数据得汇总方法完全相同。
17.17.调查单位是根据调查目的确定的调查研究的总体。
18.18.调查对象是构成调查对象中的每一个单位,它是调查项目和指标的承担者或载体,是搜集数据、分析数据的基本单位。
第三章数据分布特征的描述
1.1.测算数据分布集中趋势特征的方法主要有众数法、中位数法和均值法。
2.2.测算数据分布离散程度特征的方法主要有全距法、标准差法和标准差系数法。
3.3.如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在。
4.4.不论数据的分布是否有明显的集中趋势或最高峰点,众数都存在。
5.如果数据的分布有多个最高峰点,就可能存在多个众数。
5.6.即使数据的分布有多个最高峰点,只能存在一个众数。
6.7.中位数是一组数据按大小排序后,处于正中间位置上的变量值。
7.8.与全距相比,四分位差不受极端值的影响。
8.9.当均值大于众数时称为正偏态。
9.10.当均值小于众数时称为负偏态。
10.11.几何平均数是适用于特殊数据的一种平均数,它主要用于计算比率或速度的平均。
11.12.协方差大于零时,两个变量之间为正相关关系。
12.13.协方差小于零时,两个变量之间为负相关关系。
13.14.协方差等于零时,两个变量之间为完全不相关关系。
14.15.协方差的大小会受到计量单位和数据均值水平的影响。
15.16.偏态分布的离散程度低于正态分布的离散程度。
16.17.两种变量之间是否存在相关关系,只能通过计算相关系数来测量,不能通过计算协方差来测量
17.18.正态分布条件下,偏度系数大于0.
18.19.变异系数可以排除计量单位大小的影响,但不能排除均值水平大小的影响。
19.20.变异系数可以排除均值水平大小的影响,但不能排除计量单位大小的影响。
20.21.相关系数的大小会受到计量单位和数据的均值水平的影响。
21.22.反映离中趋势的指标中,全距最重要。
第四章概率与概率分布
1.1.时间和指标数据是构成时间序列的两个基本因素。
2.2.发展水平的指标形式可以是绝对数,也可以是相对数或平均数。
3.3.绝对数有时期数和时点数,两者的区别主要在于是否具有可加性。
4.4.绝对数有时期数和时点数,两者的共同点是都具有可加性。
5.5.工资总额、利润总额等都是时期数指标。
6.6.产品库存量、期末人口数等都是时点数指标。
7.7.计算平均发展速度时,几何平均法的应用条件是要求现象呈均匀变动。
8.8.计算平均发展速度时,累计法适合计算波动较大的现象的平均发展速度。
9.9.分析长期趋势时,当现象发展呈周期性规律时,移动平均的时间长度应与现象的周期长度相同。
10.10.时间序列属于横截面数列。
11.11.先对比后平均是计算相对数序时平均的基本方法。
12.12.采用几何平均法计算平均发展速度时,平均发展速度最终是由最初水平和最末水平决定的。
13.13.采用移动平均法分析长期趋势时,一般情况下,移动的时间越短,所得趋势性越明显。
14.14.移动平均法的缺点之一是容易受现象复杂性影响。
15.15.移动平均法可以很好地进行长期趋势的预测。
16.16.月平均法计算季节指数时,近期的季节指数在整个指数中的影响小,远期的季节指数在整个指数中的影响大。
17.17.序时平均数又称为动态平均数,它反映现象在一定时期内发展水平达到的一般水平。
18.18.随手画法、移动平均法都是测定长期趋势的分析方法,最小平方法不是测定长期趋势的分析方法。
第五章抽样与抽样估计
1.1.统计指数作为一种对比性的统计指标具有相对数的形式,通常表现为百分数。
2.2.总指数与个体指数的区别不仅在于考察范围不同,还在于考察方法不同。
3.3.物价指数、股价指数属于质量指标指数。
4.4.销售量指数、生产指数属于数量指标指数。
5.5.拉氏指数与帕氏指数具有完全相同的经济分析意义。
6.拉氏指数优于帕氏指数。
6.7.在编制综合评价指数的实践中,目前比较成熟、可行的方法主要有两种,即“标准比值法”和“功效系数法”。
7.8.总值指数的考察范围与总指数一致。
9.总值指数的计算方法和分析性质则与个体指数相同。
8.10.功效系数法使用满意值和不允许值来确定个体指标的功效系数。
9.11.全部商品销售额指数属于数量指标指数。
10.12.全部商品销售额指数属于质量指标指数。
11.13.编制总指数时,先对比、后平均的方式通常称为“综合指数法”。
12.14.编制总指数时,先综合、后对比的方式通常称为“平均指数法”。
13.15.在计算物价指数的公式中,指数化指标是销售量。
14.16.在计算物价指数的公式中,指数化指标是销售额。
15.17.在编制综合评价指数的实践中,目前比较成熟、可行的方法主要有“”标准比值法、“参数指标法”。
16.18.标准比值法和功效系数法的区别,主要表现为对比标准的确定方式不同。
17.19.不同商品的价格或销售量都是“不同度量”的现象,它们构成了不能直接加总的“复杂现象总体”。
18.20.产品的成本总额属于总值指数。
19.21.简易计分法的优点是客观性强。
第六章假设检验
1.1.正态分布曲线是连续型概率分布曲线。
2.2.二项分布曲线是离散型概率分布曲线。
3.3.二项分布和泊松分布属于离散型随机变量分布。
4.4.概率分布反映变量取值与其发生的概率之间的关系。
5.5.概率分布的特点是:
变量取值的精确度越高,相应的概率越小。
6.6.概率分布的特点是:
变量取值的误差越大,相应的概率越小。
7.7.二项分布主要描述只有两种结果可能出现的事件的分布。
8.8.当n充分大时,二项分布近似于正态分布。
9.9.泊松分布在取值范围上可以取整数,也可以取小数。
10.10.当n充分大时,泊松分布近似于正态分布。
11.11.概率分布所描述的是样本特征值的分布。
12.12.直方图所描述的是总体特征值的分布
13.13.对称性是泊松分布的特点之一。
14.14.人的身高、测量误差等都服从泊松分布。
15.15.正态分布具有在均值的概率最大的特点。
第七章相关与回归分析
1.1.抽样调查中,把抽样数目大于50的样本称为大样本。
2.2.抽样调查中,把抽样数目小于50的样本称为小样本。
3.3.抽样误差是指点估计值与总体参数之差的绝对值。
4.4.大样本比小样本趋于推出更好的点估计。
5.5.与不重复抽样相比,重复抽样的抽样误差比较小
6.。
6.在样本容量为一定时,要提高抽样的概率保证程度就要扩大抽样的误差范围。
7.7.在样本容量为一定时,要提高抽样的精确度,就要降低抽样的概率保证程度。
8.8.通过扩大样本容量,可以提高抽样的精确度,但不能提高抽样的概率保证程度。
9.9.当样本容量充分大时,无论总体分布形式如何,样本均值近似服从正态分布。
10.大样本情况下,当总体方查未知时,不可以用样本方差代替。
10.11.与简单随机抽样相比,分层抽样的效果更好。
11.12.等距抽样最显著的优越性是能提高样本单位分布的均匀性,样本代表性强。
12.13.如果随机样本中每个样本点以相等的概率被抽出,则称为简单随机样本。
13.14.与无放回抽样相比,放回抽样更为常用。
14.15.简单随机样本无须满足各个个体的选择是独立的条件。
15.16.抽样平均误差的变化与样本容量无关。
16.17.抽样平均误差的减少与样本均值更加集中有关。
17.18.整群抽样的抽样误差取决于群体内部差异程度,而不受群间差异程度的大小影响。
18.19.在整群抽样过程中,划分群体的原则是:
群间差异尽可能大,各群体内的总体单位之间的差异尽可能小。
19.简单随机抽样的估计效率比较高,适宜大规模的抽样调查。
第八章时间数列
1.1.显著性水平表示原假设为真时拒绝原假设的概率,即拒绝原假设所冒的风险。
2.2.显著性水平表示备择假设为真时拒绝原假设的概率,即拒绝原假设所冒的风险。
3.3.犯第二类错误的概率实质上就是显著性水平。
4.4.假设检验时,所谓“接受原假设”,并非肯定原假设就是正确的。
5.5.如果检验统计量的值落在拒绝区域,应拒绝备择假设。
6.6.假设检验时,犯第二类错误的概率与临界值有关。
7.7.在样本容量不变的情况下,犯第一类错误和犯第二类错误的概率是互为消长的。
8.8.区间估计中的置信区间对应于假设检验中的接受区域。
9.9.在不同的检验水平下,对同一检验问题所下的结论可能完全相反。
10.10.通常把“拒绝原假设的最小显著性水平”称为假设检验的P值。
11.11.假设检验的反证法是严格的逻辑证明。
12.12.提出原假设和备则假设时,一般把没有充分理由不能轻易否定得命题作为备则假设。
第九章统计指数
1.最小平方法是通过使残差平方和最小来估计回归系数的。
2.如果两种相关现象之间表现为某种曲线方程的关系,则这种相关关系为线形相关。
3.在某一种现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量的相关关系称为复相关。
4.可决系数是对回归模型拟和程度的综合度量,可决系数越大,模型拟和程度越好。
5.可决系数是对回归模型拟和程度的综合度量,可决系数越小,模型拟和程度越差。
6.利用相关分析可以判断现象之间的因果关系。
7.回归系数的最小二乘估计是最优线形无偏估计量。
8.用最小二乘法估计的总体回归系数估计值是一个随机变量。
9.相关分析可以指出变量间相互关系的具体形式,也可以从一个变量的变化来推测另一个变量的变化情况。
10.回归分析不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。
11.相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。
12.只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
13.总体回归线是已知的,而样本回归线是未知的。
14.理论意义检验是利用统计学中的抽样理论来检验样本回归方程中的可靠性。
15.在实际的回归模型中,未来时期总体回归系数发生变化而造成的误差是发生预测误差的原因之一。