1、抽样误差,非抽样误差。 统计数据的质量。1.4 统计中的几个基本概念总体和样本总体,样本。参数和统计量参数,统计量。变量变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。2. 描述统计:研究数据收集、处理和描述的统计学分支。3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。4. 分类数据:只能归于某一类别的非数字型数据。5. 顺序数据:只能归于某一有序类别的非数字型数据。6. 数值型数据:按数字尺度测量的观察值。7. 观测数据:通过调查或观测而收集到的数据。8. 实验数据:在实验中控制实验对
2、象而收集到的数据。9. 截面数据:在相同或近似相同的时间点上收集的数据。10. 时间序列数据:在不同时间上收集到的数据。11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。12. 普查:为特定目的而专门组织的全面调查。13. 总体:包含所研究的全部个体(数据)的集合。14. 样本:从总体中抽取的一部分元素的集合。15. 样本容量:也称样本量,是构成样本的元素数目。16. 参数:用来描述总体特征的概括性数字度量。17. 统计量:用来描述样本特征的概括性数字度量。18. 变量:说明现象某种特征的概念。19. 分类变量:说明事物类别的一个名称
3、。20. 顺序变量:说明事物有序类别的一个名称。21. 数值型变量:说明事物数字特征的一个名称。22. 离散型变量:只能取可数值的变量。23. 连续型变量:可以在一个或多个区间中取任何值的变量。四、习题答案1. D2. D3. A4. B5. A6. D7. C8. B9. A10. A11. C、12. C13. B14. A15. C16. D17. C18. A19. C20. D21. A22. C23. C24. B25. D26. C27. B28. D29. A30. D31. A32. B33. C34. A35. A36. A37. D38. B39. B40. C41. C
4、42. D43. C44. D45. A46. B47. C48. A49. C50. D51. A52. C53. D54. A55. B第2章 数据的图表展示数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。2.1 数据的预处理数据审核 数据审核的目的。 原始数据和二手数据的审核内容。数据排序 数据排序的目的。 分类数据和数值型数据的排序方法。数据筛选 数据筛选的目的。 用Excel进行数据筛选。数据透视表 数据透视表的用途。 用Excel进行数据透视。2.2 品质数据的整理与展示分类数据的整理与图示频数,频
5、数分布,比例,百分比,比率。 用Excel制作分类数据的频数分布表。 分类数据的图示:条形图,帕累托图,对比条形图,饼图。顺序数据的整理与图示累积频数,累积频率。 累积频数分布图。2.3 数值型数据的整理与展示数据分组数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。 频数分布表的制作步骤。 用Excel制作频数分布表。数值型数据的图示 直方图的绘制。 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。2.4 合理使用图表鉴别图形优劣的准则 图形应包括的基本特征。 鉴别图形优劣的准则。
6、统计表的设计 统计表的结构。 统计表的设计。24. 频数:落在某一特定类别(或组)中的数据个数。25. 频数分布:数据在各类别(或组)中的分配。26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。27. 比率:样本(或总体)中各不同类别数值之间的比值。28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。31. 组距:一个组的上限与下限的差。32. 组中值:每一组的下限和上限之间的中点值,即组中值(下限值+上限值)
7、/2。33. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。34. 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。35. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。1. C2. A3. B4. C5. D6. B9. B10. C11. A12. B14. C16. B17. D18. D20. B21. C22. D23. D26. B29. D30. C31. B32. C35. B第3章 数据的概括性度量数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二
8、是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。3.1 集中趋势的度量众数众数。 众数的特点。中位数和分位数中位数,四分位数。 中位数和四分位数的特点。 中位数和四分位数的计算。平均数平均数,简单平均数,加权平均数,几何平均数。 简单平均数和加权平均数的计算。 平均数的性质。 几何平均数的计算和应用场合。众数、中位数和平均数的比较 众数、中位数和平均数在分布上的关系。 众数、中位数和平均数的特点及应用场合。3.2 离散程度的度量异众比率异众比率。 异众比率的计算和应用场合
9、。四分位差四分位差。 四分位差的计算和应用场合。方差和标准差极差,平均差,方差,标准差。 极差的计算和特点。 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。相对位置的度量标准分数。 标准分数的计算和应用。 经验法则。 切比雪夫不等式。离散系数离散系数。 离散系数的计算。 离散系数的用途。3.3 偏态与峰态的度量偏态及其测度偏态,偏态系数。 偏态系数的计算。 偏态系数数值的意义。峰态及其测度峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计量。 Excel统计函数的应用。二、主要术语和公式(一)主要术语1. 众数:一组数据中出现频数最多的
10、变量值,用表示。2. 中位数:一组数据排序后处于中间位置上的变量值,用表示。3. 四分位数:一组数据排序后处于25%和75%位置上的值。4. 平均数:一组数据相加后除以数据的个数而得到的结果。5. 几何平均数:n个变量值乘积的n次方根,用表示。6. 异众比率:非众数组的频数占总频数的比率。7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。8. 极差:也称全距,一组数据的最大值与最小值之差。9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。10. 方差:各变量值与其平均数离差平方的平均数。11. 标准差:方差的平方根。12. 标准分数:变量值与其平均数的离差除
11、以标准差后的值。13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。14. 偏态:数据分布的不对称性。15. 偏态系数:对数据分布不对称性的度量值。16. 峰态:数据分布的平峰或尖峰程度。17. 峰态系数:对数据分布峰态的度量值。(二)主要公式名称公式中位数简单样本平均数加权样本平均数几何平均数极差简单平均差加权平均差简单样本方差简单样本标准方差加权样本方差加权样本标准差标准分数未分组数据的偏态系数分组数据的偏态系数未分组数据的峰态系数分组数据的峰态系数1. A2. C7. D8. A11. B13. A14. B15. A17. A18. B20. A21. B24. C25. C26. D27. A28. A29. B30. B32. A33. B34. B36. B37. A38. C40. A41. A42. B43. B44. A45. B46.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1