统计学重点总结.docx
《统计学重点总结.docx》由会员分享,可在线阅读,更多相关《统计学重点总结.docx(12页珍藏版)》请在冰豆网上搜索。
统计学重点总结
统计学知识总结
1、统计学
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2、统计数据
分类数据、顺序数据、数值型数据
3、总体
总体是包含所研究的全部个体(数据)的集合。
4、样本
样本是从总体中抽取的一部分元素的集合
5、样本量
样本量构成样本的元素的数目
6、参数
参数是用来描述总体特征的概括性数字度量
7、统计量
统计量是用来描述样本特征的概括性数字特征
8、变量
说明现象某种特征的概念
分类变量:
说明事物类别的一个名称
顺序变量:
说明事物有序类别的一个名称
数值型变量:
说明事物数字特征的一个名称
9、概率抽样
也称随机抽样,是指遵循随机原则进行的抽样,总体中的每个单位都有一定的机会被选入样本
10、抽样误差
抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。
11、抽样框
抽样框是有关总体单位的名录
12、控制回答误差
搞好问卷设计,调查过程的质量控制(ps:
未能找到正确的方法,希望大家自己找寻)
13、数据的预处理
数据审核
数据筛选
数据排序
数据透视表
14、频数
频数是落在某一特定类别或组里的数据个数
15、比例
比例是一个样本(或总体)中各个部分的数据与全部数据之比
16、比率
比率是样本(或总体)各不同类别数值之间的比值
17、条形图与直方图的区别:
条形图使用条形的长度表示各类别频数的多少,宽度是固定的;直方图是用面积表示各类别频数的多少,矩形的高表示每一组的频数或频率,宽度则表示各组的组距,因此其高度和宽度都有意义
分组数据具有连续性,直方图的各举行通常是连续排列,条形图是分开排列,
条形图用于展示数据,直方图用于展示数学值型数据
最小值下四分位数中位数上四分位数最大值
18、箱线图
19、众数
众数是一组数据中出现次数最多的变量值,用M0表示
20、中位数
中位数是一组数据排序后处于中间位置上的变量值
21、四分位数
四分位数是数据排序后处于25%和75%位置上的数
22、平均数
平均数是一组数据相加后除以数据个数得到的结果
简单平均数
加权平均数
几何平均数:
G=
23、异众比率
异众比率是指非众数组的频数占总频数的比例
24、离散系数
离散系数是一组数据的标准差与平均数之比
25、抽样分布
(定义)在总体X的分布类型已知时,若对任意自然数n,都能导出统计量T=T(X1,X2,…Xn)的分布的数学表达式,这种分布称为精确地抽样分布
26、总体分布
总体中各元素的观测值所形成的相对频数分布是总体分布
27、样本分布
从总体中抽取一个容量为n的样本,由这n个观测值形成的相对频数分布,称为样本分布
28、抽样分布
在重复选取样本量为n的样本时,由该样本统计量的所有可能取值形成的相对频数分布,称为抽样分布
29、相关关系
变量之间存在的不确定的数量关系,称为相关关系
30、相关系数
相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若为总体的,称为总体相关系数;若为样本的,则称为样本相关系数,记为
另附重要公式:
统计学重要公式