apstatistics知识点square.docx

上传人:b****8 文档编号:30376571 上传时间:2023-08-14 格式:DOCX 页数:14 大小:20.91KB
下载 相关 举报
apstatistics知识点square.docx_第1页
第1页 / 共14页
apstatistics知识点square.docx_第2页
第2页 / 共14页
apstatistics知识点square.docx_第3页
第3页 / 共14页
apstatistics知识点square.docx_第4页
第4页 / 共14页
apstatistics知识点square.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

apstatistics知识点square.docx

《apstatistics知识点square.docx》由会员分享,可在线阅读,更多相关《apstatistics知识点square.docx(14页珍藏版)》请在冰豆网上搜索。

apstatistics知识点square.docx

apstatistics知识点square

apstatistics知识点square

【篇一:

apstatistics知识点square】

part1exploringdata(探索性数据分析)

frequency频数

relativefrequency相对频数

cumulativefrequency累积频数

symmetricdistribution对称分布

left-skeweddistribution左偏分布

right-skeweddistribution右偏分布

clustersandgaps集群和缺口

outlier异常值

mean均值

median中位数

range极差

quartiles四分位数

interquartilerange四分位差

percentile百分位数

standarddeviation标准差

standardizedscores(z-scores)标准计分(z-计分)

correlationcoefficient相关系数

pearsonscorrelationcoefficient皮尔逊相关系数

leastsquaresregressionline最小二乘回归线

dependentvariable因变量

independentvariable自变量

predictedvalue预测值

thecoefficientofdetermination判定系数

influentialobservation有影响的观测值

residualplot残差图

part2samplingandexperimentation(抽样和实验设计)

population总体

sample样本

samplesurvey抽样调查

census普查

experiment实验设计

observationalstudy观测研究

biasedsampling有偏抽样

judgmentalsampling判断抽样

samplesofconvenience方便样本

volunteersamples自愿样本

simplerandomsampling简单随机抽样

systematicsampling系统抽样

stratifiedrandomsampling分层抽样

proportionalsampling比率抽样

clustersampling整群抽样

samplingerror抽样误差

responsebias回答偏差

noresponsebias无回答偏差

undercoveragebias覆盖不全偏差

wordingeffectbias措辞偏差

experimentalunit实验单位

observationalunit观测单位

confoundingvariable混淆变量

factor因子

treatment处理

controlgroup控制组

placebogroup安慰剂组

single-blindexperiments单盲实验

double-blindexperiments双盲实验

randomization随机化

blocking(block)区组

replication复制,重复

completelyrandomizeddesign完全随机设计

randomizedblockdesign随机区组设计

matched-pairsdesign配对设计

part3anticipatingpatterns(预期分布形式)

probability概率

samplespace样本空间

treediagram树形图

impossibleevents不可能事件

sureevents必然事件

complementofanevent事件的补事件

disjointormutuallyexclusiveevents互斥事件

conditionalevent条件事件

independence独立

randomvariable随机变量

discreterandomvariable离散型随机变量

continuousrandomvariable连续型随机变量

probabilitydistributionofadiscreterandomvariable离散型随机变量的概率分布

cumulativedistributionfunction累积分布函数

expectedvalue期望值,数学期望

probabilitydistributionofacontinuousrandomvariable连续型随

机变量的概率分布

parameter参数

statistics统计量

samplingdistribution抽样分布

centrallimittheorem中心极限定理

part4statisticalinference(统计推断)

estimationprocess估计过程

estimate估计值

pointestimation点估计

intervalestimation区间估计

marginoferror误差界限

confidenceinterval置信区间

confidencelevel置信水平

significance显著性

statisticalhypothesis统计假设

nullhypothesis零假设,原假设

alternativehypothesis备选假设

teststatistics检验统计量

typeierror第一类错误

typeiierror第二类错误

rejectionregion拒绝域

nonrejectionregion非拒绝域

criticalvalue临界值

left-tailedtest左尾检测

right-tailedtest右尾检测

two-tailedtest双尾检测

samplesize样本容量

studentstdistribution学生t-分布

chi-squaredistribution卡方分布

goodnessoffit拟合优度

contingencytables联列表

apstatistics你需要知道的所有公式!

第一部分:

必须自己记住的公式

第一个是独立随机变量的组合公式,尤其需要注意的是下面那个标准差的公式必须在x和y独立的条件下才能使用。

第二个是各种自由度的公式

单样本均值t分布时,df=n-1;

双样本均值差t分布时,df=min(n1-1,n2-1),就是n1-1和n2-1当中较小的值;

回归线的斜率t分布时,df=n-2;

拟合度的卡方检验时,df=i-1,i是分类的总数;

独立性和齐次性的卡方检验时,df=(c-1)(r-1),c是行数,r是列数;

双样本比例差的假设检验中,由于p1=p2且未知,所以标准差的公式中,用到的比例p如下面第二行所示

第二部分:

考卷给出的公式(选择和解答都给出)

第一页的公式主要是第一章的内容,重点是最小二乘回归线部分(有一些概念题),如果需要计算的话,都用计算器直接算出即可。

第二页的公式前两个是概率的加法准则和条件概率的公式,乘法准则可以直接用条件概率的转换出来。

三、四是随机变量均值和方差(标准差的平方)的算法,这两个公式是普适的,任意随机变量都可以用。

接下来的五、六、七都是二项式分布随机变量的公式,分别是概率分布的计算,以及均值和标准差。

最后4个是单样本比例和单样本均值的抽样分布的公式。

第三页是最重要的了,因为计算器的重中之重就是第四章统计推断部分。

最上面的两个是假设检验和置信区间的核心公式,statistic——样本统计量,parameter——总体参数,criticalvalue——根据置信水平(t分布中还要考虑自由度)算出的临界zscore或者tscore。

【篇三:

apstatistics知识点square】

ap统计公式+考点最全整理,背完5分准到手!

散文吧>>>ap统计公式+考点最全整理,背完5分准到手!

作为中国考生灰常热门的ap科目之一,ap统计牵动着千万考生的心,眼看着后天就要和大家见面儿了,小伙伴们复**的肿~么样啦?

ap统计知识点庞杂、公式繁多,这里给大家做了考前梳理,这么强的助攻贴也是没sei啦,预祝各位小主儿考出新高度

一、描述统计

*数据(data)分为定性数据(qualitativeorcategoricaldata)与定量数据(quantitativedate)。

定性数据:

按照类别进行划分,展示对象的属性;

定量数据:

展示对象的数值特征。

*图(graph):

分为barchart,piechart,dotplot,stemplot,histogram,boxplot

*通过图形可以看出数据的分布特征:

(1)对称(symmetric)

(2)偏态(skewed)

左偏(skewedtotheleft)

右偏(skewedtotheright)

(3)集中趋势

(4)异常值

*histogram的画法:

(1)以个数作为高度

(2)以百分比作为高度

(3)以百分比作为面积。

*概率密度(probabilitydensityfunction,pdf)

描绘以百分比作为面积的histogram的曲线。

*累积分布(cumulativedistributionfunction,cdf)以小于等于该数的数据所占百分比作为该数的纵坐标绘制出的曲线。

*数字特征(numericalvalue)

(1)描述集中趋势

(2)描述离散趋势

(3)描述位置

(4)标准化变量(z-score)

*众数(mode)一组数据中出现次数最多的数;

*平均数(mean)数据求和后除以数据个数。

*方差(variance)与标准差(standarddeviation)

衡量数据与平均值偏离程度平方和的平均值。

*标准化变量(z-score)

计算方式是将原始数据减去平均数之后再除以标准差,用它可以展示不同度量单位数据的偏离程度。

*散点图(scatterplot)

以一个变量作为横坐标、另一个变量作为纵坐标绘制出的图形,以散点的形式表现在坐标轴中。

变量选用单位不同,会造成图形有差异。

*相关系数(linearcorrelationcoefficient)

衡量两个量之间线性关系的指标,介于-1和1之间,负数代表两个变量之间是反向变化的,正数代表两个变量之间是同向变化的,越靠近0代表线性关系越弱,越靠近-1和1代表线性关系越强。

它只能衡量线性关系,不能衡量非线性关系;只反应关系,不代表因果。

*回归(regression)寻找代表变量之间关系的数学表达式。

*线性回归假定变量之间存在一次函数的关系(形如y=kx+b)。

此函数在坐标系中图像是一条直线,因此称作线性回归。

*残差(residual)真实值与估计值之间的差。

*残差图(residualplot)以一个变量作为横坐标、该变量所对应的残差为纵坐标绘制出的图形。

若两变量之间存在线性关系,则残差图应为无规则的散点。

*最小二乘法(leastsquare)利用残差平方和最小求出直线斜率与截距(k和b)的方法。

*线性化(linearity)将非线性关系转换为线性关系的方法,常用有对数变换、指数变换等。

二、抽样方法

*总体(population):

研究对象的全体。

*样本(sample):

总体中的一部分。

*参数(parameter):

描述总体特征的指标,一般用希腊字母表示。

*统计量(statistics):

描述样本特征的指标,一般用拉丁字母表示。

*普查(census):

对总体中的每一个个体都进行研究。

*抽样(sample):

对总体中的部分个体进行研究。

*实验法(experiment):

对目标群体进行干预而得到数据。

*观察法(observation):

不对目标群体进行干预而得到数据。

实验组(treatmentgroup):

对该组中的个体进行干预。

*对照组(controlgroup):

不对该组中的个体进行干预。

*影响因子(factor):

会对实验对象产生影响

*变量混淆(confounded):

无法分离因子的影响

*协同作用(commonresponse):

多个因子共同造成影响

*安慰剂(theplaceboeffect):

心理作用导致的变化

*单盲试验(singleblinding):

实验者知晓每一个体是否受到预先设置的干预,而被实验者不知晓。

*双盲试验(doubleblinding):

实验者与被实验者都不知晓每一个体是否受到预先设置的干预。

*简单随机抽样(simplerandomsampling):

随机地从总体中选取个体,每个个体被选到的概率是相等的。

*系统抽样(systematicsampling):

首先将总体中的个体编号、排序,而后按照固定步长进行抽样。

*分层抽样(stratifiedsampling):

首先将总体中的个体按照某一特征或标准划分为不同的层(strata),而后从每层中进行抽样。

特征是每个层中的个体具有相似性。

*整群抽样(clustersampling):

首先将不同特征的个体划为分一个群(cluster),而后从每个群中进行抽样。

特征是每个群具有多样性。

三、概率

*频数(frequency):

某一结果出现的次数。

*频数(frequency):

某一结果出现的次数。

*频率(relativefrequency):

某一结果出现的次数占实验次数的百分比。

*概率(probability):

某一结果出现可能性的大小,介于0和1之间。

不可能事件(impossibleevent)的概率是0,必然事件(certainevent)的概率是1,但反之不正确,概率为0的事件不一定是不可能事件,也有可能发生,概率为1的事件也可能不发生。

*大数定律(thelawoflargenumbers):

实验次数越大,频率越稳定,且取决于事件本身的概率。

*基本公式:

*条件概率(conditionalprobability):

给定某一事件发生的条件下,另一事件发生的概率。

*随机变量(randomvariable):

该变量的取值取决于实验的结果。

*离散型(discrete):

随机变量的取值是一个一个的。

*连续型(continuous):

随机变量的取值是连续不间断的。

*分布(distribution):

实验结果出现的规律。

*均值(mean)与方差(variance):

*二项分布(binomialdistribution):

将具有两个结果的实验重复多次,求其中某一结果出现次数的概率。

*几何分布(geometricdistribution):

将具有两个结果的实验重复多次,求其中某一结果首次出现时实验次数的概率。

*正态分布(normaldistribution):

代表常规现象出现次数多、极端现象出现次数少这样一种规律。

*标准正态分布(standardnormaldistribution):

均值为0、方差为1的正态分布。

*抽样分布(samplingdistribution):

多次抽样后,样本统计量的分布规律。

*标准误(standarderror):

统计量的标准差。

*单总体样本比例的抽样分布

正态分布:

双总体独立样本比例差的抽样分布:

单总体样本均值的抽样分布:

双总体独立样本均值差的抽样分布:

四、统计推断

*参数估计(estimation):

利用统计量去预测参数。

*区间估计(interval):

给出参数的范围。

*置信水平(confidencelevel):

对参数多次进行估计得到多个区间,其中区间中包含真实参数的次数占估计次数的比例。

*单总体比例区间估计:

*双总体比例差区间估计:

*单总体均值区间估计:

此时需考虑总体方差是否已知:

(1)若已知则使用正态分布进行估计

(2)若未知则使用t分布进行估计。

*双总体均值差区间估计:

此时需考虑总体方差是否已知

(1)若已知则使用正态分布进行估计

(2)若未知

a.总体方差不等(pooled=no)

b.总体方差相等(pooled=yes),则使用t分布进行估计,但所用自由度与方差皆不相同。

*假设检验(hypothesistest):

利用统计量对参数的真伪进行检验。

*原假设(nullhypothesis):

待检验参数。

*备择假设(alternativehypothesis):

当原假设被拒时所接受的假设。

根据备择假设形式的不同,分为双尾检验(twotailed)和单尾检验(onetailed)

*p值(p-value):

当原假设为真的时候得到此样本结果以及比此样本结果更极端结果的概率。

p值越小,拒绝原假设的可能性越大。

第一类错误(typeierror):

原假设为真时却拒绝原假设。

犯此错误的概率为显著性水平(significancelevel)。

第二类错误(typeiierror):

原假设为假时却没有拒绝原假设。

不犯此错误的概率为(powerofthetest)。

在样本容量(samplesize)固定的条件下,两类错误为此消彼长的关系,若想同时降低两类错误,只能提升样本容量。

*单总体比例检验:

*双总体独立样本比例差检验:

*单总体均值检验:

此时需考虑总体方差是否已知:

(1)若已知则使用正态分布进行检验

(2)若未知则使用t分布进行检验。

*双总体均值差检验:

此时需考虑总体方差是否已知:

(1)若已知则使用正态分布进行检验

(2)若未知

a.总体方差不等(pooled=no)

b.总体方差相等(pooled=yes),则使用t分布进行估计,但所用自由度与方差皆不相同。

*卡方检验(chi-square)

拟合优度检验(goodnessoffit):

利用样本信息来检验总体是否符合某一分布。

独立性检验(independence):

检验某一分类结果是否受另一分类影响。

更多一手备考资料/资讯加sat考试群:

168****34,小伙伴们都说你来晚辣!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1