1、 可以简单的理解为求一个概率性事件的平均状况。各种数学分布的方差是:1、 一个完全符合分布的样本 2、 这个样本的方差 概率密度的概念是:某种事物发生的概率占总概率(1)的比例,越大就说明密度越大。比如某地某次考试的成绩近似服从均值为80的正态分布,即平均分是80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右的人最多。下图为概率密度函数图(F(x)应为f(x),表示概率密度):离散型分布:二项分布、泊松分布 2连续型分布:指数分布、正态分布、X分布、t分布、F分布抽样分布 抽样分布只与自由度,即样本含量(抽样样本含量)有关二项分布(bin
2、omial distribution):例子抛硬币 1、 重复试验(n个相同试验,每次试验两种结果,每种结果概率恒定伯努利试验) 2、 3、 P(X=0), P(X=1), P(X=3), .所有可能的概率共同组成了一个分布,即二项分布 泊松分布(possion distribution): 1、 一个单位内(时间、面积、空间)某稀有事件 2、 此事件发生K次的概率 3、P(X=0), P(X=1), P(X=3), .所有可能的概率共同组成了一个分布,即泊松分布 二项分布与泊松分布的关系:二项分布在事件发生概率很小,重复次数n很大的情况下,其分布近似泊松分布 均匀分布(uniform dis
3、tribution): 分为连续型均匀分布和离散型均匀分布 离散型均匀分布:1、 n种可能的结果 2、 每个可能的概率相等(1/n) 连续型均匀分布:1、 可能的结果是连续的 2、 每个可能的概率相等() 连续型均匀分布概率密度函数如下图:指数分布(exponential distribution): 用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。指数分布常用于各种“寿命”分布的近似。 1、连续型分布,每个点的概率:2、无记忆性。已经使用了s小时的元件,它能再使用t小时的概率,与一个从未使用过的元件使用t小时的概率相同。即它对已经使用过的s
4、小时没有记忆。指数分布的概率密度函数如下图:正态分布(normal distribution): 又称高斯分布。1、 描述一个群体的某个指标。 、 这个指标是连续的。 23、 每个特定指标在整个群体中都有一个概率()。4、 所有指标概率共同组成了一个分布,这个分布就是正态分布。正态分布的概率密度函数如下图:中心极限定理:不论总体的分布形式如何(正态或非正态),只要样本(抽样样本)含量n足够大时,样本均数的分布就近似正态分布,且均数与总体均数相等,标准差为(总体标准差)/(n的开方)。2中心极限定理使得t分布、F分布和X分布在抽样样本含量很大时不需要对总体样本是否正态有要求。t分布(studen
5、t t distribution): 1、t分布是以0为中心的一簇曲线,每个自由度决定一个曲线2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-13、总体样本呈正态分布(抽样样本含量较小时,要求总体样本呈正态分布,如果抽样样本含量很大(eg. n = 100),由中心极限定理可知抽样样本均数也近似正态分布,因而“差值”的概率也呈正态分布,而t分布的每一条曲线实际上都是正态分布曲线)4、从一个总体样本中抽取很多个小样本抽样 5、每个小样本都有一个均值 6、每个小样本的均值与总体样本均值有一个差值,这个差值用t估计7、可能有多个小样本的差值估计都是t,t出现的次数占所有小样本的比例可
6、以用一个概率衡量 8、所有t值的概率组成一个分布,就是t分布的一个曲线9、另外做一个抽样,每个小样本包含的观测值不同,则形成t分布的另外一个曲线 10、自由度越大,则曲线越接近于标准正态分布 11、t分布只与自由度相关 t分布的概率密度函数如下图(v为自由度):2X分布(chi square distribution):21、X分布也是一簇曲线,每个自由度决定一个曲线 2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-12、总体样本呈正态分布(抽样样本含量(n)较小时,要求总体样本呈正态分布)3、从总体样本中抽取n个观测值:z,z,z抽样12324、将它们平方后求和,这个和用一个
7、新变量表示,即X222225、重复抽样并获得多个X:X,X,X,X 1234226、可能有多次抽样的X值相同,同一个X值的抽样次数占总次数的比例可以用一个概率表示 27、所有的概率值共同组成一个分布,就是X分布的一条曲线8、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线 10、自由度越大,则曲线越接近于标准正态分布 211、X分布只与自由度相关 2X分布的概率密度函数如下图(n在这里为自由度):F分布(F-distribution):1、F分布也是一簇曲线,每对自由度决定一个曲线 2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-12、两总体样本方差比的分布
8、 3、总体样本呈正态分布(抽样样本含量(n)较小时,要求总体样本呈正态分布)4、从总体样本中抽取两个样本, 两个样中的观测值数目可相同也可不同,分别记为n和n 1225、分别计算出X:X,X 126、构建一个新变量F:7、重复抽取样本,计算多个F值:F,F,F. 1238、可能有多次抽样的F值相同,同一个F值的抽样次数占总次数的比例可以用一个概率表示 9、所有的概率值共同组成一个分布,就是F分布的一条曲线10、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线 10、两个自由度越大,则曲线越接近于标准正态分布 11、F分布只与自由度相关 F分布的概率密度函数如下图(m,n在这
9、里为自由度):【在推估总体平均值时,基于样本平均数的抽样分布】 t分布2【在用样本方差来推估总体方差时,必须知道样本方差的抽样分布】 X分布【比较两个总体的方差是否相等时,必须知道样本方差的联合抽样分布】 F分布 生存分析(survival analysis):1、多种影响慢性疾病的因素(不同手术方法、不同药物)定义:在RtABC中,锐角A的对边与邻边的比叫做A的正切,记作tanA,2、随访一群患者 七、学困生辅导和转化措施3、一段时间后统计生存和死亡 3、最终给出的结果是一个评价各种因素对生存时间的影响(生存时间、生存率有无差异) (5)二次函数的图象与yax2的图象的关系:贝叶斯公式(ba
10、yes formula):八、教学进度表1、 描述两个条件概率之间的关系P(Bi|A)与P(A|Bi),A为事件,Bi 为一个划分 增减性:若a0,当x时,y随x的增大而增大。2、 P(Bi|A)=P(A|Bi)*P(Bi)/P(A) 或者 3、 看图理解 点在圆外 dr.4、根据学生的知识缺漏,有目的、有计划地进行补缺补漏。全概率公式(full probability formula):5、多一份关心、帮助,努力发现他们的闪光点,多鼓励、表扬他们,使其体验成功、努力学习。1、描述一个特定事件的概率与条件概率间的关系 2、 P(A)=P(A|B1)*P(B1) + P(A|B2)*P(B2) + . + P(A|Bn)*P(Bn)(3)二次函数的图象:是一条顶点在y轴上且与y轴对称的抛物线,二次函数的图象中,a的符号决定抛物线的开口方向,|a|决定抛物线的开口程度大小,c决定抛物线的顶点位置,即抛物线位置的高低。(2)如圆中有直径的条件,可作出直径上的圆周角.(直径添线成直角)
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1