概率统计常见题型及方法总结Word文件下载.docx
《概率统计常见题型及方法总结Word文件下载.docx》由会员分享,可在线阅读,更多相关《概率统计常见题型及方法总结Word文件下载.docx(62页珍藏版)》请在冰豆网上搜索。
(2)由贝叶斯公式得
,3分
3分
二、随机变量函数的分布及其边缘密度及其独立性的判断
记住如下知识点:
常见分布律和概率密度:
一般正态分布的计算转化为标准正态分布去做:
连续随机变量X:
二维随机变量的分布函数:
联合密度:
掌握如下解决随机变量函数分布的解题方法:
对于二维随机变量函数的概率密度,注意:
除了求随机变量Z=X+Y的密度函数用公式:
注意:
先写出联合密度:
,根据联合密度写出
或者,
在平面x0z或者y0z上画出被积函数不为零的区域,然后穿线通过区域确定x的上下限。
他的函数Z=g(X,Y)的概率密度,只能使用分布函数法
其步骤如下:
第一步求联合密度:
,根据联合密度写出或者
第二步求z的分布函数:
难点是画出二重积分的积分区域,然后把二重积分化为二次积分定上下限,
画图:
先画出被积函数也就是联合密度非零的区域,再确定区域与密度非零区域的重合区域就是二重积分的积分区域,穿线定积分限:
然后左右穿或者上下穿个积分区域定内限,求出分布函数
第三步求密度函数:
分析:
一、设总体服从上的均匀分布,是来自总体的一个样本,最大顺序统计量,
1.求随机变量的概率密度;
解:
,其分布函数为
而的分布函数为
,
二、(10分)设二维随机变量的概率密度为
(1)求常数的值;
(2)求与的协方差。
解
(1)由,得
(2)
三(16分)设二维随机变量的概率密度为
(1)求边缘密度函数,;
(2)求边缘分布函数,;
(3)判断与是否相互独立;
(4)求。
(1),
当≤0时,=0,于是=0
当>0时,=,
所以的边缘概率密度为=
的边缘概率密度
当≤0时,=0
当>0时=4分
(2)
(3)独立4分
(3)4分
四(10分)设随机变量的概率密度为
求随机变量的分布函数。
当时,
当时,
所以的分布函数为
3.中心极限定理的问题:
用正态分布近似计算
共两类:
一类是二项分布的近似计算问题
,即,
这个公式给出了n较大时二项分布的概率计算方法。
另一类是除二项分布之外的其他分布的独立变量连加和的计算问题,
设独立同分布,
近似有连加和服从正态分布:
一、(14分)设粮仓内老鼠的数目是一个服从泊松分布的随机变量,且仓内无鼠的概率为。
(1)写出随机变量的分布律;
(2)试用中心极限定理计算,在200个同类粮仓内老鼠总数超过350只的概率。
解
(1);
5分
(2)表示任意老鼠个数,由中心极限定理
3分
二、(10分)某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以表示在随意抽查的100个索赔户中因被盗而向保险公司索赔的数。
(1)写出的概率分布;
(2)求被盗索赔户不少于14户且不多于30户的概率的近似值。
[解]
(1),
,
(2),
根据棣莫佛—拉普拉斯中心极限定理
三(10分)某银行的柜台替每一位顾客的服务时间(单位:
分钟)服从参数的指数分布,且各位顾客的服务时间是相互独立的,试用中心极限定理计算,对100位顾客的总服务时间不超过240分钟的概率。
解设分别表示每一位顾客的服务时间,则它们相互独立相同分布,且
-------------------------------5分
点估计的问题:
矩估计和似然估计
似然函数的构造:
例题分析:
一、设总体的概率密度为
是未知参数,是来自的样本,
1.求的矩估计量;
矩估计法:
,令,=>
2.求的最大似然估计量;
3.判断,是否为无偏估计
最大似然估计法:
设为样本的观察值,则
似然函数为,
按似然估计的思想,当似然函数关于是增函数,故。
的最大似然估计量为。
二(10分)设为样本,总体的概率密度为
求参数的最大似然估计量;
问它是否为的无偏估计量
解设是相应的样本值,则似然函数为
=
令为无偏估计量
三、设是总体的样本,的概率密度为
其中.求和的最大似然估计量。
设是的样本值,则似然函数
当()时,,令
显然,第二个等式是矛盾等式,所以由上述似然方程求不出和.由于,这表明是的严格递增函数,注意到(),因此当时最大.于是和的最大似然估计值
,
于是和的最大似然估计量为
.
四、(10分)设总体X的概率密度为
其中是未知参数。
设为总体的样本。
(1)求参数的最大似然估计量;
(2)判断是否为的无偏估计量。
解
(1)设是的观测值,则似然函数为
,
。
令,得,解得
的最大似然估计量为
(2)由于,是的无偏估计量。
五(10分)设电池的寿命服从指数分布,其概率密度为
其中为未知参数,今随机抽取5只,测得寿命如下:
1150,1190,1310,1380,1420
求电池的平均寿命的最大似然估计值。
解似然函数,3分
令得2分
六、设总体X的概率密度为
其中是未知参数.设为总体的样本.求参数的矩估计量
和最大似然估计量.
解矩估计
且,令
,则
从而的矩估计量
最大似然估计
设是的样本观测值,则似然函数为
.
取对数得,
令,得,解得,
所以,的最大似然估计量为.
七、.设总体的分布律为
,,
其中为未知参数。
现抽得一个样本:
,,,求参数的矩估计值和极大似然估计值。
解,
由,即,得参数的矩估计值为
统计量的分布判断问题:
主要利用性质:
独立正态分布的线性组合还是正态分布
三大分布的定义:
一、设是正态总体的样本,
1.试问服从什么分布(指明自由度)?
且独立,
2.假定,求的分布。
,
又和相互独立,故=
二.设是来自正态总体的样本,分别记为的样本均值和样本方差,求的分布。
解,,且与相互独立,所以
由于,且与相互独立,因此由分布的定义得
三、,.
(1)证明都是的无偏估计量;
(2)判断中哪一个估计量更有效.
利用卡方分布:
四设是来自正态总体的样本,记,,,求统计量的分布?
五、设为X的样本,求统计量的分布.
六、.设总体,是X的样本,统计量
,()
服从分布,求参数的值和的分布的自由度。
解由,得
且相互独立,即
,
且相互独立。
于是
所以当时,
该分布的自由度为2。
假设检验和区间估计的题目类型:
记住正态总体的抽样分布定理,弄懂上分位数的含义,在密度曲线图上用分位数给出各个分布的大概率区域和小概率区域
能够从图上用分位数标出各种分布的双侧小概率区域和单侧小概率区域
1(10分)某工厂生产铜线,根据长期积累的数据知,铜线的折断力服从正态分布,方差为。
今从某天生产的铜线中随机抽取根,测得折断力如下:
问该天生产的铜线折断力与以往比较,其波动性有无显著变化?
检验假设,
统计量,则当为真时,,
拒绝域为或。
现在,
由于,
即该天生产的铜线折断力与以往比较,其波动性无显著变化。
2(8分)在某砖厂生产的一批砖中,随机地抽取6块,测量其抗断强度(单位MPa)分别为
3.3663.1063.2643.2873.1223.205
设砖的抗断强度服从正态分布,问能否认为这批砖的平均抗断强度是3.250MPa?
(显著性水平)
、解3分
检验统计量,拒绝域3分
算得2分
接受
3(10分)某化工厂一天中生产的化学制品产量(单位:
吨)服从正态分布,今测得5天的产量分别为785,805,790,790,802。
问是否可以认为日产量的均值显著小于800?
(取)
解假设
检验统计量-----------------------5分
拒绝域
,接受--
4.是来自正态总体的样本,其中参数和均未知,对于参数的置信度为的置信区间,试问当减少时该置信区间的长度如何变化?
答:
则μ的置信度为1-α的置信区间
置信区间的长度,当样本容量给定时,减小的值会增大的值,相应地变长。
5、(10分)某灯泡生产车间为考察灯泡的寿命,从生产的一批灯泡中随机抽取25只,测得平均寿命小时,标准方差小时。
假设灯泡的寿命服从正态分布,
(1)求总体方差的置信水平为95%的置信区间;
(2)在显著性水平条件下能否认为这批灯泡的平均寿命为2000小时?
解
(1),,,。
的置信水平为95%的置信区间为
(2)在检验水平为5%的条件下检验假设,
选取检验统计量,当原假设时,;
该假设检验问题的拒绝域为
由条件得
由于,因此接受原假设,即在检验水平为5%的条件下可以认为这批灯泡的平均寿命为2000小时。
6.假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X得到两组数据,经对其作相应运算得
假设测定结果服从正态分布,
1.在显著性水平下,能否认为?
2.求的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。
解
(1)检验假设
拒绝域为
由条件知
查表得,
显然
接受原假设,故可认为,即认为两总体方差相等,也就是两厂生产的产品的指标X的方差无显著性差异.
(2)求的置信区间。
由
(1)知,但其值未知,故的置信区间为
计算
查表
故的90%置信区间为
=
数字特征:
概念清楚:
均值(期望)的概念: