1、R语言实验6实验6 参数估计一、 实验目的:1. 掌握矩法估计与极大似然估计的求法;2. 学会利用R软件完成一个和两个正态总体的区间估计;3. 学会利用R软件完成非正态总体的区间估计;4. 学会利用R软件进行单侧置信区间估计。二、 实验内容:练习:要求:完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),回答思考题,简要书写实验小结。修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,.。如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件
2、、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。截图方法:法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)1. 自行完成教材P163页开始的4.1.3-4.3节中的例题。2. (习题4.1)设总体的分布密度函数为X1,X2,Xn 为其样本,求参数? 的矩估
3、计量和极大似然估计量。现测得样本观测值为0.1, 0.2, 0.9, 0.8, 0.7, 0.7求参数 ? 的估计值。解:先求参数? 的矩估计量。由于只有一个参数,因此只需要考虑E(X)=。而由E(X)的定义有:E(X)= 因此,解得。以下请根据上式完成R程序,计算出参数? 的矩估计量的值。源代码及运行结果:(复制到此处,不需要截图)x(2*mean(x)-1)/(1-mean(x)1 0.3076923下面再求参数? 的极大似然估计量。只需要考虑x?(0, 1)部分。依题意,此分布的似然函数为 L(?; x)= 相应的对数似然函数为 ln L(?; x)=n ln(? +1)+ ? ln令
4、ln=0解此似然方程得到,或写为。容易验证,从而? 使得L达到极大,即参数? 的极大似然估计量un。以下请根据上式完成R程序,计算出参数? 的极大似然估计量的值。源代码及运行结果:(复制到此处,不需要截图)funiroot(f,c(0,1)$root1 0.211182$f.root1 -3.844668e-05$iter1 5$init.it1 NA$estim.prec1 6.103516e-053. (习题4.2)设元件无故障工作时间X具有指数分布,取1000个元件工作时间的记录数据,经分组后得到它的频数分布为组中值xi5152535455565频数vi36524515010070452
5、5如果各组中数据都取为组中值,试用极大似然函数估计求 ? 的点估计。提示:根据教材P168例4.7知,指数分布中参数 ? 的极大似然估计是n/。利用rep()函数。解:源代码及运行结果:(复制到此处,不需要截图)x1000/sum(x)1 0.054. (习题4.3)为检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50升,化验 每升水中大肠杆菌的个数(假设一升水中大肠杆菌个数服从Poisson分布),其化验结果如下:大肠杆菌数/升0123456水的升数1720102100试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率为最大?解:此题实际就是求泊松分布中参数 ? 的极大似然估计
6、。泊松分布的分布律为 PX=k=, k=0,1,2, ? 0设x1,x2,xn 为其样本X1,X2,Xn 的一组观测值。于是此分布的似然函数为 L(?; x)= L(?; x1,xn)= 相应的对数似然函数为 ln L(?; x)= -n?+ ln?-令 =0解此似然方程得到容易验证,从而? 使得L达到极大,即参数? 的极大似然估计量。以下请据此完成R程序,计算出参数? 的极大似然估计量的值。同上题,也需要利用rep()函数。源代码及运行结果:(复制到此处,不需要截图)xmean(x)1 15. (习题4.4)利用R软件中的nlm()函数求解无约束优化问题min f(x)=(-13+x1+(5
7、-x2)x2-2)x2)2+(-29+x1+(x2+1)x2-14)x2)2,取初始点x(0)=(0.5, -2)T。提示:参考教材P173公式(4.13)对应的例题。解:源代码及运行结果:(复制到此处,不需要截图)obj-function(x)f source(Rosenbrouk.R) x0 nlm(obj,x0)$minimum1 48.98425$estimate1 11.4127791 -0.8968052$gradient1 1.413268e-08 -1.462297e-07$code1 1$iterations1 16结论:$minimum是函数的最目标值,即f*=48.984
8、25,$estimate是最优点的估计值,即x*=( 11.4127791, -0.8968052)T; $gradient是在最优点处(估计值)目标函数梯度值,即 f*(1.413268e-08, -1.462297e-07)T; $code是指标,这里是1,表示迭代成功;$iterations是迭代次数,这里是16,表示迭代了16次迭代。6. (习题4.5)正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅中毒患者的脉搏数(次/min)如下:54 67 68 78 70 66 67 70 65 69已知人的脉搏次数服从正态分布,试计算这10名患者平均脉搏次数的点估计和95%的区间估计。
9、并作单侧区间估计,试分析这10患者的平均脉搏次数是否低于正常人的平均脉搏次数。提示:此题是一个正态总体的估计问题,且由于总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。解:源代码及运行结果:(复制到此处,不需要截图)x t.test(x) #t.rest()做单样本正态分布区间估计 One Sample t-testdata: xt = 35.947, df = 9, p-value = 4.938e-11alternative hypothesis: true mean is not equal to 095 percent confidence interval: 63
10、.1585 71.6415sample estimates:mean of x 67.4 t.test(x,alternative=less,mu=72) #t.rest()做单样本正态分布单侧间估计 One Sample t-testdata: xt = -2.4534, df = 9, p-value = 0.01828alternative hypothesis: true mean is less than 7295 percent confidence interval: -Inf 70.83705sample estimates:mean of x 67.4结论:双侧区间估计:平均
11、脉搏点估计为67.4,95%区间估计为63.1585 71.6415;单侧区间估计:p= 0.01828 x y t.test(x,y,var.equal=TRUE) Two Sample t-testdata: x and yt = 4.6287, df = 18, p-value = 0.0002087alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: 7.536261 20.063739sample estimates:mean of x mea
12、n of y 140.6 126.8 结论:期望差的95%置信区间为 7.536261 20.0637398. (习题4.7)甲、乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位:?)分别为甲组0.1430.1420.1430.137已组0.1400.1420.1360.1380.140假设两组电阻值分别服从正态分布N(?1, ? 2)和N(?1, ? 2),? 2未知。试求?1-?2的置信区间系数为0.95的区间估计。提示:此题是两个正态总体的估计问题,且由于两总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。t.te
13、st()可做两正态样本均值差的估计。注意此例中两样本方差相等。参考教材P185倒数第四行开始至P186。解:源代码及运行结果:(复制到此处,不需要截图) x y t.test(x,y,var.equal=TRUE) Two Sample t-testdata: x and yt = 1.198, df = 7, p-value = 0.2699alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: -0.001996351 0.006096351sampl
14、e estimates:mean of x mean of y 0.14125 0.13920 结论:期望差的95%区间估计为 -0.001996351 0.0060963519. (习题4.8)对习题4.6中甲乙两种稻种的数据作方差比的区间估计,并用其估计值来判定两数据是否等方差。若两数据方差不相等,试重新计算两稻种产量的期望差?1-?2的置信区间(? =0.05)。提示:在R软件中,var.test()函数能够提供两个样本方差比的区间估计。参考教材P189倒数第6行开始的内容。此结果可认为方差不等。因此重新计算期望差时应该采取方差不等的参数。解:源代码及运行结果:(复制到此处,不需要截图)
15、 x y var.test(x,y) F test to compare two variancesdata: x and yF = 0.23533, num df = 9, denom df = 9, p-value = 0.04229alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:sample estimates:ratio of variances 0.2353305 t.test(x,y,) Welch Two Sample t-testdat
16、a: x and yt = 4.6287, df = 13.014, p-value = 0.0004712alternative hypothesis: true difference in means is not equal to 095 percent confidence interval: 7.359713 20.240287sample estimates:mean of x mean of y 140.6 126.8结论:期望差的95%置信区间为 7.359713 20.24028710. (习题4.9)设电话总机在某段时间内接到的呼唤的次数服从参数未知的Poisson分布 P
17、(?),现收集了42个数据接到呼唤次数0123456出现的频数710128320试求出平均呼唤次数 ? 的估计值和它的置信系数为0.95的置信区间。此题给出完整答案,供参考。解:从习题4.3已经知道,平均呼唤次数 ? 的估计值就是?X。此题是非正态总体的区间估计问题。但由中心极限定理可知,此类问题其置信区间与方差? 2未知时一个正态总体的均值的置信区间完全一样,即为。参考教材P190公式(4.46)及其后的程序。源代码及运行结果: x n tmp mean(x)1 1.904762 mean(x)-tmp;mean(x)+tmp #置信区间的下限和上限1 1.4940411 2.315483结
18、论:平均呼唤次数为1.90.95的置信区间为1.49, 2.32。11. (习题4.10)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948求灯泡寿命平均值的置信度为0.95的单侧置信下限。提示:此题是一个正态总体的区间估计问题,且由于总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。根据教材P191定义4.7知,单侧置信下限,t.test()函数中的参数alternative=greater。参考教材P193-194的例4.22及其后面一段文
19、字。解:源代码及运行结果:(复制到此处,不需要截图)xt.test(x,alternative=greater) One Sample t-testdata: xt = 23.969, df = 9, p-value = 9.148e-10alternative hypothesis: true mean is greater than 095 percent confidence interval: 920.8443 Infsample estimates:mean of x 997.1结论:灯泡平均寿命置信度95%的单侧置信度下限为 920.8443 思考:1. 常用的点估计的方法有哪些?
20、距法,极大似然法,最小二乘法等。2. 估计量的优良性准则有哪些?无偏性,有效性和相合性(一致性)3. 在R语言中,求矩法估计时,如果令总体的k阶原点矩等于它样本的k阶原点矩得到的k作者编写的Newton法程序求此方程组的解。在求极大似然估计时需要求解(对数)似然函数的极大值,如果无法求出其相应似然方程的解析解,若此(对数)似然函数是一维变量,可以用R中的_optimeize()(或optimise()_函数变相求解此(对数)似然函数的相反数的极小值?若此(对数)似然函数是多维变量,可以用R中的_nlm()_函数变相求解 L(?; x) 或ln L(?; x)?三、 实验小结(必写,但字数不限)这次实验主要学会掌握矩法估计与极大似然估计的求法,会利用R软件完成一个和两个正态总体的区间估计,非正态总体的区间估计和单侧置信区间估计,还要会分析结果,得出结论。懂得什么样的题,用什么样的方法和函数。通过这次实验,已经掌握了一些基本参数估计知识,要多看书本,多加练习。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1