1、概率统计实验13.6 概率统计实验学习目标1 会用Mathematica求概率、均值与方差;2 能进行常用分布的计算;3 会用Mathematica进行期望和方差的区间估计;4 会用Mathematica进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica自带的统计程序包,其中有实现常用统计计算的各种外部函数。一、 样本的数字特征1. 一元的情况Mathematica的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic程序包子集中,位
2、于目录D:Mathematica4.0AddOnsStandardPackagesStatistics下。通过查看Help,可以找到包含所需外部函数的程序文件名。在程序文件DescriptiveStatistics.m中,含有实现一元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差(最大数减最小数)。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。StandardDeviation
3、MLEdata 求标准差。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。 解:In1:= Statistics DescriptiveStatistics In2:= data = 6.5,3.8,6.6,5.7,6.0,6.4,5.3; In3:=Lengthdata Out3=7 In4:=Mindata Out4= 3.8 In5:=Maxdata Out5= 6.6 In6:=SampleRangedata Out6
4、= 2.8 In7:=Mediandata Out7= 6. In8:=Meandata Out8= 5.75714 In9:=Variancedata Out9= 0.962857 In10:=StandardDeviationdata Out10= 0.981253 In11:=VarianceMLEdata Out11= 0.825306 In12:= StandardDeviationMLEdata Out12= 0.908464 说明:在上例中,In1首先调入程序文件,求数据个数、最大值和最小值使用内部函数。2. 多元的情况 在程序文件MultiDescriptiveStatisti
5、cs.m中,含有实现多元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。 StandardDeviationMLEdata 求标准差。 Covariancexlist,ylist 求x,y的协方差(无偏估计)。 CovarianceMLExlist,ylist 求x,y的协方差。Correlationxlist,ylist 求x,y
6、的相关系数。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例2 给出4个样本值:1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33,计算样本个数、均值、方差、标准差等。 解:In1:= Statistics MultiDescriptiveStatistics In2:= data = 1.1,2.0,3.2,1.3,2.2,3.1, 1.15,2.05,3.35,1.22,2.31,3.33; Lengthdata Out3=4 In4:=SampleRangedata Out4= 0.2,0.
7、31,0.25 In5:=Mediandata Out5= 1.185,2.125,3.265 In6:=Meandata Out6= 1.1925,2.14,3.245 In7:=Variancedata Out7= 0.00755833,0.0200667,0. In8:=VarianceMLEdata Out8= 0.00566875,0.01505,0.010325 In9:=CentralMomentdata,2 Out9= 0.00566875,0.01505,0.010325 In10:=x=dataAll,1;y=dataAll,2; z=dataAll,3; In11:=Co
8、variancex,y Out11=0.0093 In12:=Covariancez,z Out12=0. In13:=CovarianceMLEy,y Out13=0.01505 In14:=Correlationy,z Out14=0. In15:=Correlationx,x Out15=1.二、 常用分布的计算 在计算机出现以前,统计计算总是依赖一堆函数表。使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。1. 离散分布 程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。其中常用的离散分布有: BernoulliDistr
9、ibutionp 贝努利分布。 BinomialDistributionn,p 二项分布。 GeometricDistributionp 几何分布。 HypergeometricDistributionn,M,N 超几何分布。 PoissonDistribution 泊松分布。 DiscreteUniformDistributionn 离散的均匀分布。 NegativeBinomialDistributionn,p 负二项分布。 以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。真正进行计算的是下面的求值函数,它们使用以上
10、的分布表达式作为一个参数。 常用的求值函数有: Domaindist 求dist的定义域。 PDFdist,x 求点x处的分布dist的密度值。 CDFdist,x 求点x处的分布函数值。 Quantiledist,q 求x,使CDFdist,x达到q。Meandist 求分布dist的期望。 Variancedist 求方差。 StandardDeviationdist 求标准差。 ExpectedValuef,dist,x 求Ef(x)。 CharacteristicFunctiondist,t 求特征函数(t)。 Randomdist 求具有分布dist的伪随机数。 RandomArra
11、ydist,dims 求维数为dims的伪随机数的数组。例3 观察下面二项分布的各种基本计算。 In1:= Statistics DiscreteDistributions In2:= b=BinomialDistributionn,p Out2=BinomialDistributionn,p In3:=Meanb Out3=np In4:=Varianceb Out4= n(1-p)p In5:=CharacteristicFunctionb,t Out5= (1-p+e it p)n In6:=b=BinomialDistribution10,0.3 Out6= BinomialDistr
12、ibution10,0.3 In7:=Domainb Out7= 0,1,2,3,4,5,6,7,8,9,10 In8:=PDFb,4 Out8= 0.200121 In9:=CDFb,3.9 Out9= 0.649611 In10:=CDFb,4 Out10= 0.849732 In11:=Varianceb Out11= 2.1说明:在上例中,首先调入程序文件。In2用b表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。In3In5进行的是符号运算,可以得到期望、方差等的一般公式。这是本程序与一般统计软件的不同之处,充分体现了Mathemati
13、ca的特色。接下来给出具体的参数值,进行数值计算,这些计算取代了查表。以下是一些更广泛、深入的例子。例4 观察下面离散分布的各种计算。 In1:= Statistics DiscreteDistributions In2:= h=HypergeometricDistributionn,M,N; Meanh Out3= In4:=Varianceh Out4= In5:= p=PoissonDistribution5; PDFp,2 Out6= In7:=N% Out7=0.0842243 In8:=PDFp,20 /N Out8=2.6412110-7 In9:=NCDFp,20,20 Out
14、9=0.999999912 In10:=ExpectedValuex2,p,x Out10=30 In11:=RandomArrayp,2,10 Out11=3,4,6,10,2,5,7,2,5,5, 4,3,2,11,5,4,2,2,4,6说明:在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望和方差公式就与教科书上的相同了。In5中给出的参数是准确数5,Mathematica在下面进行的仍是符号计算,得到准确结果。如果参数改为5.0 ,则计算结果就都是近似值了。In10是求E2,ExpectedValue是一个很有用的函数,务必注意。除了以上介绍的内容外,还有些不常用的函数本书没有列出,有兴趣的读者可以浏览He
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1