概率统计实验.docx

资源描述

概率统计实验.docx

《概率统计实验.docx》由会员分享，可在线阅读，更多相关《概率统计实验.docx（14页珍藏版）》请在冰豆网上搜索。

概率统计实验.docx

概率统计实验

§13.6概率统计实验

[学习目标]

1．会用Mathematica求概率、均值与方差；

2．能进行常用分布的计算；

3．会用Mathematica进行期望和方差的区间估计；

4．会用Mathematica进行回归分析。

概率统计是最需要使用计算机的领域，过去依靠计算器进行统计计算，由于计算机的普及得以升级换代。

本节介绍Mathematica自带的统计程序包，其中有实现常用统计计算的各种外部函数。

一、样本的数字特征

1.一元的情况

Mathematica的内部没有数理统计方面的功能，但是带有功能强大的数理统计外部程序，由多个程序文件组成。

它们在标准扩展程序包集的Statistic程序包子集中，位于目录

D：

\Mathematica\4.0\AddOns\StandardPackages\Statistics

下。

通过查看Help，可以找到包含所需外部函数的程序文件名。

在程序文件DescriptiveStatistics.m中，含有实现一元数理统计基本计算的函数，常用的有：

SampleRange[data]求表data中数据的极差（最大数减最小数）。

Median[data]求中值。

Mean[data]求平均值

。

Variance[data]求方差（无偏估计）

。

StandardDeviation[data]求标准差（无偏估计）

。

VarianceMLE[data]求方差

。

StandardDeviationMLE[data]求标准差

。

实际上程序文件中的函数很多，这里只列出了最常用的函数，其它计算函数可以通过Help浏览。

例1给出一组样本值：

6.5，3.8，6.6，5.7，6.0，6.4，5.3，计算样本个数、最大值、最小值、均值、方差、标准差等。

解：

In[1]：

In[2]：

=data={6.5，3.8，6.6，5.7，6.0，6.4，5.3}；

In[3]：

=Length[data]

Out[3]=7

In[4]：

=Min[data]

Out[4]=3.8

In[5]：

=Max[data]

Out[5]=6.6

In[6]：

=SampleRange[data]

Out[6]=2.8

In[7]：

=Median[data]

Out[7]=6.

In[8]：

=Mean[data]

Out[8]=5.75714

In[9]：

=Variance[data]

Out[9]=0.962857

In[10]：

=StandardDeviation[data]

Out[10]=0.981253

In[11]：

=VarianceMLE[data]

Out[11]=0.825306

In[12]：

=StandardDeviationMLE[data]

Out[12]=0.908464

说明：

在上例中，In[1]首先调入程序文件，求数据个数、最大值和最小值使用内部函数。

2.多元的情况

在程序文件MultiDescriptiveStatistics.m中，含有实现多元数理统计基本计算的函数，常用的有：

SampleRange[data]求表data中数据的极差。

Median[data]求中值。

Mean[data]求平均值。

Variance[data]求方差（无偏估计）。

StandardDeviation[data]求标准差（无偏估计）。

VarianceMLE[data]求方差。

StandardDeviationMLE[data]求标准差。

Covariance[xlist，ylist]求x，y的协方差（无偏估计）

。

CovarianceMLE[xlist，ylist]求x，y的协方差

。

Correlation[xlist，ylist]求x，y的相关系数

。

实际上程序文件中的函数很多，这里只列出了最常用的函数，其它计算函数可以通过Help浏览。

例2给出4个样本值：

{1.1，2.0，3.2}，{1.3，2.2，3.1}，{1.15，2.05，3.35}，{1.22，2.31，3.33}，计算样本个数、均值、方差、标准差等。

解：

In[1]：

In[2]：

=data={{1.1，2.0，3.2}，{1.3，2.2，3.1}，

{1.15，2.05，3.35}，{1.22，2.31，3.33}}；

Length[data]

Out[3]=4

In[4]：

=SampleRange[data]

Out[4]={0.2，0.31，0.25}

In[5]：

=Median[data]

Out[5]={1.185，2.125，3.265}

In[6]：

=Mean[data]

Out[6]={1.1925，2.14，3.245}

In[7]：

=Variance[data]

Out[7]={0.00755833，0.0200667，0.}

In[8]：

=VarianceMLE[data]

Out[8]={0.00566875，0.01505，0.010325}

In[9]：

=CentralMoment[data，2]

Out[9]={0.00566875，0.01505，0.010325}

In[10]：

=x=data[[All，1]]；y=data[[All，2]]；

z=data[[All，3]]；

In[11]：

=Covariance[x，y]

Out[11]=0.0093

In[12]：

=Covariance[z，z]

Out[12]=0.

In[13]：

=CovarianceMLE[y，y]

Out[13]=0.01505

In[14]：

=Correlation[y，z]

Out[14]=0.

In[15]：

=Correlation[x，x]

Out[15]=1.

二、常用分布的计算

在计算机出现以前，统计计算总是依赖一堆函数表。

使用本节介绍的函数可以取代查表，为实现各种统计计算的自动化做好了底层准备工作。

1.离散分布

程序文件DiscreteDistributions.m中，含有用于离散分布计算的函数。

其中常用的离散分布有：

BernoulliDistribution[p]贝努利分布。

BinomialDistribution[n，p]二项分布。

GeometricDistribution[p]几何分布。

HypergeometricDistribution[n，M，N]超几何分布。

PoissonDistribution[λ]泊松分布。

DiscreteUniformDistribution[n]离散的均匀分布。

NegativeBinomialDistribution[n，p]负二项分布。

以上函数中的参数，既可以是数值的，也可以是符号的。

使用这些函数只能按用户给出的参数建立一个表达式，并不能返回任何其它结果。

真正进行计算的是下面的求值函数，它们使用以上的分布表达式作为一个参数。

常用的求值函数有：

Domain[dist]求dist的定义域。

PDF[dist，x]求点x处的分布dist的密度值。

CDF[dist，x]求点x处的分布函数值。

Quantile[dist，q]求x，使CDF[dist，x]达到q。

Mean[dist]求分布dist的期望。

Variance[dist]求方差。

StandardDeviation[dist]求标准差。

ExpectedValue[f，dist，x]求Ef（x）。

CharacteristicFunction[dist，t]求特征函数φ（t）。

Random[dist]求具有分布dist的伪随机数。

RandomArray[dist，dims]求维数为dims的伪随机数的数组。

例3观察下面二项分布的各种基本计算。

In[1]：

In[2]：

=b=BinomialDistribution[n，p]

Out[2]=BinomialDistribution[n，p]

In[3]：

=Mean[b]

Out[3]=np

In[4]：

=Variance[b]

Out[4]=n（1-p）p

In[5]：

=CharacteristicFunction[b，t]

Out[5]=（1-p+eitp）n

In[6]：

=b=BinomialDistribution[10，0.3]

Out[6]=BinomialDistribution[10，0.3]

In[7]：

=Domain[b]

Out[7]={0，1，2，3，4，5，6，7，8，9，10}

In[8]：

=PDF[b，4]

Out[8]=0.200121

In[9]：

=CDF[b，3.9]

Out[9]=0.649611

In[10]：

=CDF[b，4]

Out[10]=0.849732

In[11]：

=Variance[b]

Out[11]=2.1

说明：

在上例中，首先调入程序文件。

In[2]用b表示具有符号参数的二项分布，这一步只是为了后面输入时方便，并非必需的，也可以使用嵌套省略这一步。

In[3]~In[5]进行的是符号运算，可以得到期望、方差等的一般公式。

这是本程序与一般统计软件的不同之处，充分体现了Mathematica的特色。

接下来给出具体的参数值，进行数值计算，这些计算取代了查表。

以下是一些更广泛、深入的例子。

例4观察下面离散分布的各种计算。

In[1]：

In[2]：

=h=HypergeometricDistribution[n，M，N]；

Mean[h]

Out[3]=

In[4]：

=Variance[h]

Out[4]=

In[5]：

=p=PoissonDistribution[5]；

PDF[p，2]

Out[6]=

In[7]：

=N[%]

Out[7]=0.0842243

In[8]：

=PDF[p，20]//N

Out[8]=2.64121×10-7

In[9]：

=N[CDF[p，20]，20]

Out[9]=0.999999912

In[10]：

=ExpectedValue[x^2，p，x]

Out[10]=30

In[11]：

=RandomArray[p，{2，10}]

Out[11]={{3，4，6，10，2，5，7，2，5，5}，

{4，3，2，11，5，4，2，2，4，6}}

说明：

在上例中表明，超几何分布的参数按我国教科书的习惯来表示，这里求出的期望和方差公式就与教科书上的相同了。

In[5]中给出的参数是准确数5，Mathematica在下面进行的仍是符号计算，得到准确结果。

如果参数改为5.0，则计算结果就都是近似值了。

In[10]是求Eξ2，ExpectedValue是一个很有用的函数，务必注意。

除了以上介绍的内容外，还有些不常用的函数本书没有列出，有兴趣的读者可以浏览He

展开阅读全文