概率统计实验.docx

上传人:b****1 文档编号:409184 上传时间:2022-10-09 格式:DOCX 页数:14 大小:49.30KB
下载 相关 举报
概率统计实验.docx_第1页
第1页 / 共14页
概率统计实验.docx_第2页
第2页 / 共14页
概率统计实验.docx_第3页
第3页 / 共14页
概率统计实验.docx_第4页
第4页 / 共14页
概率统计实验.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

概率统计实验.docx

《概率统计实验.docx》由会员分享,可在线阅读,更多相关《概率统计实验.docx(14页珍藏版)》请在冰豆网上搜索。

概率统计实验.docx

概率统计实验

§13.6概率统计实验

[学习目标]

1.会用Mathematica求概率、均值与方差;

2.能进行常用分布的计算;

3.会用Mathematica进行期望和方差的区间估计;

4.会用Mathematica进行回归分析。

概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。

本节介绍Mathematica自带的统计程序包,其中有实现常用统计计算的各种外部函数。

一、样本的数字特征

1.一元的情况

Mathematica的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。

它们在标准扩展程序包集的Statistic程序包子集中,位于目录

D:

\Mathematica\4.0\AddOns\StandardPackages\Statistics

下。

通过查看Help,可以找到包含所需外部函数的程序文件名。

在程序文件DescriptiveStatistics.m中,含有实现一元数理统计基本计算的函数,常用的有:

SampleRange[data]求表data中数据的极差(最大数减最小数)。

Median[data]求中值。

Mean[data]求平均值

Variance[data]求方差(无偏估计)

StandardDeviation[data]求标准差(无偏估计)

VarianceMLE[data]求方差

StandardDeviationMLE[data]求标准差

实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。

例1给出一组样本值:

6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。

解:

In[1]:

=<

In[2]:

=data={6.5,3.8,6.6,5.7,6.0,6.4,5.3};

In[3]:

=Length[data]

Out[3]=7

In[4]:

=Min[data]

Out[4]=3.8

In[5]:

=Max[data]

Out[5]=6.6

In[6]:

=SampleRange[data]

Out[6]=2.8

In[7]:

=Median[data]

Out[7]=6.

In[8]:

=Mean[data]

Out[8]=5.75714

In[9]:

=Variance[data]

Out[9]=0.962857

In[10]:

=StandardDeviation[data]

Out[10]=0.981253

In[11]:

=VarianceMLE[data]

Out[11]=0.825306

In[12]:

=StandardDeviationMLE[data]

Out[12]=0.908464

说明:

在上例中,In[1]首先调入程序文件,求数据个数、最大值和最小值使用内部函数。

2.多元的情况

在程序文件MultiDescriptiveStatistics.m中,含有实现多元数理统计基本计算的函数,常用的有:

SampleRange[data]求表data中数据的极差。

Median[data]求中值。

Mean[data]求平均值。

Variance[data]求方差(无偏估计)。

StandardDeviation[data]求标准差(无偏估计)。

VarianceMLE[data]求方差。

StandardDeviationMLE[data]求标准差。

Covariance[xlist,ylist]求x,y的协方差(无偏估计)

CovarianceMLE[xlist,ylist]求x,y的协方差

Correlation[xlist,ylist]求x,y的相关系数

实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。

例2给出4个样本值:

{1.1,2.0,3.2},{1.3,2.2,3.1},{1.15,2.05,3.35},{1.22,2.31,3.33},计算样本个数、均值、方差、标准差等。

解:

In[1]:

=<

In[2]:

=data={{1.1,2.0,3.2},{1.3,2.2,3.1},

{1.15,2.05,3.35},{1.22,2.31,3.33}};

Length[data]

Out[3]=4

In[4]:

=SampleRange[data]

Out[4]={0.2,0.31,0.25}

In[5]:

=Median[data]

Out[5]={1.185,2.125,3.265}

In[6]:

=Mean[data]

Out[6]={1.1925,2.14,3.245}

In[7]:

=Variance[data]

Out[7]={0.00755833,0.0200667,0.}

In[8]:

=VarianceMLE[data]

Out[8]={0.00566875,0.01505,0.010325}

In[9]:

=CentralMoment[data,2]

Out[9]={0.00566875,0.01505,0.010325}

In[10]:

=x=data[[All,1]];y=data[[All,2]];

z=data[[All,3]];

In[11]:

=Covariance[x,y]

Out[11]=0.0093

In[12]:

=Covariance[z,z]

Out[12]=0.

In[13]:

=CovarianceMLE[y,y]

Out[13]=0.01505

In[14]:

=Correlation[y,z]

Out[14]=0.

In[15]:

=Correlation[x,x]

Out[15]=1.

二、常用分布的计算

在计算机出现以前,统计计算总是依赖一堆函数表。

使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。

1.离散分布

程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。

其中常用的离散分布有:

BernoulliDistribution[p]贝努利分布。

BinomialDistribution[n,p]二项分布。

GeometricDistribution[p]几何分布。

HypergeometricDistribution[n,M,N]超几何分布。

PoissonDistribution[λ]泊松分布。

DiscreteUniformDistribution[n]离散的均匀分布。

NegativeBinomialDistribution[n,p]负二项分布。

以上函数中的参数,既可以是数值的,也可以是符号的。

使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。

真正进行计算的是下面的求值函数,它们使用以上的分布表达式作为一个参数。

常用的求值函数有:

Domain[dist]求dist的定义域。

PDF[dist,x]求点x处的分布dist的密度值。

CDF[dist,x]求点x处的分布函数值。

Quantile[dist,q]求x,使CDF[dist,x]达到q。

Mean[dist]求分布dist的期望。

Variance[dist]求方差。

StandardDeviation[dist]求标准差。

ExpectedValue[f,dist,x]求Ef(x)。

CharacteristicFunction[dist,t]求特征函数φ(t)。

Random[dist]求具有分布dist的伪随机数。

RandomArray[dist,dims]求维数为dims的伪随机数的数组。

例3观察下面二项分布的各种基本计算。

In[1]:

=<

In[2]:

=b=BinomialDistribution[n,p]

Out[2]=BinomialDistribution[n,p]

In[3]:

=Mean[b]

Out[3]=np

In[4]:

=Variance[b]

Out[4]=n(1-p)p

In[5]:

=CharacteristicFunction[b,t]

Out[5]=(1-p+eitp)n

In[6]:

=b=BinomialDistribution[10,0.3]

Out[6]=BinomialDistribution[10,0.3]

In[7]:

=Domain[b]

Out[7]={0,1,2,3,4,5,6,7,8,9,10}

In[8]:

=PDF[b,4]

Out[8]=0.200121

In[9]:

=CDF[b,3.9]

Out[9]=0.649611

In[10]:

=CDF[b,4]

Out[10]=0.849732

In[11]:

=Variance[b]

Out[11]=2.1

说明:

在上例中,首先调入程序文件。

In[2]用b表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。

In[3]~In[5]进行的是符号运算,可以得到期望、方差等的一般公式。

这是本程序与一般统计软件的不同之处,充分体现了Mathematica的特色。

接下来给出具体的参数值,进行数值计算,这些计算取代了查表。

以下是一些更广泛、深入的例子。

例4观察下面离散分布的各种计算。

In[1]:

=<

In[2]:

=h=HypergeometricDistribution[n,M,N];

Mean[h]

Out[3]=

In[4]:

=Variance[h]

Out[4]=

In[5]:

=p=PoissonDistribution[5];

PDF[p,2]

Out[6]=

In[7]:

=N[%]

Out[7]=0.0842243

In[8]:

=PDF[p,20]//N

Out[8]=2.64121×10-7

In[9]:

=N[CDF[p,20],20]

Out[9]=0.999999912

In[10]:

=ExpectedValue[x^2,p,x]

Out[10]=30

In[11]:

=RandomArray[p,{2,10}]

Out[11]={{3,4,6,10,2,5,7,2,5,5},

{4,3,2,11,5,4,2,2,4,6}}

说明:

在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望和方差公式就与教科书上的相同了。

In[5]中给出的参数是准确数5,Mathematica在下面进行的仍是符号计算,得到准确结果。

如果参数改为5.0,则计算结果就都是近似值了。

In[10]是求Eξ2,ExpectedValue是一个很有用的函数,务必注意。

除了以上介绍的内容外,还有些不常用的函数本书没有列出,有兴趣的读者可以浏览He

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1