数学建模作业 实验6数理统计实验.docx

上传人:b****4 文档编号:11559141 上传时间:2023-03-19 格式:DOCX 页数:13 大小:54.11KB
下载 相关 举报
数学建模作业 实验6数理统计实验.docx_第1页
第1页 / 共13页
数学建模作业 实验6数理统计实验.docx_第2页
第2页 / 共13页
数学建模作业 实验6数理统计实验.docx_第3页
第3页 / 共13页
数学建模作业 实验6数理统计实验.docx_第4页
第4页 / 共13页
数学建模作业 实验6数理统计实验.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

数学建模作业 实验6数理统计实验.docx

《数学建模作业 实验6数理统计实验.docx》由会员分享,可在线阅读,更多相关《数学建模作业 实验6数理统计实验.docx(13页珍藏版)》请在冰豆网上搜索。

数学建模作业 实验6数理统计实验.docx

数学建模作业实验6数理统计实验

实验6数理统计实验

1.区间估计

解:

(1)根据题意,用R软件求解

>X<-c(1067,919,1196,785,1126,936,918,1156,920,948)

>t.test(X,al="g")

得到如下结果:

OneSamplet-test

data:

X

t=23.9693,df=9,p-value=9.148e-10

alternativehypothesis:

truemeanisgreaterthan0

95percentconfidenceinterval:

920.8443Inf

sampleestimates:

meanofx

997.1

由此知道这批灯泡中大约95%的灯泡至少使用920.8443小时。

(2)

> x<-c(1067,919,1196,785,1126,936,918,1156,920,948)

> x

 [1] 1067  919 1196  785 1126  936  918 1156  920  948

>  pnorm(1000,mean(x),sd(x))

[1] 0.5087941

 

x<=1000的概率为0.5087941,

故x大于1000的概率为0.4912059

即这个星期生产出的灯泡能使用1000h以上的概率为0.4912059。

2.假设检验I

解:

根据题意,用R软件求解

> x<-c(220, 188, 162, 230, 145, 160, 238, 188, 247, 113, 126, 245, 164, 231, 256, 183, 190, 158, 224, 175)

> t.test(x,mu=225,alternative="less")

 

        One Sample t-test

 

data:

  x 

t = -3.4783, df = 19, p-value = 0.001258

alternative hypothesis:

 true mean is less than 225 

95 percent confidence interval:

     -Inf 208.4806 

sample estimates:

mean of x 

   192.15 

油漆工人的血小板计数与正常成年男子有差异。

p值为0.002516小于0.05,原假设不成立,

因此认为油漆作业对男子血小板含量有影响。

3.假设检验II

解:

根据题意:

建立检验假设,确定检验水准:

H0:

1=2即阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数相等;H1:

1≠2即阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数不相等;=0.05。

使用t检验,若两组数据方差相同时,编辑R软件程序如下:

>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.40)

>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)

>t.test(x,y,var.equal=TRUE)

得到如下结果:

TwoSamplet-test

data:

xandy

t=-0.6419,df=38,p-value=0.5248

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.3261791.206179

sampleestimates:

meanofxmeanofy

2.0652.625

分析结果,p-value=0.5248>0.05,所以接受原假设H0,即试验组与对照组没有显著差异。

根据题意,若两组数据方差不同时,利用R软件进行t检验:

>t.test(x,y)

得到如下结果

WelchTwoSamplet-test

data:

xandy

t=-0.6419,df=36.086,p-value=0.525

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.329261.20926

sampleestimates:

meanofxmeanofy

2.0652.625

因此试验组与对照组的没有显著差异。

进行成对t检验:

>t.test(x,y,paired=TRUE)

得到如下结果:

Pairedt-test

data:

xandy

t=-0.6464,df=19,p-value=0.5257

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

-2.3731461.253146

sampleestimates:

meanofthedifferences

-0.56

即试验组与对照组的结果也没有显著差异。

故三中检验的结果都显示两组数据均值无差异。

对比三种检验方式,如果两个样本是成对的,应该使用成对的t检验,如果不使用成对t检验,t值会变小,p值会变大,准确性差了很多。

(2)方差检验:

>var.test(x,y)

得到如下结果:

Ftesttocomparetwovariances

data:

xandy

F=1.5984,numdf=19,denomdf=19,p-value=0.3153

alternativehypothesis:

trueratioofvariancesisnotequalto1

95percentconfidenceinterval:

0.63265054.0381795

sampleestimates:

ratioofvariances

1.598361

故两组数据方差相同。

4.假设检验III

解:

根据题意提出假设:

建立检验假设,确定检验水准:

H0:

p=p0=2%即患病率相符;H1:

p≠p0即患病率不符;=0.05。

使用R软件进行校验:

>binom.test(400,10000,p=0.002)

得到如下结果:

Exactbinomialtest

data:

400and10000

numberofsuccesses=400,numberoftrials=10000,p-value<

2.2e-16

alternativehypothesis:

trueprobabilityofsuccessisnotequalto0.002

95percentconfidenceinterval:

0.036243780.04402702

sampleestimates:

probabilityofsuccess

0.04

检验出P-值<0.05,因此不符合原假设,即这组数据不能说明乳腺癌的患病率与家族遗传有关。

5.分布检验I

解:

根据题意提出假设:

建立检验假设,确定检验水准:

H0:

结果符合自由组合规律;H1:

结果不符合自由组合规律;=0.05。

使用R软件进行校验,利用pearson卡方检验是否符合特定分布:

>chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)

得到如下结果:

Chi-squaredtestforgivenprobabilities

data:

c(315,101,108,32)

X-squared=0.47,df=3,p-value=0.9254

分析结果结果p-值为0.9254>0.05,所以接受原假设,即此结果符合自由组合规律。

6.分布检验II

解:

根据题意提出假设:

建立检验假设,确定检验水准:

H0:

每分钟顾客数X服从Poisson分布;H1:

每分钟顾客数X不服从Poisson分布;=0.1。

使用R软件进行校验:

首先利用pearson卡方检验是否符合泊松分布:

>X<-0:

5;Y<-c(92,68,28,11,1,0)

>q<-ppois(X,mean(rep(X,Y)));

>n<-length(Y)

>p<-numeric(n);

>p[1]<-q[1];

>p[n]<-1-q[n-1];

>for(iin2:

(n-1))

+p[i]<-q[i]-q[i-1]

>chisq.test(Y,p=p)

得到如下结果:

Chi-squaredtestforgivenprobabilities

data:

Y

X-squared=2.1596,df=5,p-value=0.8267

警告信息:

Inchisq.test(Y,p=p):

Chi-squared近似算法有可能不准

得到警告,因为Pearsonχ2检验要求在分组后,至少要大于等于5,而后两组中出现的顾客数是1,0,均小于5,重新分组,合并频数小于5的组:

>Z<-c(92,68,28,12)

>n<-length(Z);p<-p[1:

n-1];p[n]<-1-q[n-1]

>chisq.test(Z,p=p)

得到如下结果:

Chi-squaredtestforgivenprobabilities

data:

Z

X-squared=0.9113,df=3,p-value=0.8227

分析结果,p-值为0.8227>0.1,因此,接受原假设,即每分钟顾客数X服从Poisson分布。

7.分布检验III

解:

根据打进的电话时间算出时间间隔:

1:

00

1:

06

1:

08

1:

16

1:

22

1:

23

1:

34

1:

44

1:

47

1:

51

1:

57

6

2

8

6

1

11

10

3

4

6

建立检验假设,确定检验水准:

H0:

打进电话的时间间隔服从指数分布;H1:

打进电话的时间间隔不服从指数分布;=0.05。

假设指数分布的参数λ为

=0.1,利用R软件进行检验:

x<-c(6,2,8,6,1,11,10,3,4,6)

ks.test(x,"pexp",0.1)

得到如下结果:

One-sampleKolmogorov-Smirnovtest

data:

x

D=0.3329,p-value=0.2178

alternativehypothesis:

two-sided

因此P-值为0.2178>0.05,因此接受原假设,即打进电话的时间间隔是否服从指数分布。

8.列联表检验I

解:

根据题意,利用R软件输入数据,使用chisq.test()作检验。

>compare<-matrix(c(28,42,34,31,23,9,7,11,13,7,15,20),nr=2,dimnames=list(c("女性","男性"),c("配偶","父母","子女","兄弟姐妹","姻亲","其他亲属")))

>chisq.test(compare,correct=TRUE)

得到如下结果:

Pearson'sChi-squaredtest

data:

compare

X-squared=12.4666,df=5,p-value=0.02892

由于p-值为0.02892<0.05,因此拒绝原假设,认为女性和男性在关于给谁买节日礼物最难的看法上是有显著差异的。

9.列联表检验II

解:

根据题意,其所给数据不满足χ2检验条件,固使用Fisher精确检验。

>x<-matrix(c(9,1,3,3),nc=2)

>fisher.test(x)

得到如下结果:

Fisher'sExactTestforCountData

data:

x

p-value=0.1181

alternativehypothesis:

trueoddsratioisnotequalto1

95percentconfidenceinterval:

0.4313171521.0928115

sampleestimates:

oddsratio

7.63506

由此计算出的p-值=0.1181>0.05,并且区间估计得到的区间包含有1,因此说明两个变量是独立的,即认为左右半球恶性肿瘤的发病率并无显著差异。

10.Wilcoxon秩和检验I

(1)解:

因为Wilcoxon秩和检验本质只需排出样本的秩次,而且题目中的数据本身就是一个排序,因此可直接使用,编写R程序如下:

>x<-c(3,5,7,9,10)

>y<-c(1,2,4,6,8)

>wilcox.test(x,y,alternative="greater")

得到如下结果:

Wilcoxonranksumtest

data:

xandy

W=19,p-value=0.1111

alternativehypothesis:

truelocationshiftisgreaterthan0

得到的p-值为0.1111>0.05,因此接受原假设,即并不能认为新的教学效果显著优于原方法。

(2)同第一问,编写R程序如下:

>x<-c(4,6,7,9,10)

>y<-c(1,2,3,5,8)

>wilcox.test(x,y,alternative="greater")

得到如下结果:

Wilcoxonranksumtest

data:

xandy

W=21,p-value=0.04762

alternativehypothesis:

truelocationshiftisgreaterthan0

得到的p-值为0.0.04762<0.05,因此拒绝原假设,即认为新方法比原方法显著提高了教学效果。

11.Wilcoxon秩和检验II

解:

根据题意,可以将不同方法治疗后的结果用5个不同的值表示,1表示最差,5表示最好,这样就可以为这些病人排序,因此,可用Wilcoxon秩和检验来分析问题。

编写R程序:

>x<-rep(1:

5,c(0,1,9,7,3))

>y<-rep(1:

5,c(2,2,11,4,1))

>wilcox.test(x,y,exact=F)

得到如下结果:

Wilcoxonranksumtestwithcontinuitycorrection

data:

xandy

W=266,p-value=0.05509

alternativehypothesis:

truelocationshiftisnotequalto0

由计算结果知道p-的值为0.05509大于0.05,不能拒绝原假设,尚不能认为新方法的疗效显著优于原疗法。

 

6.3加分实验

解:

(1)使用Matlab和R软件两种方法求解(两种思路)

(i)第一问使用两种方法求解(Matlab和R软件)

使用Matlab求解:

对题目意思的理解说明:

1)题目中的正态分布N(100,4)中的4看做标准差,若为方差,可以在程序中将sigma改为2即可。

2)电脑根据称重情况T判断是否符合设定个数n的原则:

round(T/100)=n就表示满足要求。

应用MC方法对系统进行模拟,系统模拟封装100万盒螺母,源程序如下:

>>functiony=test2(n)

%%该程序计算一直终端控制个数时,求P(m<200),即实际个数小于200的个数

%%采用MC算法

%%输入参数:

n表示终端控制个数,输出为概率y

max=210;

mu=100;

sigma=4;

T=0;

all=1000000;

out=0;

D=tril(ones(max,max),0);%下三角矩阵

fort=1:

all

ifmod(t,all/100)==0

disp(['正在计算次数',num2str(t),'剩余次数',num2str(all-t),'请等待...']);

end

T0=normrnd(mu,sigma,max,1);%生成一批螺母

T0=D*T0;%累加螺母重量

T=normrnd(T0,3);%机器称重

T=round(T/100);%机器估算个数

iffind(T==n)<200%实际个数小于200就计数

out=out+1;

end

end%fort

y=out/all;

end

得到设定202个可以满足要求。

具体结果如下表所示:

设定个数

实际个数少于200个的概率

200

0.1767

201

0.0036

202

5.00E-06

203

0

使用R软件求解:

若使用R软件进行求解,可套用现成的函数,题目可以理解为当测量总重量W>=N*100的时候装盒结束,N为电脑设置的。

盒子中实际的螺母数量是随机的,可能比N大也可能比N小。

目的是当W刚好大于N*100的时候,实际螺母数量<=199的概率小于0.0001。

这个条件可以认为等价于装到199个的时候,总重量W_199>=N*100的概率小于0.0001。

W_199等于199个螺母重量加上秤的误差,所以分布为N(199*100,sqrt(199*4^2+3^2))

从N=200开始增加,直到P(W_199>=N*100)小于0.0001

编程如下:

>sim<-function(n){

simfun<-function(aaaa){

x<-rnorm(300,100,4)

x<-cumsum(x)

which(x>=rnorm(300,100*n,3))[1]

}

y<-sapply(1:

1000000,simfun)

sum(y<200)/length(y)

}

带入数值进行运算:

>sim(200)

[1]0.038265

>sim(201)

[1]0.000242

>sim(202)

[1]0

由R软件得到的结果为将设定数目设定为202个。

(2)设终端设置为

个时,每盒螺母少于200个的概率为

,则用户需要200盒螺母,生产线停工的次数

服从

,平均停工次数为

计算平均损失可以计算为:

超过200个的成本+因停工造成的损失。

因此平均损失

利用Matlab代入上表数值计算得:

设定个数

平均损失(元)

200

0.1767

176700

201

0.0036

3800

202

5.00E-06

405

203

0

600

经比较发现,设定个数为202时,平均损失最小。

若使用R软件,在1(i)的基础上,1(ii)就很直接了,假设停工的概率为p,那么平均停工200*p次那么成本为200*N+p*200*5000

编程如下:

>cost<-function(N){

p<-1-pnorm(N*100,199*100,sqrt(4^2*199+3^2))

N*200+p*5000*200}

>cost(200:

205)

得到如下结果

[1]78388.2640400.5140400.0640600.0040800.0041000.00

所以202个的时候总cost最小

(2)设螺母个数为

,第

个螺母的重量

,其中

未知,且各螺母的重量相互独立,则一盒螺母的重量

电子称称量结果记为

,则当已知

时,

的条件分布为

根据条件方差的公式,可以计算出

的无条件方差为:

根据条件,无条件方差

可以根据前20个螺母的称重情况进行估计:

设五次的称重读数为:

,则无条件方差的估计量

其中

的算术平均值。

那么:

每个螺母的标准差估计值为:

有了估计值,代入问题1的程序就可以同样计算了。

由于没有

的实际数据,没有给出相应的计算结果。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1