ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:32.35KB ,
资源ID:6581830      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6581830.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学R语言作业答案.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

统计学R语言作业答案.docx

1、统计学R语言作业答案第二章2、(1) data=read.csv(管理学院2007级学生统计学课程成绩.csv,head=TRUE) 平均数=mean(data,2);方差=var(data,2);标准差=sd(data,2);中位数=median(data,2);离散系数=标准差/平均数;全距=max(data,2)-min(data,2); 四分位距=quantile(data,2,probs=0.75)-quantile(data,2,probs=0.25) data=data,-1 不及格率=length(datadata 平均数;方差;标准差;中位数;四分位距;离散系数;全距;不及格

2、率1 79.29771 167.76061 12.952241 80.975 75% 15.975 1 0.16333691 72.81 0.08865248(2) data=read.csv(管理学院2007级学生统计学课程成绩.csv,head=TRUE) data=data,-1 data1=data1:141 data2=data142:282 平均数1=mean(data1);平均数2=mean(data2) 平均数1;平均数21 81.908161 76.68723 方差1=var(data1);方差2=var(data2) 方差1;方差21 113.22251 209.7706

3、标准差1=sd(data1);标准差2=sd(data2) 标准差1;标准差21 10.640611 14.48346 中位数1=max(data1)-min(data1);中位数2=max(data2)-min(data2) 中位数1;中位数21 54.21 72.8 四分位距1=quantile(data1,probs=0.75)-quantile(data1,probs=0.25);四分位距2=quantile(data2,probs=0.75)-quantile(data2,probs=0.25) 四分位距1;四分位距2 75% 12.35 75% 18.8 离散系数1=标准差1/平均

4、数1;离散系数2=标准差2/平均数2 离散系数1;离散系数21 0.1299091 0.188864 全距1=max(data1)-min(data1);全距2=max(data2)-min(data2) 全距1;全距21 54.21 72.8 不及格率1=length(data1data160)/length(data1); 不及格率2=length(data2data2 不及格率1; 不及格率21 0.035460991 0.141844(3) plot.new() figureparameter=par(mfrow=c(2,2),bg=light green,cex.lab=1,font

5、=3) hist(data1);hist(data2)分析:会计学和经济大类都是左偏分布,成绩集中分布于8090分,可见普遍成绩较好。经济大类的高分段(9095)比例又高于会计学,同时不及格率也高于会计学,可见经济大类的成绩离散程度高于会计,这从上面得出的数据中也可以得到验证(4) 样本=sample(data,40, replace = FALSE) 均值=mean(样本);均值1 81.07125 方差=var(样本);方差1 148.8133 标准差=sd(样本);标准差1 12.19891 中位数=median(样本);中位数1 81.425 四分位距=quantile(样本,prob

6、s=0.75)-quantile(样本,probs=0.25);四分位距 75% 17.7 离散系数=标准差/均值;离散系数1 0.1504714 全距=max(样本)-min(样本);全距1 55.9 不及格率=length(样本样本 summary(data);summary(样本) Min. 1st Qu. Median Mean 3rd Qu. Max. 27.20 72.80 80.97 79.30 88.78 100.00 Min. 1st Qu. Median Mean 3rd Qu. Max. 44.10 74.35 81.43 81.07 92.05 100.00经对比,可以

7、看出样本得出的均值、中位数、四分位距高于总体数据,方差、标准差、离散系数、全距均、不及格率低于总体数据,原因推测为总体为左偏分布,所以高分同学被抽取的概率大于低分同学导致样本总体测值偏高,所以我认为可行的改进方法是进行分层抽样,这样抽到的数据更有代表性。第三章作业1、(1) 下侧分位点=qchisq(0.025,10);上侧分位点=qchisq(0.975,10);下侧分位点;上侧分位点1 3.2469731 20.48318(2) pnorm(1.96,0,1)1 0.9750021(3) pt(1.96,5)1 0.946356(4) pt(1.96,15)1 0.9655779(5) p

8、t(1.96,45)1 0.97189712、(1) data=read.csv(概率论与数理统计课程成绩数据.csv,head=TRUE) x=data,1 hist(x, probability = TRUE,main = paste(Histogram of , 概率论与数理统计课程成绩), xlab = 分数)(2) xbar=mean(x);sdx=sd(x);xbar;sdx1 80.571431 12.61278(3) p1=length(xx=70)/length(x);p2=length(xx p1=pnorm(70,xbar,sdx);p2=pnorm(75,xbar,sd

9、x);p1;p21 0.20097261 0.3293427第四章作业3、(1) x=c(202,209,214,198,206,210,196,208,200,207) xbar=mean(x);var=var(x);n=length(x);df=n-1 t=qt(0.975,df);t1 2.262157 max=xbar+t*sqrt(var/n);min=xbar-t*sqrt(var/n) min;max1 200.86991 209.1301所以,置信区间是 (200.8699,209.1301)(2) z1=qt(0.025,n-1);z2=qt(0.975,n-1);z1;z2

10、1 -2.2621571 2.262157 z=(xbar-200)/sqrt(var/n);z1 2.738613 zz11 TRUE z r=t*sqrt(var/n);r1 4.130115 t=qt(0.995,df);t1 3.249836 n=var*t2/r2;n1 20.63846所以,应抽取21根材料进行测试第五章作业1、 data=read.csv(CH8偏相关商客旅.csv) data=data,2:4 data=scale(data) 协方差=cov(data);协方差 商业投资 游客增率 经济增率商业投资 1.0000000 0.7908555 0.6436569游客

11、增率 0.7908555 1.0000000 0.7733829经济增率 0.6436569 0.7733829 1.0000000 相关系数=cor(data);相关系数 商业投资 游客增率 经济增率商业投资 1.0000000 0.7908555 0.6436569游客增率 0.7908555 1.0000000 0.7733829经济增率 0.6436569 0.7733829 1.0000000 data=read.csv(某矿2006年1月三项数据.csv) data=scale(data,2:4) 协方差=cov(data);协方差 生产原煤 掘进进尺 检修时间生产原煤 1.000

12、0000 -0.27354970 -0.15627328掘进进尺 -0.2735497 1.00000000 0.01287778检修时间 -0.1562733 0.01287778 1.00000000 相关系数=cor(data);相关系数 生产原煤 掘进进尺 检修时间生产原煤 1.0000000 -0.27354970 -0.15627328掘进进尺 -0.2735497 1.00000000 0.01287778检修时间 -0.1562733 0.01287778 1.00000000经过对比,可得:对于标准化数据来说,变量之间的协方差矩阵就是其相关系数矩阵2、(1) data=rea

13、d.csv(CH8偏相关商客旅.csv) data=data,2:4 协方差=cov(data);相关系数=cor(data) data2=5*data 协方差2=cov(data2);相关系数2=cor(data2) 协方差2/协方差 商业投资 游客增率 经济增率商业投资 25 25 25游客增率 25 25 25经济增率 25 25 25 相关系数2/相关系数 商业投资 游客增率 经济增率商业投资 1 1 1游客增率 1 1 1经济增率 1 1 1综上:把三个变量的值同乘常数5后,其协方差矩阵扩大25倍,扩大的倍数分别为各自相关变量扩大倍数的乘积、相关系数矩阵不变。(2) data3=da

14、ta,-3 data3=5*data3 data4=8*data,3 data3=cbind(data3,data4) 协方差3=cov(data3);相关系数3=cor(data3) 协方差3/协方差 商业投资 游客增率 data4商业投资 25 25 40游客增率 25 25 40data4 40 40 64 相关系数3/相关系数 商业投资 游客增率 data4商业投资 1 1 1游客增率 1 1 1data4 1 1 1综上:前两个变量乘以常数5,最后一个变量乘以常数8后,其协方差矩阵中,商业投资和游客增长率的协方差扩大25倍,商业投资和游客增长率与经济增率的协方差分别扩大40倍,经济增

15、率扩大64倍,扩大的倍数分别为各自相关变量扩大倍数的乘积,相关系数矩阵不变。第六章作业Variables Entered/RemovedbModelVariables EnteredVariables RemovedMethod1掘进进尺ma.Entera. All requested variables entered.b. Dependent Variable: 生产原煤tModel SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.919a.845.8333521271.109a. Predictors:

16、(Constant), 掘进进尺mANOVAbModelSum of SquaresdfMean SquareFSig.1Regression8.809E1418.809E1471.043.000aResidual1.612E14131.240E13Total1.042E1514a. Predictors: (Constant), 掘进进尺mb. Dependent Variable: 生产原煤tCoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)469247.5471533441.666.306.764掘进进尺m220.09826.113.9198.429.000a. Dependent Variable: 生产原煤t方程为:y=469247.547+220.098x因为P值为0.00,所以拒绝原假设

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1