ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:22.86KB ,
资源ID:9729459      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9729459.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(R的核密度估计和多元统计.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

R的核密度估计和多元统计.docx

1、R的核密度估计和多元统计R的核密度估计和多元统计R核密度估计KDE 密度估计函数density默认情况下在512个点上估计密度值这些估计点可能有些会分布在原始数据的左侧所以要查看原始数据后的密度图形我们需要从这些估值点选取比原始数据大的数据点。 libraryEcdat dataEarningspackageEcdat ind Earningsageg1 x Earningsyind/1000 f densityxn1000 froot densitysqrtxn1000 ind2 frootx sqrtminx 选取比原始数据大的数据点 plotfxfytypelylimc0.035xlim

2、c0100 ylabDensityyxlabyincome in 1000lwd2 ablineh0 f2 .5frooty / frootx linesfrootxind22 f2ind2typel ylimc0.035xlimc0100ylabDensityyxlabyincome in 1000 mainTKDElty2lwd2 ablineh0 legend60.03cKDETKDEltyc12lwd2 残差的获得R 如果模型拟合可以直接返回残差省事了直接用 否则我们可以使用residuals模型拟合结果 databmwpackageevir bmw as.vectorbmw nlen

3、gthbmw fitAR1 arimabmw order c10 0 acf fitAR1residualslag.max20 main acf residualsfitAR1lag.max20 main 两者结果一致 R语言多元统计包简介:各种假设检验 统计方法 聚类分析 数据处理 sas matlab R语言 Multivariate Statistics 多元统计 网址http:/cran.r-project.org/web/views/Multivariate.html 转http:/rbbs.biosino.org/Rbbs/posts/list/223.page 基本的R包已经实现

4、了传统多元统计的很多功能然而CRNA的许多其它包提供了更深入的多元统计方法下面做个简要的综述。多元统计的特殊应用在CRNA的其它任务列表task view里也会提及如排序ordination会在Environmetricshttp:/cran.r-project.org/web/views/Environmetrics.html里说到有监督的分类方法能在MachineLearninghttp:/cran.r-project.org/web/views/MachineLearning.html里找到无监督的分类在Clusterhttp:/cran.r-project.org/web/views/

5、Cluster.html里。 这里要综述的包主要分为以下几个部分 1 多元数据可视化Visualising multivariate data 绘图方法 基本画图函数如pairs、coplot和lattice包里的画图函数xyplot、splom可以画成对列表的二维散点图3维密度图。car包里的scatterplot.matrix函数提供更强大的二维散点图的画法。cwhmisc包集合里的cwhplot包的 pltSplomT函数类似pair画散点图矩阵而且可以在对角位置画柱状图或密度估计图。除此之外scatterplot3d包可画3维的散点图aplpack包里bagplot可画二变量的boxp

6、lotspin3R可画可旋转的三维点图。misc3d包有可视化密度的函数。 YaleToolkit包提供许多多元数据可视化技术agsemisc也是这样。更特殊的多元图包括aplpack包里的faces可画 Chernoffs faceMASS包里的parcoord可画平行坐标图矩阵的每一行画一条线横轴表示矩阵的每列graphics包里的stars可画多元数据的星状图矩阵的每一行用一个星状图表示。ade4包里的mstree和vegan包里的spantree可画最小生成树。 calibrate包支持双变量图和散点图chplot包可画convex hull图。geometry包提供了和qhull库的

7、接口由convexhulln可给出相应点的索引。ellipse包可画椭圆也可以用 plotcorr可视化相关矩阵。denpro包为多元可视化提供水平集树形结构level set trees。graphics包里的mosaicplot和vcd包里的mosaic函数画马赛克图mosaic plot。gclus包提供了针对聚类的散点图和平行坐标图。rggobi包和DescribeDisplay包是GGobi的接口DescribeDisplay的图可达到出版质量的要求xgobi包是XGobi和XGvis的接口可实现动态交互的图。最后iplots包提供强大的动态交互图尤其是平行坐标图和马赛克图。seri

8、ation包提供seriation方法能重新排列矩阵和系统树。 数据预处理 AIS 包提供多元数据的初步描述函数。Hmisc包里的summarize和summary.formula辅助描述数据varclus函数可做聚类而dataRep和find.matches找给定数据集的典型数据和匹配数据。KnnFinder包里的nn函数用kd-tree找相似变量的个数。dprep包为分类提供数据预处理和可视化函数如检查变量冗余性、标准化。base包里的dist和cluster包里的 daisy函数提供距离计算函数proxy包提供更多的距离测度包括矩阵间的距离。simba包处理已有数据和缺失数据包括相似性矩

9、阵和重整形。 2 假设检验Hypothesis testing ICSNP包提供霍特林HotellingsT2检验和许多非参检验方法包括基于marginal ranks的位置检验location test计算空间中值和符号形状估计。cramer包做两样本的非参检验SpatialNP可做空间符号和秩检验。 3 多元分布Multivariate distributions 描述统计Descriptive measures stats 包里的cov和and cor分别估计协方差和相关系数。ICSNP包提供几种数据描述方法如spatial.median估计空间中值其它的函数估计 scatter。MAS

10、S包里的cov.rob提供更健壮的方差/协方差矩阵估计。covRobust包用最近邻方差估计法估计协方差。 robustbase包的covMCD估计协方差和covOGK做Orthogonalized Gnanadesikan-Kettenring。rrcov包提供可扩展和稳健的估计函数covMcd、covMest。corpcor包可计算大规模的协方差和偏相关矩阵。 密度估计和模拟Densities estimation and simulation MASS 包的mvrnorm产生多元正态分布的随机数。Mvtnorm包有多元t分布和多元正态分布的概率和分位数函数还可计算多元正态分布的密度函数。

11、 mvtnormpcs包提供基于Dunnett的函数。mnormt包提供元t分布和多元正态分布的密度和分布函数并可产生随机数。sn包提供多元偏t 分布和偏正态分布的密度、分布、随机数函数。delt包提供了许多估计多元密度的函数方法如CART和贪婪方法。CRAN的Cluster任务列表http:/cran.r-project.org/web/views/Cluster.html有更全面的信息ks包里的rmvnorm.mixt和dmvnorm.mixt函数产生随机数和估计密度bayesm包里有多种拟合方法。很多地方都提供了模拟Wishart分布的函数如bayesm包里的rwishartMCMCpa

12、ck包里的rwish而且 MCMCpack包还有密度函数dwish。KernSmooth 包里的bkde2D和MASS包的kde2d做分箱binned或不分箱二维核密度估计。ks包也像ash和GenKern包样可做核平滑kernel smoothing。prim包用法找高维多元数据的高密度区域feature包可计算多元数据的显著特征。 正态检验Assessing normality mvnormtest 包提供Shapiro-Wilks检验的多元数据延伸方法mvoutlier包检测多元离群点outlierICS包可检验多元正态分布。 energy 包里的mvnorm.etest基于E统计量做正

13、态检验k.sample检验多个数据是否来自同一分布。dprep 包里的mardia用Mardia检验正态性。stats包里的mauchly.test可检验Wishart分布的协方差矩阵。 连接函数Copulas copula 包提供常规的copula函数的程序包括normal t Clayton Frank Gumbel。fgac包提供generalised archimedian copulamlCopulaSelection包可做二变量的copula。 4 线形模型Linear models stats 包里的lm可做多元线形模型anova.mlm比较多个多元线形模型manova做多元方差

14、分析MANOVA。sn包的 msn.mle和 and mst.mle可拟合多元偏正态和偏t分布模型。pls包提供偏最小二乘回归PLSR和主成分回归ppls包可做惩罚偏最小二乘回归dr包提供降维回归方法如.片逆回归法Sliced Inverse Regression、片平均方差估计sliced average variance estimation。plsgenomics包做基于偏最小二乘回归的基因组分析。relaimpo包可评估回归参数的相对重要性。 5 投影方法Projection methods 主成分Principal components stats 包的prcomp基于svd和pri

15、ncomp基于eigen能计算主成分。sca包做单分量分析。nFactors可评价碎石图Scree plotparan包可评估主成分分析得到的主成分和因子分析得到的因子。pcurve包做主曲线Principal Curve分析和可视化。gmodels包提供适合大矩阵的fast.prcomp和fast.svd。kernlab包里的kpca用核方法做非线性的主成分分析。pcaPP包用投影寻踪projection pursuit法计算稳健/鲁棒robust主成分。amap包的acpgen和acprob函数分别针对广义generalized和稳健robust主成分分析。主成分在很多方面也有相应的应用如

16、涉及生态的ade4包感官的SensoMinR包。psy包里有用于心理学的各种程序与主成分相关的有sphpca用球形直观表示相关矩阵类似于3D的PCAfpca图形展示主成分分析的结果而且允许某些变量间有相关性scree.plot图形展示相关或协方差矩阵的特征值。PTAk包做主张量分析Principal Tensor Analysis。smatr包提供关于异速生长allometry的函数。 典型相关Canonical Correlation stats包里的cancor是做典型相关的函数。kernlab包提供更稳健的核方法kcca。concor包提供了许多concordance methods。

17、冗余度分析Redundancy Analysis calibrate包里的rda函数可做冗余度分析和典型相关。fso包提供了模糊集排序Ordination方法。 独立成分Independent Components fastICA 包用fastICA算法做独立成分分析ICA和投影寻踪分析Projection Pursuitmlica包提供独立成分分析的最大似然拟合PearsonICA包用基于互信息的打分函数分离独立信号。ICS包能执行不变坐标系invariant coordinate system和独立成分分析independent components。JADE包提供就JADE算法的接口而且

18、可做一些 ICA。 普鲁克分析Procrustes analysis vegan包里的procrustes可做普鲁克分析也提供排序ordination函数。更一般的普鲁克分析可由FactoMineR包里的GPA实现。 6 主坐标/尺度方法Principal coordinates / scaling methods stats 包的cmdscale函数执行传统的多维尺度分析multidimensional scalingMDS主坐标分析Principal Coordinates AnalysisMASS包的sammon和isoMDS函数分别执行Sammon和Kruskal非度量多维尺度分析。v

19、egan包提供非度量多维尺度分析的包装wrappers和后处理程序。 7 无监督分类Unsupervised classification 聚类分析 CRAN 的Cluster任务列表全面的综述了R实现的聚类方法。stats里提供等级聚类hclust和k-均值聚类kmeans。cluster包里有大量的聚类和可视化技术clv包里则有一些聚类确认程序e1071包的classAgreement可计算Rand index比较两种分类结果。Trimmed k-means聚类分析可由trimcluster包实现聚类融合方法Cluster Ensembles由clue包实现clusterSim包能帮助选择

20、最佳的聚类hybridHclust包提供一些混合聚类方法。energy包里有基于E统计量的距离测度函数edist和等级聚类方法hclust.energy。LLAhclust包提供基于似然likelihood linkage方法的聚类也有评定聚类结果的指标。fpc包里有基于Mahalanobis距离的聚类。clustvarsel包有多种基于模型的聚类。模糊聚类fuzzy clustering可在cluster包和hopach包里实现。Kohonen包提供用于高维谱spectra或模式pattern的有监督和无监督的SOM算法。clusterGeneration包帮助模拟聚类。CRAN的Envir

21、onmetrics任务列表里也有相关的聚类算法的综述。mclust包实现了基于模型的聚类MFDA包实现了功能数据的基于模型的聚类。 树方法 CRAN 的MachineLearning任务列表有对树方法的细节描述。分类树也常常是重要的多元方法rpart包正是这样的包rpart.permutation包还可以做rpart模型的置换permutation检验。TWIX包的树可以外部剪枝。 hier.part包分割多元数据集的方差。mvpart包可做多元回归树party包实现了递归分割recursive partitioningrrp包实现了随机递归分割。caret包可做分类和回归训练进而caretL

22、SF包实现了并行处理。kknn包的k-近邻法可用于回归也可用于分类。 8 有监督分类和判别分析Supervised classification and discriminant analysis MASS 包里的lda和qda分别针对线性和二次判别分析。mda包的mda and fda允许混合和更灵活的判别分析mars做多元自适应样条回归multivariate adaptive regression splinesbruto做自适应样条后退拟合adaptive spline backfitting。earth包里也有多元自适应样条回归的函数。rda包可用质心收缩法shrunken cent

23、roids regularized discriminant analysis实现高维数据的分类。VR的class包的knn函数执行k-最近邻算法knncat包里有针对分类变量的k-最近邻算法。 SensoMineR包的FDA用于因子判别分析。许多包结合了降维dimension reduction和分类。klaR包可以做变量选择可处理多重共线性还有可视化函数。superpc包利用主成分做有监督的分类classPP 包则可为其做投影寻踪projection pursuitgpls包用广义偏最小二乘做分类。hddplot包用交叉验证的线性判别分析决定最优的特征个数。supclust包可以根据芯片数

24、据做基因的监督聚类。ROCR提供许多评估分类执行效果的方法。predbayescor包可做朴素贝叶斯naiumlve Bayes分类。关于监督分类的更多信息可以看MachineLearning任务列表。 9 对应分析Correspondence analysis MASS 包的corresp和mca可以做简单和多重对应分析。ca包提供单一、多重和联合joint对应分析。ade4包的ca和mca分别做一般的和多重对应分析。vegan包里也有类似的函数。cocorresp可实现两个矩阵间的co-correspondence分析。 FactoMineR 包的CA和MCA函数也能做类似的简单和多重对应

25、分析还有画图函数。homals执行同质分析homogeneity。 10 前向查找Forward search Rfwdmv包执行多元数据的前向查找。 11 缺失数据Missing data mitools 包里有缺失数据的多重估算multiple imputation的函数 mice包用chained equations实现了多重估算mvnmle包可以为多元正态数据的缺失值做最大似然估计ML Estimationnorm包提供了适合多元正态数据的估计缺失值的期望最大化算法EM algorithmcat包允许分类数据的缺失值的多重估算mix包适用于分类和连续数据的混合数据。pan包可为面版数据

26、panel data的缺失值做多重估算。VIM包做缺失数据的可视化和估算。Hmisc包的aregImpute和transcan提供了其它的估算缺失值方法。EMV包提供了knn方法估计缺失数据。monomvn包估计单调多元正态数据的缺失值。 12 隐变量方法Latent variable approaches stats 包的factanal执行最大似然因子分析MCMCpack包可做贝叶斯因子分析。GPArotation包提供投影梯度Gradient Projection旋转因子法。FAiR包用遗传算法作因子分析。ifa包可用于非正态的变量。sem包拟合线形结构方程模型。ltm包可做隐含式语义分

27、析 Latent semantic analysiseRm包则可拟合Rasch模型Rasch models。FactoMineR包里有很多因子分析的方法包括MFA多元因子分析HMFA等级多元因子分析ADFM定量和定性数据的多元因子分析。tsfa包执行时间序列的因子分析。poLCA包针对多分类变量polytomous variable做潜类别分析Latent Class Analysis。 13 非高斯数据建模Modelling non-Gaussian data bivpois 包建模Poisson分布的二变量。mprobit包提供了适合二元和顺序响应变量的多元概率模型。MNP包实现了Baye

28、sian多元概率模型。 polycor包可计算多组相关olychoric correlation和四分相关tetrachoric correlation矩阵。bayesm包里有多种模型如表面非相关回归Seemingly unrelated Regression多元logit/probit模型 工具变量法Instrumental Variables。VGAM包里有广义线形和可加模型Vector Generalised Linear and Additive Models减秩回归Reduced Rank regression。 14 矩阵处理Matrix manipulations R作为一种基于

29、向量和矩阵的语言有许多处理矩阵的强有力的工具由包Matrix和SparseM实现。matrixcalc包增加了矩阵微积分的功能。spam包提供了更深入的针对稀疏矩阵的方法。 15 其它Miscellaneous utitlies DEA包执行数据包络分析data envelopment analysisDEA。abind包组合多维array。Hmisc 包的mApply扩充了apply的功能。除了前面描述的功能sn包还未偏正态和偏t分布提供边缘化marginalisation、仿射变换affine transformations等。SharedHT2包执行芯片数据的Hotellings T2检

30、验。panel包里有面版数据panel data的建模方法。mAr包可做向量自回归模型vector auto-regressionMSBVAR包里有贝叶斯向量自回归模型。Hmisc包的rm.boot函数bootstrap重复测量试验Repeated Measures Models。compositions包提供复合数据分析compositional data analysis。 cramer包为两样本数据做多元非参Cramer检验。psy里有许多心理学的常用方法。cwhmisc包集合的 cwhmath包里有许多有趣的功能如各种旋转函数。desirability包提供了基于密度函数的多变量最优化

31、方法。geozoo包可以画 geozoo包里定义的几何对象。 R bootstrap bcanon的使用说明 鉴于错误 “错误于xdata 1 : 量度数目不对” libraryfEcofin for midCap returns data librarybootstrap datamidcapD.ts attachmidcapD.ts postscriptLSCC_CSGSQQ.pswidth6height5 Figure 6.2 qqplotLSCCCSGS lmfit lmquantileCSGSc.25.75 quantileLSCCc.25.75 ablinelmfit graphi

32、cs.off nlengthLSCC quKurt functionyp10.025p20.25 Q quantileycp1p21-p21-p1 as.numericQ4-Q1 / Q3-Q2 compareQuKurt functionxp10.025p20.25xdata quKurtxdatax1p1p2/quKurtxdatax2p1p2 quKurtLSCC quKurtCSGS xdatacbindLSCCCSGS compareQuKurt1:nxdataxdata set.seed5640 bca_kurt bcanon1:n500compareQuKurtxdataxdata bca_kurtconfpoints 同样的结果 compareQuKurt functionxdatap10.025p20.25 quKurtxdata1p1p2/quKurtxdata2p1p2 compareQuKurtxdata set.seed5640 bca_kurt bcanonxdata500compareQuKurt bca_kurtconfpoints 但是在有复杂计算时自变量的多列参与到theta中我们尽量 采用第一种方法bootstrap行的数目 否则出现错误 错误于xdata 1 : 量度数目不对

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1