机器学习之线性回归模型及应用研究Word下载.docx
《机器学习之线性回归模型及应用研究Word下载.docx》由会员分享,可在线阅读,更多相关《机器学习之线性回归模型及应用研究Word下载.docx(26页珍藏版)》请在冰豆网上搜索。
Abstract
Machinelearningisanimportantmeansoflearningandunderstandingtheunderlyingmechanism.Inrecentyears,machinelearningtheoryhasbeensuccessfullyappliedanddevelopedinmanyapplications.
Inthispaper,alinearregressionalgorithmwasstudiedbyseparatingthedataofplantbiomassandanimalbiomassintotwelvegroups.ThelinearregressioneffectmodelsofplantsonanimalbiomasswereestablishedusingtheRapidMinersoftwarewhichintegratesmachinelearningalgorithmsindesert,andthesemodelsweretestedbycrossvalidation.Thetestresultsarecomparedwiththeerrorsoftheartificialneuralnetworkandthesupportvectormachinemodel.Itisfoundthattheerroroflinearregressionmodelisclosetothatofsupportvectormachine.Atthesametime,therelationshipbetweenherbaceousandshrubplantsinanimalhusbandryandanimalhusbandryindifferentareaswasanalyzedintheestablishedmodels.
Keywords:
machinelearning;
supportvectormachine;
crossvalidation;
desertpopulation
目录
摘要 I
Abstract II
目录 III
第一章绪论 1
1.1研究背景及意义 1
1.2国内外研究现状 2
1.2.1国外研究现状 2
1.2.2国内研究现状 2
1.2.3干旱地区啮齿动物群落的发展方向和趋势 3
1.2.4总结 3
1.3论文主要研究内容 4
1.4论文的组织结构 4
第二章相关理论及算法 5
2.1线性回归模型 5
2.2人工神经网络模型 5
2.3支持向量机模型 5
第三章荒漠区植物对动物生物量影响的线性回归模型的建立 7
3.1建立该模型的基本原则 7
3.2变量说明 7
3.3荒漠地区不同条件下植物生物量和啮齿动物生物量 8
3.4植物生物量与啮齿动物生物量之间的线性回归关系 9
3.4.1多元线性回归模型建立 9
3.4.2导入数据 9
3.4.3多元线性回归模型求解 11
第四章线性回归模型的误差计算及结果分析 17
4.1回归模型误差计算 17
4.1.1连接数据和交叉验证 17
4.1.2交叉验证算法 17
4.2回归模型误差分析 18
4.3支持向量机得出模型的结果分析 19
第五章结论与展望 20
5.1本文的结论 20
5.2有待深入研究的问题 20
致 谢 22
III
第一章绪论
1.1研究背景及意义
全球生态系统种类丰富,干旱地区是其中不可或缺的种类,也是当今全世界各国开发相对较晚的区域。
因此,为了解决干旱区当前面临的重要环境问题,以及防范于未然的科学决策,积极开展干旱区的生态学理论与实践研究势在必行,并且具有极其重要的现实意义。
西北干旱区是我们国家三大自然区域之一,其具有规模大、高强度开发历史短的特点,因此,与其他的自然区域相比较而言,西北干旱区境内蕴藏了庞大的尚未开发的自然资源,使其成为我国未来经济建设中必须得重视的一个环节,同时也具有着时代赋予的重大历史使命[1]。
所以,我们要尽可能多的去开展干旱地区的生态研究,深化课题深度与广度,在拉动经济发展的同时,也要注重当地的生态环境保护工作的开展。
荒漠地区具备典型的温带荒漠特点,同时也属于相对脆弱的干旱生态系统,条件恶劣,生态环境差,啮齿动物凭借其种类多、繁衍快、个头小等多方面优势,成为荒漠生态系统中不可或缺的一部分,是食物链中必不可少的消费者这一环节,对于荒漠地区的保护和利用来说,具有不可代替的作用。
干扰可以改变生态系统中各类资源的自主分配以及导致重组生态结构,很多生态物种的繁衍与人们的干扰有关,人为的干扰越大,可能引起的破坏性就越大[2],导致环境异质化。
因此,本文主要就是分析西北干旱地区,在过牧和轮牧干扰下,啮齿动物生物量与植物因子之间的线性关系,通过给定的植物因子数据来预测啮齿动物的生物量。
机器学习是学习和理解内在机制的重要机制,为计算机程序建立理论方法,可以通过自主学习提高计算水平。
近年来,机器学习理论在许多应用中得到了成功应用和开发,逐渐成为计算机科学的基础之一[3]。
机器学习有广泛的应用,如医学诊断,搜索引擎,语音和手写识别,信用卡欺诈检测,DNA测序,证券市场分析,机器人和战略游戏使用。
荒漠区植物因子与动物生物量这些数据庞大,人工不方便去处理如此繁杂的数据,而机器学习在处理大数据方面占据着绝对的优势。
所以依据提供的数据,通过机器学习来建立数学模型,剖析荒漠区不同干扰下植物地上生物量同啮齿动物生物量的线性关系[2],并揭示不同干扰下植物生物量与啮齿动物生物量之间的变化趋势,通过这些趋势进行合理的环境保护。
23
1.2国内外研究现状
1.2.1国外研究现状
二十世纪时生态学已经进入了发展阶段,1903年美国年轻学者达文波特首先开展了对动物群落生态学的研究,但在其后直到五、六十年代,动物群落生态学仍把种群之间的数量变动问题作为研究重心,可是科学界对动物群落的研究力度不够[4]。
20世纪70年代和80年代,外国动物社区的生态学取得了一些进展[5],特别是在20世纪90年代初,美国生态学会提出了一个持续的生物圈计划,并在其周围进行了大量的动物生态研究[6]。
例如:
Brown(1977),Rosen-zweig(1969)研究了北美和美国西北部沙漠地区啮齿动物群落多样性与植物多样性与降水之间的关系。
Hallett(1982)应用多种分析方法研究沙漠地区小型哺乳动物的物种竞争和栖息地利用,并认为这些问题在啮齿动物物种的分布中起重要作用。
Bowles(1982)采用统计学方法来确定沙漠地区啮齿动物群落的共存状态和个体大小之间的关系。
他认为,个别小物种在一小部分栖息地中受到种间竞争。
欧文(1988)利用iltmalns模型研究了啮齿动物和食肉动物的多样性和低生产率,生产率降低时,其多样性得到改善[6]。
Brown(1985)研究了增加的食物和物种迁移对社区结构的影响。
限制食物资源和种间竞争是影响沙漠地区啮齿动物社区的主要因素之一。
Borund(1989)研究了沙漠地区啮齿动物和物种的共存机制,提出了两个机制:
环境选择和食物效率的季节变化。
Ktoler(1948)研究了沙漠地区啮齿动物群落的结构,并认为啮齿动物群落处于掠夺或资源的风险。
当栖息地捕食风险不同时,捕食可以形成猎物社区结构,捕食者逃避风险栖息地专业化减少种间竞争,促进不同人群的共存。
啮齿动物继承研究是社区生态研究的内容之一,其理论与实践研究对生态研究具有重要意义,防治啮齿动物和啮齿动物的防治也很重要。
1.2.2国内研究现状
近年来,中国生态工作者对干旱区啮齿动物群落进行了大量的基础研究,包括物种组成,结构,动植物,均匀度,相对丰度,物种多样性,分布群体,相似系数,利基,社区优势等等。
比如著名学者周庆强(1982)研究了中国内蒙古白银溪莱典型草原的啮齿动物群落的多样性,空间布局和结构[7]。
在本文
中,研究了高寒草甸地区幼虫的多样性。
刘乃发(1990),吴晓东(1994)利用数学模型研究了干旱区啮齿动物群落结构与环境的关系。
多样性和植物高度和覆盖面,土壤和降水。
阿布里米提(1991)研究了新疆干旱区啮齿动物群落结构特征与干旱地区环境因素之间的关系曾宗勇(1994)研究了北美沙漠啮齿动物群落变化与物种多样性等特征的关系。
从营养,空间和利基的角度来看,社区中种间关系的重要组成部分是竞争在有限的营养,时间和空间。
竞争导致时间或空间位置的一些分离,一些只是部分分离,有些还没有分离。
近年来,生态学家对城市和农田啮齿动物群落的继承进行了研究,但对早期干旱地区啮齿类动物群落继承的研究较少。
只有刘继科(1979)研究了农田啮齿动物群落继代和生物量变化[7]。
郭聪(1992)研究了农村啮齿动物群落的继承趋势及其在洞庭丘陵平原的继承。
丁平(1992)研究了人口迁移与养殖小野兽群体的关系,并讨论了小型哺乳动物群落和养殖小野兽群落的迁移与传播之间的关系[5]。
在荒漠地区的啮齿动物社区演变,只有张大明(1992)的部分研究工作。
1.2.3干旱地区啮齿动物群落的发展方向和趋势
科学研究的发展周期是从定性研究到定量研究。
近年来,生态学研究表明,啮齿动物种群生态学研究成功运用了数学模型,使啮齿动物的种群生态越来越客观越来越准确,促进了啮齿动物种群生态成熟发育。
而啮齿动物社区生态晚期的演变,对理论和方法的了解还不成熟。
但随着动物群落生态学的发展,我们的生态学家将从定性描述到准确定量研究,进一步研究啮齿动物群落生态学的研究,促进啮齿动物群落生态学的成熟与发展。
诸如feger(1957),梁忠禹(1964),杨春文(1991),米静川(1990,1993)利用计算机技术和数学原理研究干旱地区啮齿动物群落的结构和多样性。
刘乃法(1994)采用统计学方法,通过电子计算机研究了沙漠地区啮齿动物群落结构与环境因素的关系。
随着科学的发展,电脑广泛应用于生态研究。
我们的生态工作者还使用电脑通过多变量分析中的聚类分析和主成分分析来研究啮齿动物群落的分类和结构。
然而,在啮齿动物群落的干旱地区,我看到使用统计方法和传统分类方法,使用电脑是不够的。
一般来说,研究啮齿动物群落,具备从定性研究到定量研究的趋势。
1.2.4总结
在啮齿动物生态学的发展历史中,啮齿动物群落生态学是生态学的一个新的科学分支,其研究方法论的研究成果还不成熟。
中国啮齿动物群落生态学研究较晚,很多研究工作尚未完成。
这是我国大量生态工作者的重要内容之一。
研究生态学基本理论,解决啮齿类群落生态学研究具有