1、信息检索报告信息检索综合检索报告检索课题概况1 检索课题名称 1.1中文课题名: 网络大数据计算的基础理论及其应用研究1.2英文课题名: The Study of Basic Theory and Application of the Network Large Data Computing2 检索课题简介2.1背景:视频、音频、图像、数字的等多种交互方式的丰富,让我们已经进入了数据信息爆炸的阶段。一些国外的调研机构认为:未来10年之内,全球的数据和内容将增加44倍,大数据的时代来了。大数据无疑是目前一个非常热门的话题。对于每个人来说,提到大数据我们首先想到的就是大,但数量大并不是大数据,大数
2、据的基本特点是具备:规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)。这是目前人们形容大数据用到最多的也是大家比较公认的大数据的特点描述。数据的规模从以MB为基本单位,到大数据的GB甚至是TB、PT为基本处理单位;多样性,数据有一种而发展到多种,即数据库以结构化的类型为主,而大数据种类繁多,数以千计,而这些数据又包含着结构化的、半结构化的以及非结构化的数据,并且后两类所占的份额越来越大;传统的数据库是先有模式然后产生数据,而大数据难以预先确定模式,模式只有在大数据出现之后才能确定,且随着数据的增长处于不断演变之中;传统数据库中的数据作为处理对象
3、,而大数据时代,要将数据作为一种资源辅助解决其他诸多领域的问题;数据库处理数据,仅用一种或少数几种工具就可以处理,而大数据不可能有一种或少数几种工具来处理数据,需要采取新的数据思维来应对。所以对大数据进行处理、分析及整合的基本理论和应用的研究也越来越重要。2.2目的: 研究大数据技术的目的不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。通过搜索引擎、Facebook的帖子和微博消息使得人们的行为和情绪的细节化测量成为可能。挖掘用户的行为习惯和喜好,凌乱
4、纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化。虽然大数据在国内还处于初级阶段,但是商业价值已经显现出来。首先,手中握有数据的公司站在金矿上,基于数据交易即可产生很好的效益;其次,基于数据挖掘会有很多商业模式诞生,定位角度不同,或侧重数据分析。比如帮企业做内部数据挖掘,或侧重优化,帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润。2.3意义:大数据已经从战略高度对国家安全、政府决策和竞争模式产生了决定性影响。它是一方面激发出令人惊艳的全新增长方式和服务方式,另一方面也引发了关于国家安全、信息安全和公民隐私的激烈争议。如何在保证数据安全的情况
5、下,将数据转化为知识,并为企业所用,是大数据面临的最大挑战。从聚焦结构化数据的存储到对于移动化数据的分析,从由串行方式获取信息源到直接获取数据源,从数据应用到情景分析再到通过连续数据发掘未知信息,从查看预定义的报告和仪表盘到敏捷且可视化的自助数据,从分析数据竖井与应用到数据应用平台:大数据技术为数据的角色定位和获取、应用方式带来了巨大变化,并为数据不断发掘新价值。大数据通过在移动数据中将电子邮件、图像、不同来源的内部数据和外部数据相结合而获得价值。大数据应用包括如下步骤:将数据从应用中释放,选取符合成本效益原则的数据用于分析,将不同的数据结合成上下文内容,结合内部数据获得独特价值,最终通过大数
6、据实现创新。3 检索策略3.1检索工具文献类型中文数据库外文数据库期刊维普中文科技期刊数据库CNKI数据库ISI Web of Science(SCI)Elsevier综合类学术期刊学位论文万方公司数据库ProQuest博硕士论文全文数据库会议论文IEEE/IET Electronic Library报纸全国报刊索引数据库网络文献XX搜索引擎3.2 检索词网络Network大数据Large Data/Big Data计算Computing理论Theory应用Application4 检索步骤及检索结果4.1检索工具:维普中文科技期刊数据库4.1.1检索式:题名或关键词=网络 并且 题名或关键词
7、=大数据 并且 题名或关键词=计算 并且 题名或关键词=理论 或者 题名或关键词=应用 并且 年份=2004-20144.1.2检索年限:最近十年4.1.3检索步骤与结果:4.2检索工具: CNKI数据库4.2.1检索式: 主题词=网络 并且 计算机 并且 计算4.2.2检索年限:最近十年4.2.3检索步骤与结果:4.3检索工具:万方公司数据库4.3.1检索式:检索表达式:网络 * 大数据 * 计算 * Date:2004-20144.3.2检索年限:最近十年4.3.3检索步骤与结果:4.4检索工具:ProQuest博硕士论文全文数据库4.4.1检索式:ti:(big and data) an
8、d year:(2004-2014) 4.4.2检索年限:最近十年4.4.3检索步骤与结果:4.5检索工具:全国报刊索引数据库4.5.1检索式:检索条件:all:网络大数据计算4.5.2检索年限:最近十年4.5.3检索步骤与结果:4.6检索工具: IEEE/IET Electronic Library4.6.1检索式: network and big data and computing4.6.2检索年限:最近十年4.6.3检索步骤与结果:4.7检索工具: Elsevier综合类学术期刊4.7.1检索式: results found for pub-date 2003 and (big dat
9、a) and computing; results found for pub-date 2003 and (big data) and network4.7.2检索年限:最近十年4.7.3检索步骤与结果:4.8检索工具: ISI Web of Science(SCI)4.8.1检索式:M=topic (network) and topic (big data) and topic (computing) and year published (2004-2014)4.8.2检索年限:最近十年4.8.3检索步骤与结果: 4.9检索工具: XX搜索引擎4.9.1检索式: 网络大数据计算4.9.2
10、检索年限:最近十年4.9.3检索步骤与结果:5 检索结果评价维普数据库可以按照用户需求增加或者减少检索词,十分方便。而且期刊反映了比较前沿的内容。中国知网的资源系统性比较强,都是很正规的论文。而且检索词也可以按照需求增减。万方数据同维普数据库一样方便,只是检索速度稍微慢了一些。ProQuest可以搜索国外的博硕士论文,这个为学术交流提供了很大方便。报刊索引数据库则可以反应新兴技术在社会上的实际应用和取得的反响,也是科学研究的很重要的参考方面。IEEE和Elsevier都是国外著名的数据库,文献全面,更新的内容紧随前沿,反映了国外最新的研究成果,但是在检索的界面不能随意增加或减少检索词,似乎不是
11、很方便。SCI在国内不能顺利登陆,我试过很多次都不成功,最后只有拜托国外的同学帮忙查询。我觉得虽然这个数据库很权威,但是中国用户不能使用,就是最大的缺点。6 综述大数据是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。所以对大数据的计算的研究就显得格外重要。其中包括数据采集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测、结果呈现等八个方面。可应用于商业、公共安全、企业发展等各行各业。总体来说,我觉得这次的检索还是比较成功的。利用不同的检索工具,能够查到不同的资料,这些资料各有侧重点:期刊论文集合了比较前沿的成果;中国知网的
12、资源系统性比较好;万方数据的资源丰富;以及国外的数据库更是提供了很多国外的研究成果。所以信息的集合还是比较全面的。7 学习心得及建议我觉得这门课非常有用,与生活联系十分紧密。在当今这个网络发达资源丰富信息大爆炸的时代,如何快速准确高效的检索出自己想要的信息是一种能力的体现。拥有这种能力,我们可以找到各种资源,譬如说可以找到电影资源来丰富自己的业余生活,找到各种学习资源来提高自己的能力,找到各种专业文献来为自己的学术写作提供方便。我觉得受益匪浅。在这门课上我还学到了很多平时接触不到的检索方法,搜索途径,还有很多很专业很全面很权威的数据库。这门课给我的感觉就是时不时会发现一个个大礼包,然后这种惊奇
13、和兴奋又会引领我继续向前探索,渴望发现更多的惊喜。 经过这次大作业,我觉得自己的检索能力有所提高。就像老师所说的,纸上得来终觉浅,绝知此事要躬行。理论学过是远远不够的,要自己实际应用之后才能说掌握了这种方法或技巧。我的感触是,首先对课题的分析是非常重要的,只有经过仔细的分析才能够精确把握关键词,这样进行的检索才是有效的,否则会浪费大量的时间。其次在检索过程中,要不断调整自己的检索方法和检索工具,将不同的检索途径结合起来才能得到全面的信息和资源。最后要将各种检索工具的利弊进行总结,这样不断地积累经验,在以后的检索过程中,就能够根据已有的经验来对各种检索工具进行优劣排序,这样也是使得我们的检索过程
14、更加有序高效的一个办法。而且在完成作业的过程中也遇到了意想不到的困难。那就是在用SCI进行检索的时候无法登陆那个网站,网上搜索到SCI的入口的时候发现需要注册用户进行登陆,但是这个网站似乎对中国用户是屏蔽的,所以无法用它来检索信息。这个时候我也想过放弃,但是最后想到了别的办法。我找到在美国留学的同学,我在这里远程请他帮我登陆SCI页面,查到信息后再截屏发给我。最后完成了任务。 在学过这门课以后还要真正把这种能力融入生活。如果只是通过一门考试然后就把知识都还给老师,那是没有意义的。我妈妈年纪大了,冬天时常腰腿疼痛。然后我通过朋友知道一种暖宝很好用,但是因为品牌是美国的所以在中国不好找。于是我通过上课学到方法,找到网上一家代购的网店,而且是在保证质量下价格最低的代购方,顺利帮妈妈买到了暖宝。想想还是很有成就感的。 总之通过这几周的学习我觉得这门课在我眼前打开了一个新的世界,选修这门课绝对不会后悔。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1