ImageVerifierCode 换一换
格式:DOCX , 页数:6 ,大小:23.71KB ,
资源ID:1912001      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1912001.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据挖掘博士研究计划模板.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据挖掘博士研究计划模板.docx

1、数据挖掘博士研究计划模板数据挖掘,博士,研究计划,模板篇一:数据挖掘系统方案Verson 数据挖掘系统方案 系统背景: 成长公司是一家为大学生终身成长提供服务的公司,公司全心全意为大学生服务,不以大学生为盈利主体。通过对学生数据的挖掘一方面可以获取学生的真实需求信息,满足学生的需求。另一方面通过对数据的统计分析,产生可以与商家对接的商业人需求,近而为公司带来一定的效益。 本系统对于成长公司的重要性是显而易见的,数据挖掘系统的开发更是重中之重的工作,达到既定的系统目的是整个系统需求分析、设计、开发、测试各个环节的重要指导方向。 系统目的: 1、简化工作流程、提高工作效率。 通过计算机软件系统的高

2、速数据处理优势,将数据进行结构化处理,简化工作流程,提高工作效率。 2、数据海量存储,提升数据价值。 大数据海量信息存储技术,实现数据海量时的分类查询、筛选、统计、分析,快速提升数据价值。 3、图表统计分析,提升数据挖掘的准确率。 以图表形式更加清晰方便的体现当前数据形态,占比,趋势走向等信息,使数据挖掘工作更精确。 4、集中分类体现,商业需求明显。 多分类,多数据,集中展现,快速从中获得最新的指向性更强的商业需求 5、关键字索引数据归集,快速提升商业需求转化率。 关键字索引数据归集,在最短时间内分类归集相同或类似信息,提升商业需求转化率。 6、集中筛选、无效、有效、待开发数据并分类。 对数据

3、中无效、有效、待开发的各类数据精确分类,自动滤除无效数据并单列有效数据和待开发数据,更加方便对数据的集中处理。 系统服务器端软、硬件: 服务器(WEB/DATA服务器)云主机或租用独立服务器 操作系统Linux 数据库系统Mysql/Oracle 根据实际需求选择 WEB服务器Tomcat/Apache/Nginx根据实际需求选择 组件支持Java/Php 根据实际需求选择 开发工具根据开发工程师团队习惯而定 开发语言Java/Php/(来自: 小龙 文档 网:数据挖掘,博士,研究计划,模板)Python根据实际需求选择 客户端软件、硬件 PC操作系统Windows XP/Vista/Win7

4、/Win8 PC浏览器 兼容IE6、IE7、IE8、IE9、IE10、FireFox、chrome、Opera、搜狗、XX、腾讯、360等主流浏览器 暂不开发移动端 设计实现约束 1、采用B/S架构,系统与数据相分离。 2、系统设计应充分考虑信息安全和数据安全,敏感数据基于加密算法保护信息安全,可限制后台登录的IP地址范围;可限制同一账号同时多处登录;可设置连续多次后台登录失败锁定IP;可启用防刷机制,防止CC攻击;通过安全过滤,可防XSS跨站攻击和SQL注入攻击;制定某些模块的IP地址访问限制;通过系统日志,对网站管理人员的操作以及IP地址进行记录。 3、系统硬件由成长公司提供,前期至少要有

5、一个稳定高速的云主机或独立服务器(空间要足够大),所放置的机房应有容灾备份机制,同时应有防火墙、入侵检测和VPN虚拟专网等安全机制。在系统流量大负荷情况,还需要能够根据流量不断增长的情况,通过服务器集群、负载均衡、CDN等机制进行扩展。 4、可自动屏蔽非法信息,通过敏感字管理,防止用户在发表信息的时候使用了敏感字而引起了信息审核部门的管理处罚甚至导致系统关闭(此点在对外开放注册接口后特别要注意)。 系统功能: 初级用户功能用户登录、资料修改、密码修改、安全验证、退出系统、数据录入、数据修改、数据查询(模糊查询、条件查询、日期查询、分类索引)。 中级用户功能除以上功能外,拥有设置页面显示数据条数

6、权限、高级图表生成功能(曲线图、柱形图等)、多条件高级检索功能、数据导入、导出功能。 超级用户功能除以上功能外,拥有用户增加、用户修改、用户删除、数据删除、图表设置、系统设置(系统日志、权限设置、分类设置等)。 用户短消息提醒功能有新的数据录入,系统对后台用户进行消息提示。 与网站会员注册数据打通将网站会员数据整合到一个数据表中。 数据元素表: 用户信息表用户名、密码、性别、部门、职务、注册IP、登录IP、登录次数、当前权限、备注信息 学生数据表姓名、性别、年龄、班级、专业、院系、学校、手机、QQ、微信、学生证号(身份证号)、生日、个人说明、兴趣爱好、备注(此信息属阶段性信息,不同的阶段加入不

7、同的内容进行完善最终形成有数据价值的信息。) 对接记录表对接日期、对接内容、对接人、反馈内容、备注 数据导入、导出功能:可将数据导出生成excel表格文件,也可通过指定模板格式将整理好的数据表EXCEL导入到数据库中作统计分析。 系统设置表日期设置、大类设置、小类设置、检索设置、权限设置、用户管理、数据管理、系统日志、数据分类 日期设置按月划分日期阶段,每月填写对接记录信息并汇总。 大类设置按成长的五个层次需求分大五个大类即“生活、交友、提升、温暖、梦想” 小类设置按成长的五个层次需求的五个大类中每一类细分成小类,如生活大类可细分为“吃、喝、玩、乐、衣、食、住、行”等,分类可后台设置、添加。

8、检索设置对数据信息的检索条件可灵活设置并调整。 权限设置可设置不同的管理员拥有不同的管理权限。 用户管理可增加、修改、删除,用户信息,用户密码,用户安全设置等。 数据管理对录入到系统中的数据进行有效管理,如“清理信息量不足的数据、清理缓存、数据备份、数据恢复”等功能。 系统日志整个系统运行的报告文件,含用户登录、操作记录信息。 数据分类有效数据(资料齐全有价值的完整数据)、无效数据(一定时期内资料无法收齐的数据或错误数据,可手动选择清理)、待开发数据(一定时期内可收齐的资料数据) 开发周期:预计30天 本系统在设计开发要充分考虑到后期的扩展、整合及数据迁移工作。 开发方提供开发过程全部文档资料

9、及最后开发完成并经成长公司确认的软件,签订保密协议、合作开发协议,软件版权归成长公司所有。 篇二:面向数据挖掘的云端实施方案 面向数据挖掘的云端实施方案 摘要:云端运算是一种基于互联网的新兴应用计算机技术,数据挖掘是商业智能的重要环节,Data Mining与云端运算的结合将极大提高数据挖掘的应用与统计科学的发展。本文提出了云端的数据挖掘即服务(DMaaS,Data Mining as a Serves)的概念,分别从IaaS、PaaS与DMaas给出了面向数据挖掘的云端实施方案;设计出商用DM软件与开源DM软件的云端实施平台,引入R中平行运算技术对Cloud-R进行改进。 关键词:云端运算;

10、Data Mining;DMaaS;平行运算 中图分类号:C81 文献标识码:A The Cloud Computing Program for Data Mining Technology Abstract: Cloud computing is a kind of newly emerging technology of computer application based on Internet. Data Mining is a key step in Business Intelligence. The combination of Data Mining and Cloud com

11、puting will greatly enhance the application of Data Mining and the development of Statistics Science. The paper proposes the concept of DMaaS and provides implication programs of cloud computing from the aspect of IaaS, PaaS and DMaaS respectively. The paper designs the cloud computing platforms of

12、Commercial DM software and open source DM software, and introduces parallel computing in R to improve Cloud-R. Keywords: Cloud Computing; Data Mining; DMaaS; Parallel Computing 引言 数据挖掘也是商业智能的重要环节,数据仓库是数据挖掘得以发展的基础,也是商业智能的支撑,由此可见数据仓库对于商业智慧来言具有很重要的作用,它集成了企业的最核心的数据,随着企业对数据的再次利用和深入挖掘,海量数据的高效计算问题成为企业最为关注的

13、一个问题之一。在商业智慧(BI)活动中,数据仓库与数据挖掘要求的费用支出庞大,很多中小企业望而却步。云端运算的出现,对中小企业来讲,是一个振奋人心的好消息。如果云端运算应用在商业智能上,由于云端运算具有按需使用、按使用收费特性,这将大大减少企业应用商业智能的成本。此外,一方面,我们可以通过云的数据仓库实现海量数据的高效计算。另一方面,云端运算可以实现在线支付使用数据挖掘工具和商业智能相关分析处理软件。数据挖掘(Data Mining)具备更多的工具与更成熟的功能,与领导品牌的BI解决方案并驾其驱,但投资成本却更低;Data Mining大幅提升的效能与新增强化的功能,吸引我们全面升级以发挥新技

14、术的效益。例如,台湾广达电脑有限公司以Intel搭配SQL Server,所耗费的成本却低于Unix的三分之一,创造了绝对的成本优势。目前,在线数据挖掘服务也受到 大陆许多企业的青睐,中国的海量信息技术有限公司提供的名海纳睿的在线数据挖掘服务,可以利用其在在线网络数据挖掘技术上的优势,为用户提供个性化需求,定制个性模块服务,以此来满足网站的不同需求。此外,开源商业智慧(BI)厂商生态系统逐渐崛起,包括Jasper Soft、Actuate、Pentagon、Spago BI等。 云端运算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Pa

15、rallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现,它具有超大规模、虚拟化、高可靠度、高通用性、使用者付费、成本低、高扩充性等特色。云端运算将庞大运算操作拆成千百个较小的操作,再交给远程、多台服务器同时运算;透过此种技术,网络服务提供者可以在数秒之内,处理数以千万计的信息,并提供和超级计算机一样强大效能的网络服务,以符合网络用户日增的各种需求。云端运算基于因特网的运算方式,它通过因特网为个人使用者或企业使用者提供按需即取的服务。直观来讲,云端算法就是让网络上不同计算机同时帮你做一件事情,大幅度的提高了处理速度和效率。云端运算的最终目标即为所有的资源均来自于云端,使用者只需一个连接云端的设备(手机等)和简单的界面(如浏览器等)即可,Google搜寻服务, Gmail, YouTube, Google Docs, Google Talk, iGoogle, Google Calendar已充分使用云端运算技术;其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1