数据挖掘博士研究计划模板.docx

上传人:b****2 文档编号:1912001 上传时间:2022-10-25 格式:DOCX 页数:6 大小:23.71KB
下载 相关 举报
数据挖掘博士研究计划模板.docx_第1页
第1页 / 共6页
数据挖掘博士研究计划模板.docx_第2页
第2页 / 共6页
数据挖掘博士研究计划模板.docx_第3页
第3页 / 共6页
数据挖掘博士研究计划模板.docx_第4页
第4页 / 共6页
数据挖掘博士研究计划模板.docx_第5页
第5页 / 共6页
点击查看更多>>
下载资源
资源描述

数据挖掘博士研究计划模板.docx

《数据挖掘博士研究计划模板.docx》由会员分享,可在线阅读,更多相关《数据挖掘博士研究计划模板.docx(6页珍藏版)》请在冰豆网上搜索。

数据挖掘博士研究计划模板.docx

数据挖掘博士研究计划模板

数据挖掘,博士,研究计划,模板

  篇一:

数据挖掘系统方案Verson

  数据挖掘系统方案

  系统背景:

  成长公司是一家为大学生终身成长提供服务的公司,公司全心全意为大学生服务,不以大学生为盈利主体。

通过对学生数据的挖掘一方面可以获取学生的真实需求信息,满足学生的需求。

另一方面通过对数据的统计分析,产生可以与商家对接的商业人需求,近而为公司带来一定的效益。

  本系统对于成长公司的重要性是显而易见的,数据挖掘系统的开发更是重中之重的工作,达到既定的系统目的是整个系统需求分析、设计、开发、测试各个环节的重要指导方向。

  系统目的:

  1、简化工作流程、提高工作效率。

  通过计算机软件系统的高速数据处理优势,将数据进行结构化处理,简化工作流程,提高工作效率。

  2、数据海量存储,提升数据价值。

  大数据海量信息存储技术,实现数据海量时的分类查询、筛选、统计、分析,快速提升数据价值。

  3、图表统计分析,提升数据挖掘的准确率。

  以图表形式更加清晰方便的体现当前数据形态,占比,趋势走向等信息,使数据挖掘工作更精确。

  4、集中分类体现,商业需求明显。

  多分类,多数据,集中展现,快速从中获得最新的指向性更强的商业需求

  5、关键字索引数据归集,快速提升商业需求转化率。

  关键字索引数据归集,在最短时间内分类归集相同或类似信息,提升商业需求转化率。

  6、集中筛选、无效、有效、待开发数据并分类。

  对数据中无效、有效、待开发的各类数据精确分类,自动滤除无效数据并单列有效数据和待开发数据,更加方便对数据的集中处理。

  系统服务器端软、硬件:

  服务器(WEB/DATA服务器)——云主机或租用独立服务器操作系统——Linux

  数据库系统——Mysql/Oracle根据实际需求选择

  WEB服务器——Tomcat/Apache/Nginx根据实际需求选择组件支持——Java/Php根据实际需求选择

  开发工具——根据开发工程师团队习惯而定

  开发语言——Java/Php/(来自:

小龙文档网:

数据挖掘,博士,研究计划,模板)Python根据实际需求选择

  客户端软件、硬件

  PC操作系统——WindowsXP/Vista/Win7/Win8

  PC浏览器兼容——IE6、IE7、IE8、IE9、IE10、FireFox、chrome、Opera、搜狗、XX、腾讯、360等主流浏览器

  暂不开发移动端

  设计实现约束

  1、采用B/S架构,系统与数据相分离。

  2、系统设计应充分考虑信息安全和数据安全,敏感数据基于加密算法保护信息安全,可限制后台登录的IP地址范围;可限制同一账号同时多处登录;可设置连续多次后台登录失败锁定IP;可启用防刷机制,防止CC攻击;通过安全过滤,可防XSS跨站攻击和SQL注入攻击;制定某些模块的IP地址访问限制;通过系统日志,对网站管理人员的操作以及IP地址进行记录。

  3、系统硬件由成长公司提供,前期至少要有一个稳定高速的云主机或独立服务器(空间要足够大),所放置的机房应有容灾备份机制,同时应有防火墙、入侵检测和VPN虚拟专网等安全机制。

在系统流量大负荷情况,还需要能够根据流量不断增长的情况,通过服务器集群、负载均衡、CDN等机制进行扩展。

  4、可自动屏蔽非法信息,通过敏感字管理,防止用户在发表信息的时候使用了敏感字而引起了信息审核部门的管理处罚甚至导致系统关闭(此点在对外开放注册接口后特别要注意)。

  系统功能:

  初级用户功能——用户登录、资料修改、密码修改、安全验证、退出系统、数据录入、数据修改、数据查询(模糊查询、条件查询、日期查询、分类索引)。

  中级用户功能——除以上功能外,拥有设置页面显示数据条数权限、高级图表生成功能(曲线图、柱形图等)、多条件高级检索功能、数据导入、导出功能。

  超级用户功能——除以上功能外,拥有用户增加、用户修改、用户删除、数据删除、图表设置、系统设置(系统日志、权限设置、分类设置等)。

  用户短消息提醒功能——有新的数据录入,系统对后台用户进行消息提示。

  与网站会员注册数据打通——将网站会员数据整合到一个数据表中。

  数据元素表:

  用户信息表——用户名、密码、性别、部门、职务、注册IP、登录IP、登录次数、当前权限、备注信息

  学生数据表——姓名、性别、年龄、班级、专业、院系、学校、手机、QQ、微信、学生证号(身份证号)、生日、个人说明、兴趣爱好、备注(此信息属阶段性信息,不同的阶段加入不同的内容进行完善最终形成有数据价值的信息。

  对接记录表——对接日期、对接内容、对接人、反馈内容、备注数据导入、导出功能:

可将数据导出生成excel表格文件,也可通过指定模板格式将整理好的数据表EXCEL导入到数据库中作统计分析。

  系统设置表——日期设置、大类设置、小类设置、检索设置、权限设置、用户管理、数据管理、系统日志、数据分类

  日期设置——按月划分日期阶段,每月填写对接记录信息并汇总。

大类设置——按成长的五个层次需求分大五个大类即“生活、交友、提升、温暖、梦想”

  小类设置——按成长的五个层次需求的五个大类中每一类细分成小类,如生活大类可细分为“吃、喝、玩、乐、衣、食、住、行”等,分类可后台设置、添加。

  检索设置——对数据信息的检索条件可灵活设置并调整。

权限设置——可设置不同的管理员拥有不同的管理权限。

  用户管理——可增加、修改、删除,用户信息,用户密码,用户安全设置等。

  数据管理——对录入到系统中的数据进行有效管理,如“清理信息量不足的数据、清理缓存、数据备份、数据恢复”等功能。

  系统日志——整个系统运行的报告文件,含用户登录、操作记录信息。

  数据分类——有效数据(资料齐全有价值的完整数据)、无效数据(一定时期内资料无法收齐的数据或错误数据,可手动选择清理)、待开发数据(一定时期内可收齐的资料数据)

  开发周期:

预计30天

  本系统在设计开发要充分考虑到后期的扩展、整合及数据迁移工作。

  开发方提供开发过程全部文档资料及最后开发完成并经成长公司确认的软件,签订保密协议、合作开发协议,软件版权归成长公司所有。

  篇二:

面向数据挖掘的云端实施方案

  面向数据挖掘的云端实施方案摘要:

云端运算是一种基于互联网的新兴应用计算机技术,数据挖掘是商业智能的重要环节,DataMining与云端运算的结合将极大提高数据挖掘的应用与统计科学的发展。

本文提出了云端的数据挖掘即服务(DMaaS,DataMiningasaServes)的概念,分别从IaaS、PaaS与DMaas给出了面向数据挖掘的云端实施方案;设计出商用DM软件与开源DM软件的云端实施平台,引入R中平行运算技术对Cloud-R进行改进。

  关键词:

云端运算;DataMining;DMaaS;平行运算

  中图分类号:

C81文献标识码:

ATheCloudComputingProgramforDataMiningTechnologyAbstract:

CloudcomputingisakindofnewlyemergingtechnologyofcomputerapplicationbasedonInternet.DataMiningisakeystepinBusinessIntelligence.ThecombinationofDataMiningandCloudcomputingwillgreatlyenhancetheapplicationofDataMiningandthedevelopmentofStatisticsScience.ThepaperproposestheconceptofDMaaSandprovidesimplicationprogramsofcloudcomputingfromtheaspectofIaaS,PaaSandDMaaSrespectively.ThepaperdesignsthecloudcomputingplatformsofCommercialDMsoftwareandopensourceDMsoftware,andintroducesparallelcomputinginRtoimproveCloud-R.Keywords:

CloudComputing;DataMining;DMaaS;ParallelComputing

  引言

  数据挖掘也是商业智能的重要环节,数据仓库是数据挖掘得以发展的基础,也是商业智能的支撑,由此可见数据仓库对于商业智慧来言具有很重要的作用,它集成了企业的最核心的数据,随着企业对数据的再次利用和深入挖掘,海量数据的高效计算问题成为企业最为关注的一个问题之一。

在商业智慧(BI)活动中,数据仓库与数据挖掘要求的费用支出庞大,很多中小企业望而却步。

云端运算的出现,对中小企业来讲,是一个振奋人心的好消息。

如果云端运算应用在商业智能上,由于云端运算具有按需使用、按使用收费特性,这将大大减少企业应用商业智能的成本。

此外,一方面,我们可以通过云的数据仓库实现海量数据的高效计算。

另一方面,云端运算可以实现在线支付使用数据挖掘工具和商业智能相关分析处理软件。

数据挖掘(DataMining)具备更多的工具与更成熟的功能,与领导品牌的BI解决方案并驾其驱,但投资成本却更低;DataMining大幅提升的效能与新增强化的功能,吸引我们全面升级以发挥新技术的效益。

例如,台湾广达电脑有限公司以Intel搭配SQLServer,所耗费的成本却低于Unix的三分之一,创造了绝对的成本优势。

目前,在线数据挖掘服务也受到

  大陆许多企业的青睐,中国的海量信息技术有限公司提供的名―海纳睿‖的在线数据挖掘服务,可以利用其在在线网络数据挖掘技术上的优势,为用户提供个性化需求,定制个性模块服务,以此来满足网站的不同需求。

此外,开源商业智慧(BI)厂商生态系统逐渐崛起,包括JasperSoft、Actuate、Pentagon、SpagoBI等。

  云端运算(CloudComputing)是分布式处理(DistributedComputing)、并行处理(ParallelComputing)和网格计算(GridComputing)的发展,或者说是这些计算机科学概念的商业实现,它具有超大规模、虚拟化、高可靠度、高通用性、使用者付费、成本低、高扩充性等特色。

云端运算将庞大运算操作拆成千百个较小的操作,再交给远程、多台服务器同时运算;透过此种技术,网络服务提供者可以在数秒之内,处理数以千万计的信息,并提供和超级计算机一样强大效能的网络服务,以符合网络用户日增的各种需求。

云端运算基于因特网的运算方式,它通过因特网为个人使用者或企业使用者提供按需即取的服务。

直观来讲,云端算法就是让网络上不同计算机同时帮你做一件事情,大幅度的提高了处理速度和效率。

云端运算的最终目标即为所有的资源均来自于云端,使用者只需一个连接云端的设备(手机等)和简单的界面(如浏览器等)即可,Google搜寻服务,Gmail,YouTube,GoogleDocs,GoogleTalk,iGoogle,GoogleCalendar已充分使用云端运算技术;其它

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1