奋进中的数据工程与知识工程教育部重点实验室文档格式.docx
《奋进中的数据工程与知识工程教育部重点实验室文档格式.docx》由会员分享,可在线阅读,更多相关《奋进中的数据工程与知识工程教育部重点实验室文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
国际著名的刊物IEEETKDE(数据工程与知识工程汇刊)是这样定义数据工程与知识工程的内涵的:
数据与知识的获取、管理、保存、服务等各个方面。
由于数据和知识是信息系统的血液,因此,数据工程和知识工程自然而然地成为了信息技术的重要内容,成为保障国家信息安全的重要内容,成为国际上非常活跃的研究领域,而且有着重要的实际应用价值。
数据工程与知识工程教育部重点实验室的研究方向包括以下二个方面:
其一,数据工程领域。
在数据工程领域,数据管理的核心是数据库管理系统软件。
由于数据库在应用深度和广度上的扩展,不断地对现有数据库技术提出挑战。
在关系内核的基础上,不断扩充各种处理复杂数据的功能(XML数据、流数据、多媒体数据等)的技术路线成为当前数据库技术发展的主流。
这使得关系数据库已经成为功能强大、适应性很广的基础系统。
事实上,数据库已经成为信息系统应用开发、部署和运行的基础平台。
虽然,以关系数据库为代表的关系模型和系统关键技术经过三十多年的研究,已经比较成熟。
但是,数据库追求的规模更大、速度更快、系统更加安全可靠、工具更加好用,功能更加强大的目标没有改变。
更大(规模),更快(性能),更好(安全可靠易用),更强(功能)仍然是数据库技术追求的目标。
数据工程领域呈现出智能化、网络化、体系化、持久性的发展趋势。
其二,知识工程领域。
随着社会的不断发展进步,深层次的知识共享和利用已经成为信息化社会,或更进一步的知识化社会的重大需求。
近年来非常热门的话题语义网(SemanticWeb)就是由于这个需求而引发出来的研究课题。
但是,目前的语义网更多的还是一个框架,许多深层次的问题还没有解决。
特别是还没有从理论基础上去研究由于因特网的开放性、动态演化性、多源自主性,给基于因特网的知识传播、知识获取和知识融合带来的挑战。
新型知识处理较之传统知识处理的关键和难点问题,是要系统地解决知识的非规范性问题。
建立这种非规范知识处理的核心理论和技术体系,将成为面向新型应用环境的先进的知识处理技术体系,必将为我国在未来5-10年的基于新一代因特网的知识和信息共享应用提供理论和技术支持。
以纪宝成校长为首的实验室建设管理委员会和以陆汝钤院士为首的学术委员会,组织力量经过反复和审慎的调查研究与分析论证,为重点实验室确立了这样的建设目标:
以数据工程与知识工程领域的理论研究、工程开发和人才培养为核心,集中资源,力争在数据工程与知识工程的重要领域实现重点突破,缩短我国在数据工程与知识工程领域同国际水平间的差距;
加强学科间的渗透和融合,将自然科学研究方法与社会科学研究方法有机结合,全面促进信息科学技术与信息管理学科群的成长,努力为国家知识创新与国民经济建设主战场服务。
实验室建设管理委员会和学术委员会还非常明确地对重点实验室建设目标进行了具体的定位,要求把重点实验室建设成为:
数据工程与知识工程基础理论和新型技术的创新研究平台;
我国数据工程与知识工程人才培养基地;
国家信息化规划与建设的咨询服务机构;
国家数据工程与知识工程方面管理政策、技术政策、制度、标准方案供给中心。
三年多重点实验室建设的实践和实际建设成果表明,这一建设目标是非常正确的,既有满足国家经济社会发展重大需求的高度,又实事求是,符合实际情况,经过刻苦努力就能实现。
教育部验收专家组对重点实验室的建设目标定位及其实际实现状况给予的高度的肯定,建议重点实验室在前期建设成果的基础上,再接再厉向新的目标冲击,尽早将实验室建设成为国家重点实验室。
创新机制,加强团队建设和队伍建设
数据工程与知识工程教育部重点实验室是中国人民人民大学建设的第一个省部级重点实验室,是以信息学院和信息资源管理学院两个学院共同支撑的文理交叉的跨院系研究实体,在人事管理等方面进行试点,都体现自身的特色。
实验室成立以来,重视和加强团队建设,通过整合原有力量,引进优秀人才等方式,以教授为核心组建了7个研究团队。
团队建设效果明显,如以石文昌教授为首席研究员组建的“系统与信息安全团队”,吸收了信息学院的梁斌副教授、单智勇讲师、梁朝晖讲师,充分发挥团队优势,组建两年来,共承担国家“863”项目以及国家自然科学基金项目等10余项,科研经费300余万元。
在人事管理制度方面,实验室既有固定的事业编制、也有该领域兼职研究人员,同时也设立了流动编制岗位。
在中国人民大学进行了科研为主型岗位的试点,专职研究人员按照学校考核标准,教学工作量减半,科研工作量增加三分之二。
在引进海外优秀博士等人才方面,启动了特别研究员项目。
吸引在海外获得博士学位的有潜力的青年学者,给予特殊的人事政策,如采用年薪制,直接按照研究员聘任,两个聘期非升即走,允许独立带博士研究生与硕士研究生等。
2008年引进的陆嘉恒副教授在2009年已经获得“863”计划信息科学技术领域73万元的专题资助。
2009年还将至少引进3名海外博士,以加强计算机领域数据库领域的梯队建设。
实验室还聘请了以中国科学院数学研究院陆汝钤院士为主任、王珊教授为副主任,成立了由多位院士和国外专家组成的高水平学术委员会。
支撑学科建设,搭建信息领域高水平研究平台
筹建以来,作为重点实验室的重要的研究基础设施,重点建设了高性能数据库实验与测试平台、数据恢复迁移技术平台,整体水平达到国内高校最高水平。
高性能数据库实验与测试平台是开展各种数据管理理论与技术研究所必须的基础设施。
它既可以用于现有产品、技术的验证和测试,更能够用来通过大规模测试发现新的研究问题和应用问题,进而发现和指引新的研究方向、方法。
高性能数据库实验与测试平台目前共有服务器级别设备32台(套)(不包括各种配套PC计算机)。
其中包括:
曙光、IBM、SUN、DELL等不同型号和配置的服务器27台;
IBM小型机1台,拥有能进行百亿次计算能力的服务器,单机TPCC测试值最高能接近45万,及集群系统服务器4台(套)。
平台为支撑对海量数据的测试,配置了HP的磁盘阵列和磁带机,拥有近8T的磁盘存储空间和进20T的磁带存储空间。
该平台面向国家重大战略需求,针对国家中长期科技发展规划基础软件产品的研究任务,已经搭建成功能够研究开发TB级规模的海量数据库的先进试验平台,达到可测试数千个WAREHOUSE的程度。
搭建可开展各种新型数据库技术研究的试验平台,包括DAS实验平台、互联网数据集成与管理实验平台、流数据管理平台、系统与信息安全平台、集群环境下高可扩展数据库系统关键技术研制/测试/实验平台等。
平台基本条件目前在全国高校高性能数据库实验与测试领域是一流的。
平台建设期间已经承接国家自然科学基金课题10项,省部级课题4项,内容涉及主要有数据库信息检索、大规模本体库管理、数据流、DeepWeb、Web数据安全测试、数据挖掘、Peer-to-Peer数据管理等。
相关研究人员与学生在高水平的国际国内期刊以及国际会议上发表论文百余篇。
同时该平台还具备对国产大型数据库管理系统进行测试的能力。
数据恢复与迁移技术是目前数据工程与知识工程领域近年来兴起的一个研究热点,它具有极强的技术性和实践性。
相关理论研究和技术开发对增强国家信息资源控制力,对维护民族文化传承都具有重要的战略价值。
实验室已经形成建成一个具有国内一流水平的数据恢复与迁移技术平台。
数据恢复与迁移技术平台包括一个16平方米的100级超净室和一个30平方米的恒温恒湿室,以及逻辑分析仪、MD5电子取证设备、老化仪、磁盘阵列、光盘塔、磁带库和PC3000专业数据恢复软件等相关设备设施40多台(套)。
数据恢复与迁移技术平台的基本功能是为相关技术研发和技术政策研究提供实验条件,同时满足信息资源管理学院、信息学院、法学院相关专业教学活动的实习实验需要。
平台主持的科研活动主要包括:
各种现代电子数据存储介质中的数据恢复与迁移原理的研究;
磁盘阵列、硬盘、磁带和其他各种移动存储设备中的数据恢复与数据保全技术方法的研发;
相关产品和介质材料的理化性能测试分析;
各种信息系统、各种存储载体形式的电子化数据迁移方式、迁移方法与技术手段的研发;
电子取证技术与方法的研究;
我国数据恢复与迁移的总体规划与战略、策略制定过程中的预测和验证与模型构建;
数据恢复与迁移的标准规范制定过程中相关参数的分析与验证等。
目前数据恢复与迁移技术平台已正常运行,实验室的基本条件目前在全国高校数据恢复与迁移领域是最好的。
平台现有专、兼职人员8人。
平台建设期间已经承接国家社科科研课题1项,部级课题3项,内容涉及主要有磁盘阵列、硬盘数据、文档数据恢复和电子取证等,相关研究人员在省部级以上学术期刊上发表论文10余篇。
实验室的建设同时也支撑了相关学院学科的快速发展。
信息学院计算机科学与技术学科顺利通过北京市重点学科的评估,并新增软件工程工程硕士学科点。
信息资源管理学院的档案学被评为国家重点学科,并在学科评估中排名第一。
信息资源管理一级学科在教育部的学科评估中排名第二。
坚持开放,加强交流,成为国内相关领域国际对话的重要平台
通过开放课题,举办和参加学术会议,邀请海外学者学术讲座、合作研究等加强实验室的开放性,逐步形成为国内计算机数据库领域研究的基地。
实验室制定了开放基金管理办法,进行了两次开放基金的申请,共有13名校内外研究人员获得基金资助,申请了中关村开放实验室,加强与企业的合作研究,设立开放测试机位和条件,提供校外人员开放实验。
建立学者互访的学术交流机制,海外学者来访频繁,自2006年1月实验室建设以来,实验室共邀请海外学者来实验室进行学术交流达50人次。
不断加强合作交流,与美国hp实验室已经进行了三期合作,已经成为国内数据库领域国际对话的重要平台。
另外,实验室第一届学术委员会,成员包括两名院士和四位海外教授,成员均为国内该领域的重要学术人才。
在国际学术交流方面,交流的层次和深度都有了显著的提高。
2007年,和清华大学、北京大学合作承办了国际数据库顶级会议SIGMOD,2008年独立承办了国际移动数据管理(MDM)会议。
2007年和2008年组织召开了数据管理技术国际前沿(FDM)研讨会。
多位学者担任了本领域多个重要会议的会议主席或程序委员会主席、副主席等职务。
例如,2007年在北京召开的ACMSIGMOD会议,2009年将在香港召开的ACMCIKM会议等上王珊教授、杜小勇教授和孟小峰教授都担任了重要的学术职务。
在国内外学术会议上受邀作特邀报告10多次。
加强信息科学与技术与管理科学、法学等学科之间的相互渗透与融合,凸显文理交叉结合的鲜明特色
文理交叉结合是数据工程与知识工程教育部重点实验室建设的鲜明特色之一。
重点实验室的建设与发展过程中,始终自觉坚持体现不同学科领域之间的相互渗透与融合,具体而言就是通过创造一种环境氛围,通过创造一种机制,不断实践这样几个重要的“结合”,即:
将信息科学技术与管理科学、法学的发展紧密联系起来,发展它们之间在社会需求和内在发展逻辑推动下已经存在的渗透和融合关系,特别是将计算机数据库与信息安全领域的技术研究与信息化管理的需要和要求结合起来,更加具体的是把电子政务发展,电子文件管理和其他各种电子证据的管理结合起来;
将我校数据库领域的研究优势与信息资源管理学、档案学、证据法学的学科优势结合起来;
将我校在数据库,以及数据恢复、迁移、数据安全管理、计算机取证技术、电子证据鉴定等方面既有的技术优势与在国家信息化发展战略研究、管理体制和管理机制研究、法律制度与标准规范研究等非技术方面的优势结合起来;
把自然科学,特别是技术科学的研究方法与人文社会科学的研究方法结合起来;
把主要从事自然科学研究的研究人员与主要从事社会科学人员的人员通过共同项目的研究开发紧密结合起来;
把科学研究的成果中“硬”成果与“软”成果,根据经济社会发展的实际需要和要求紧密结合起来;
把人才培养中强调培养懂技术的管理者与强调培养懂管理的技术研发人员的目标需求按照高等教育的规律紧密结合起来。
目前,以实验室信息安全团队为主体,结合法学院的证据法等师资力量,正在筹建信息安全与计算机取证的计算机应用与法学的双学位实验班,为国家公检法等部门培养急需的既懂信息技术,又懂法律的复合性人才。
文理交叉结合已经逐渐开始成为数据工程与知识工程重点实验室的一种“文化”。
现在,共同的理想志愿、共同的研究领域、共同参与的研究课题,已经把“文”、“理”两支队伍越来越紧密地连接为一个整体了;
研究方法中技术科学一般方法与管理科学一般方法的结合运用,已经成为项目研究中的一种“刻意”追求;
研究成果中的硬中带软、软中带硬已经逐渐成为实验室重要科研成果的一种标志。
尽管我们现在的结合可能还比较初级,结合的实际效果也还需要进一步提高,但我们相信,这种“结合的文化”是我们的特色,也是我们重点实验室持续发展的动力,更是我们这个重点实验室的“根”与“本”。
承担多项国家重大项目,高水平研究成果不断涌现
重点实验室是理工学科开展重大科技项目研究的基础平台,可以发挥个体研究者无法体现的团队优势。
籍助该平台,计算机领域的5名教授,均承担了至少一项国家级项目,王珊教授还承担了一项国家自然科学基金重大项目课题,孟小峰教授承担了一项国家自然科学基金重点项目,杜小勇教授承担了一项国家“863”计划目标导向项目。
2009年2月12-14日,王珊、杜小勇、孟小峰等教授分别参加了工业与信息化部组织了国家中长期科技发展规划“核高基”专项基础软件部分的5-1(大型通用数据库管理系统)和5-2(非结构化数据管理系统)课题的答辩,预计课题经费将会有更大的突破。
从2006年开始连续在数据库和数据挖掘领域国际顶级会议VLDB、SIGMOD、ICDE、SIGKDD等,以及IEEETransaction,InformationSystem,DataEngineeringandKnowledgeEngineering,JournalofComputerScienceandtechnology等重要的国际期刊上发表论文,论文质量和数量都有了明显的提高。
王珊教授发表在国际期刊《计算机科学技术学报》(JCST)上的论文“SearchingDatabaseswithKeywords”,据世界著名出版商Springer的SpringerLink网站统计,先后两次成为JCST期刊上被访问最多的5篇文章之一。
另一篇论文“CLASCN:
CandidateNetworkSelectionforEfficientTop-kKeywordQueriesoverDatabases”经JCST杂志社推荐,参加了中国科协组织的专家评审。
在十几家科技期刊推荐的多篇论文中,该文脱颖而出,成为第4期中国科协向新闻媒体重点推荐的5篇文章之中的重点。
在数据永久存储特别是电子文件永久保存方面,2007年6月开始,冯惠玲教授为首席专家,赵国俊教授、王健教授、安小米教授等为主要成员的电子数据长久保存技术政策研究团队,承担了由中国科学技术协会资助的“电子文件管理机制研究”课题。
课题研究成果得到由多位国家级专家组成的鉴定专家组的高度评价,一致认为课题从中华文明传承的历史视角,从国家信息化建设与发展的战略高度,首次对我国电子文件管理机制问题进行了系统的研究,对我国电子文件管理现状、问题进行了全面调查和梳理,在分析和吸纳国外电子文件管理有益经验的基础上,提出了进一步加强我国电子文件科学管理的政策建议。
课题组形成的关于我国电子文件管理发展状况的基本判断,提出的构建我国电子文件管理体系的基本对策,具有较强的创新性。
课题组提出的建立健全电子文件科学管理机制的建议,反映了数字时代以电子文件为代表的电子数据管理发展趋势的要求,对提升国家信息资源控制力,加强我国电子文件的科学管理,具有较强的参考借鉴价值。
2008年7月26日,课题组的重要研究成果“关于加强电子文件科学管理的报告”送达中共中央、国务院,报告得到党和国家领导人的高度重视,温家宝总理第一时间批示“此件很好”并指示有关部门进行专题深入研究。
目前,重点实验室电子数据永久保存技术政策研究团队正配合党中央、国务院几个重要部门进一步深入研究,积极制定解决问题的一揽子政策方案。
2008年5月四川地震发生后,冯惠玲教授为首的团队就档案文献特别是电子化数据信息的抢救和数据灾害预防问题向国家有关部门提出系列政策建议,温家宝总理在第一时间做出重要批示,有关部门采纳了相关建议,对维护国家信息资源的安全和灾后重建工作做出了贡献。
此外,电子文件管理方面的一项重点项目也在洽谈之中。
自2006年1月以来,实验室研究人员在国际索引期刊上发表论文200余篇,其中SCI论文28篇,EI索引论文85篇,ISTP索引论文55篇。
承担各种类型的研究项目近80项,研究人员获得的项目经费达1000万元。
其中承担国家自然科学基金重大项目课题19项;
国家社会科学基金重大项目4项;
国家“863”计划项目6项、国家973计划项目1项;
教育部重点项目、国家发展与改革委员会、国家档案局项目等省部级项目14项以及国际合作项目3项。
在产学研结合方面,实验室加强和北京人大金仓在数据库系统产品研究上的合作,联合承担国家发展与改革委员会课题《北京人大金仓数据库产业化项目》,北京市教委产学研课题《基于内存的联机分析处理系统》。
同时,还与HP实验室、EMC公司、微软亚洲研究院等国际一流的企业和研究机构签署了合作课题。
特别是与HP实验室的合作,历时3年,续签合同3次。
合作成果得到了合作方的高度评价。
在专利和软件著作权申请方面也有新的突破,申请专利数量明显增加。
申请和获得专利30余项、开发原型系统10余个。
多个系统在国际顶级会议上进行了演示。
例如,王珊教授研究小组先后研发了SEEKER、DETETOR等6个基于关键字的数据库检索原型系统,在VLDB会议上演示获得了好评,论文曾获得ICDE2007优秀学生论文奖。
在重点实验室筹建之初,实验室建设管理委员会和学术委员会曾经为实验室的发展制定了一项“三步走”的发展战略。
第一步,用一年左右时间建成数据工程与知识工程中国人民大学重点实验室;
第二步,再用两年左右时间建成数据工程与知识工程教育部重点实验室;
第三步,经过三年左右的时间建成数据工程与知识工程国家重点实验室。
目前,三年多时间已过,前两步我们已经既快又稳地迈了出去,圆满达成了目标,现在正瞄准目标、积蓄力量准备迈出更加重要的第三步。
我们知道,这一步一定不平坦,一定会充满艰辛,一定会比前两步难上加难,但我们相信,在教育部有关部门的指导下,在实验室建设管理委员会和学术委员会的领导下,在全校各相关部门和院系的支持下,在全校师生员工的鼓励和帮助下,实验室将会坚定地迈出这一步,走好这一步,创造中国人民大学发展史上新的“第一”!