国外科学数据开放获取政策特点分析.docx

上传人:b****6 文档编号:3906996 上传时间:2022-11-26 格式:DOCX 页数:9 大小:48.65KB
下载 相关 举报
国外科学数据开放获取政策特点分析.docx_第1页
第1页 / 共9页
国外科学数据开放获取政策特点分析.docx_第2页
第2页 / 共9页
国外科学数据开放获取政策特点分析.docx_第3页
第3页 / 共9页
国外科学数据开放获取政策特点分析.docx_第4页
第4页 / 共9页
国外科学数据开放获取政策特点分析.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

国外科学数据开放获取政策特点分析.docx

《国外科学数据开放获取政策特点分析.docx》由会员分享,可在线阅读,更多相关《国外科学数据开放获取政策特点分析.docx(9页珍藏版)》请在冰豆网上搜索。

国外科学数据开放获取政策特点分析.docx

国外科学数据开放获取政策特点分析

国外科学数据开放获取政策特点分析

刘细文/熊瑞

2013-2-2611:

18:

47  来源:

《情报理论与实践》(京)2009年9期

  【英文标题】AnalysisoftheCharacteristicsofPoliciesonOpenAccesstoScientificDatainForeignCountries

  【作者简介】刘细文,研究员。

中国科学院国家科学图书馆,北京100190

  熊瑞,硕士生。

中国科学院国家科学图书馆,北京100190;中国科学院研究生院,北京100049

  【内容提要】科学数据的开放获取日益成为科学交流的新趋势。

美国、英国以及众多国际组织与研究机构都就科学数据开放获取问题,积极建立政策保障与管理机制,并在政策指导下广泛推行相关服务与实践。

其政策举措主要围绕科学数据交流渠道各环节,集中体现在数据开放资助、数据质量控制、数据合法保护、数据保存以及数据共享利用五大方面。

  Openaccesstoscientificdatahasincreasinglybecomeanewtrendofscientificcommunication.TheUnitedStates,theUnitedKingdomandmanyinternationalorganizationsandresearchinstitutionshavetakenvigorousmeasuresinformulatingsupportingpoliciesandmanagementmechanismsaroundthisissue,andundertheguidanceofthesepolicies,manyrelatedservicesandpracticeshavebeenpursued.Thesepoliciesandmeasuresmainlyfocusoneachlinkofscientificdatacommunicationchannels,embodyingin5majoraspects:

funding,dataqualitycontrol,datalegalprotection,datapreservationanddatasharing.

  【关键词】科学数据/开放获取/政策/分析Scientificdata/Openaccess/Policy/Analysis

  

  未来科学研究将大量运用并生成科学数据,以数据为中心、数据驱动科研的特征越来越突出[1]。

科学数据开放获取,即OpenAccesstoResearchData或OpenAccesstoScientificData,是指科学数据/研究数据能够没有任何障碍地被利用、学习、修改、复制和传播,或者仅因为要确保用户更好地获取数据而采取一些措施[2]。

一般意义上,“开放获取”的开放对象强调的是具有创新性的作品或资源;而“科学数据开放获取”则主要是针对科学数据的开放使用,尤其是对公共资助研究数据的开放使用,它主要面向于事实性数据与科学研究过程生成的数据。

  2003年10月,德国马普学会发起并召开柏林会议,会上通过的《柏林宣言》指出开放获取的内容不仅包括原始的科学研究成果,还应包括原始科学数据。

2004年1月,世界经济合作与发展组织(OECD)的34个成员国签署发布了《开放获取公共资助研究数据的宣言》,并于2006年12月颁布了《开放获取公共资助研究数据的原则和指南》。

报告中明确界定了开放数据的范围和定义,并提出了13条原则与指导方针,以促进公共资助科学数据的低成本、高效率获取。

  2006年10月,CODATA在北京成功举办了主题为“信息社会中的科学数据与知识”的国际会议,会上就“数据存档”、“跨学科元数据互操作”、“数据获取政策”、“数据质量”等问题展开广泛讨论。

2007年2月,在布鲁塞尔召开的欧洲委员会会议上,重点讨论了研究数据的集成化开放获取。

由此可见,科学数据的开放获取、共享和利用正逐渐成为新的趋势,各国政府、研究服务机构等都在积极探索科学数据开放获取的政策管理机制,取得了可喜进展。

  1美国、英国科学数据开放获取政策

  1.1美国

  20世纪90年代,在美国科学界对“数据共享”的强烈要求下,美国政府开始在科学数据方面实行“国有科学数据完全与开放共享国策”,该国策的总体思路是由联邦政府统筹规划科学数据的管理,充分发挥各个部门的作用,利用行政、财政、政策和法规全面推进数据共享的工作。

美国国有科学数据“完全与开放”共享管理保障体系包括:

国家投资数据开发与共享管理;建立与健全与投资相配套的数据共享政策法规(包括国家法律、规定及部门规定等);建设国家级数据中心群和数据共享网,保障科学数据源源不断地产生和共享渠道的畅通;政府采取不歧视政策鼓励全社会(包括私营公司)以工本费(不超过数据复制和传递过程中产生的费用)的价格使用数据;国家通过投资和立法加强对医院、大学以及非营利性研究单位国家投资科研项目产生数据的管理;国家加强科学数据质量和标准的管理;国家加强对科学数据共享服务人才队伍建设的管理以及数据应用技术培训和服务等[3]。

  美国在科学数据管理中,采取3种数据共享管理机制[4]。

第一,美国对于有可能危及国家安全、有可能影响政府政务、有可能涉及个人隐私的数据和信息均纳入保密性运行机制中管理,并对这些内容给以十分严格和明确的规定。

第二,对于政府拥有、生产和政府资助生产的数据,便纳入到“完全与开放”的共享管理机制之中。

例如,美国海洋与大气局、地质调查局、国立卫生研究院等联邦政府拥有和生产的数据,科罗拉多大学国家冰雪数据中心等政府资助生产的数据,以及政府资助的大学和研究机构项目产生的数据等。

第三,对于私营公司投资产生的数据则纳入到“平等竞争”的市场化共享管理机制。

例如,美国政府批准了空间影像和数字地球两家企业从事高分辨率遥感数据的获取和发布业务,然后采取鼓励平等竞争的政策,通过市场竞争的方式降低数据价格,达到促进数据应用的目的,并同时通过税收进行调节和控制。

  1.2英国

  英国对国家的科学与创新向来有很强的政策承诺。

2004年,英国财政部、贸易工业部(DTI)和教育技能部(DfES)共同出版了《科学与创新投资框架2004-2014》,框架中的一部分特别提出,要建立科学研究网络化基础设施与框架[5]。

该文认为,未来10年里,越来越多的英国研究基地必须有准备,并能有效率地访问包括实验数据集在内的各类数字化信息,这将是科学研究与创新的血液。

  英国在科研公共资助上采取的是“双重支持政策”,分别由英国研究理事委员会(RCUK)、英国基金委员会及其下属单位提供研究资助,这种体制同时也支持私人、政府部门、慈善团体、欧盟及其他国际组织等的委托研究与资助。

这些机构在资助过程中,都要求科研个人或机构对科学数据的创建、收集或管理要遵守一定的责任与义务。

RCUK认为科学数据是一种长期的、公共性质的资源,数据开放共享能为科学探索提供更多有利机会;它也十分重视科学数据的有效管理,并规定参与数据开放共享的组织与研究人员拥有优先权。

2007年,RIN对英国的研究资助者发布了一项对研究成果管理政策报告[6],报告表明许多研究资助机构开始对资助对象在数据发布、共享、保存及管理上,都提出需要遵循的责任义务和相应的数据共享政策。

尽管资助者也规定有不提供数据发布、共享的允许条件,但研究者与研究机构需要提高对科学数据开放获取的自觉意识。

  2主要科学数据机构的开放获取政策

  2.1数据服务机构

  世界数据中心系统ICSU-WDC(InternationalCouncilforScience-WorldDataCenterSystem)[7]是为了保存和传播从1957-1958年度国际地球物理观测项目搜集来的数据而建立的,目前包括来自12个国家的52个中心,主要收集有关太阳能、地球物理、环境和人类相关的数据。

WDC系统由各国国际科学团体代表负责资助和维护,接受来自国家和国际科学和检测项目的数据,所有的数据只需要一些复制和传播成本费就能获取。

WDC的具体情况如下[8]。

  1)WDC运作原则和责任。

运作WDC所需资源由各个主办国或机构负责,使这些资源能提供长期保障。

由于任何原因导致的某一个中心关闭,其数据应该转移到WDC的其他中心。

各个数据中心要利用自己的财政资源,按照数据管理的要求接收ICSU项目和监测活动的数据,并且安全地存储这些数据。

各个WDC可以寻找和搜集相关数据集以提高收藏量,也可以准备高度有序的数据产品,如活动指数、集成的和压缩的数据集。

  2)WDC数据来源。

WDC接收来自个人科学家、项目、机构、地方和国家数据中心、WDC其他中心提交的数据。

数据获取途径包括可能由负责WDC的机构负责的例行检测项目;ICSU资助的科学项目;WDC的“数据拯救”项目(保护老数据或数字化老数据集)等。

WDC不收集机密和安全数据。

  3)WDC收集数据的方式。

WDC不按商业方式购买数据,他们可能通过提供其他数据或服务来交换这些数据,或者同意支付这些数据的获取成本。

  4)WDC数据开放时间。

WDC同意数据可以由组织者享有优先使用权,一段时间之后才公开获取,但从WDC得到数据算起,这个时间段不能超过2年。

  5)WDC数据传播方式。

WDC将发布数据集的机读目录,以方便用户获取;并且以交换或者只收取少量的复制和传播成本的形式,向任何国家的科学家免费提供数据,额外的费用可能用于特殊服务或者是从WDC系统外获取数据。

另外,众多数据服务机构如ODaF,CODATA,ICPSR,AHDS等,也在针对目前科学数据开放获取的各个领域、各类问题,进行着努力和尝试,为推动科学数据的保存、获取、共享发挥着重要作用。

  2.2科学研究资助机构

  2.2.1美国国家科学基金会2007年,美国国家科学基金会(NSF)发起了一项2006-2011年的全面战略规划,其中对科学数据及其数据分析与可视化提出设想[9]:

在未来,美国在国际科学和工程领域的领先地位,将越来越多地取决于我们是否有能力把握和利用好科学数据,这些数据以数字形式抓获,并通过复杂的数据挖掘、整合、分析和可视化工具,被转化为信息和知识。

它主张将各个数据收集与管理组织通过网络联结起来,建立一个覆盖全国的数字化数据集成框架。

  美国国家科学理事会(NSB)也发表了报告《长期保存的数字化数据集》,强调数字化数据集对科学研究与教育日益增长的重要性,以及它们为扩大各类研究参与范围的巨大潜力,NSF应大量增加其对现有数据集与未来增殖数据集的创造、维持和长期保存等研究资助。

  NSF倡议建立一套全国数字化数据网络集成体系与框架——Datanets计划[10];预计在10年内投入1亿美元,资助建设五大研究数据网络。

计划在Datanets建设过程中,逐渐减少资助金额,到最后全面建成时完成与NSF的脱离。

NSF鼓励其他国际数据网络与Datanets连接并结成合作联盟,它将帮助合作伙伴推进相关计划行动。

它还认可了美国大学图书馆在数据保存方面的重要作用,并鼓励图书馆与档案馆踊跃加入Datanets联盟。

  2.2.2英国联合信息系统委员会英国联合信息系统委员会(JointInformationSystemsCommittee,JISC)曾与英国研究理事会(RCUK)、国家图书馆网络项目(RLN)、英国委员会中心实验室理事会(CCLRC)几大机构就研究成果(包括期刊论文、研究数据等)开放获取问题发表过联合声明,认为公共资助研究成果中支撑发表论文的科学数据应当尽可能广泛、快速地被获取。

  JISC在e-Science、e-Resources、e-Learning、e-Administration等领域都有着重大贡献,于2003年发布了《e-ScienceCuration报告》[11],报告对e-Science背景下科学数据的管理方式进行了研究,指出科学数据从档案管理的方式到在整个科研活动过程中的管理方式的变化,提出要对科学数据进行整个生命周期的管理,并资助建立了数据保管中心(DigitalCurationCenter,DCC)。

  目前,JISC正在资助“DISC-UKDataShare”大型机构仓储库项目(2007-2009年),由Edina与爱丁堡大学数字图书馆牵头、英国数据信息专业委员会下属的大学和职业部门联盟成员共同承担。

项目主要针对如何在复杂、动态的信息环境下为研究机构建立共享研究数据的新模型、新流程机制等问题,内容包括加强机构知识资产管理、开发e-Research技术、制定新政策新要求,以及推动开放获取/开放数据运动进步等。

  DISC-UK是一种基于分布式的合作模式,它要求每个研究参与方负责改善与管理各自机构存储库、数据图书馆与数据支持模式。

在这种合作模式下,势必能促进更广泛的科研环境融合,促使更多共享与研究合作活动的发生。

  2.3认证机构

  CreativeCommons(CC)是美国一家为作者、科学家、艺术家、教育家提供“创作共享”的著作权认证的机构,著作权只需计算机操作便可在“保留全部权利”、“保留部分权利”到“完全公开”中自主选择其权利范围和认证机制。

CC最初是服务于音乐、美术、文学、影视等领域,后来逐渐关注和扩展到科学领域。

由于科学领域研究成果的共享与利用问题十分复杂,不同学科差异也很大,因此,2005年,CreativeCommons启动了ScienceCommons(SC)项目,专门致力于研究科学领域的著作权认证机制问题,以促进科学家、大学与行业共同分享科学数据与知识。

SC主要进行三大方面的研究,以消除科研数据及其他成果在法律、技术上的开放获取障碍[12]。

  1)使研究数据开放获取合法化。

例如在“学术研究人员著作权”项目[13]中,制定了“实施数据开放获取的协议”[14],实现某数据库与其他国家、学科的数据库能够连接互通;通过开放工具与资源,来扩大与增加科研论文与科学数据的开放获取。

  2)促进实物研究材料的转让,用于研究的验证与扩展。

例如在“生物资料转让”项目[15]中,开发部署了标准、模板合同,来降低生物实物材料(如DNA、细胞系、动物原型、抗体等)转让成本,该项目覆盖了非营利性机构、营利性机构。

它将现有标准协议与科学共享协议整合成网络安装套件,该网络套件可配置在亚马逊、eBay交易系统上,从而可借助其发现转让材料,达成共享交易。

  3)整合分散的研究、数据、资料和服务等资源,提供许可获取。

例如在神经学共享项目[16]中,建立了一个生物研究的开源知识管理平台。

平台第一步,是通过文本挖掘与自然语言处理方法,对开放共享的生物医药文摘中的知识进行组织;第二部分,是开发数据分析软件系统,并以BSD开源软件认证发布标准来发布。

SC通过上述有关项目,致力于制定和利用开放标准与方法,建成开放、协作的基础框架,促进科学数据向科学发现的转化。

  3科学数据开放获取政策与举措分析

  综观国外主要国家与机构制定的有关科学数据获取政策与举措,其核心是围绕科学数据整个交流渠道展开的。

其交流渠道可被看做:

以政府、公共研究机构向科研人员提供资助为起点,经过科学数据的产生、发布、管理与利用四大环节,最终传递给所需用户(见图1)。

支撑各个环节的政策与举措则集中体现在数据开放资助、数据质量管理、数据合法保护、数据保存和数据共享利用五大方面。

  

图1 科学数据交流渠道

  3.1数据开放资助政策

  对于科研人员而言,过程研究数据没有完整妥善地保存、共享和利用,许多可能是因为研究资助方未做出明确规定,因此,研究资助方对科学数据开放共享管理方面的政策规定显得至关重要。

英国政府及公共研究机构在进行科研资助时,一般都规定获得资助的研究机构需要有设定保管数据责任及过程的指导方针,他们十分关注项目申报者对科学数据发布、保存及共享管理上做出的承诺。

英国生物技术与生物科学研究委员会(BBSRC)优先资助那些对研究数据有科学、实践性规划的项目,要求研究者在科研过程中始终清晰而准确地保存好过程、结果以及中间数据等。

英国医学研究理事会资助的个人或机构必须遵守数据创建、收集或管理的相应责任,在项目申报书中必须编制数据保管费用计划,在年底资助款项汇报中,汇报相关的数据管理与共享活动。

此外,美国国家卫生研究院(NIH)要求受NIH资助或部分受NIH资助的研究项目要共享最终研究数据(FinalResearchData),但考虑到开放共享科学数据也需要花费时间和金钱,NIH允许受资助者可以在资助申请书中向NIH申请经费作为直接数据共享成本。

  3.2科学数据管理政策

  3.2.1数据质量控制政策科学数据的价值与可用性很大程度上依赖于数据本身的质量。

数据管理者、数据搜集机构应注意提供满足明确质量标准的数据,各机构或研究组织可以独自也可联合相关研究团体来共同制定质量标准,这对促进任何领域数据质量的提高都是有利的。

但是,由于一些学科对数据质量的要求更为严格,所以制定一个各学科普遍适用的质量标准显然是不实际的。

制定质量标准的过程中应征询相应学科研究人员的意见,确保标准的质量与精确度都能满足需要。

  美国密歇根大学校际政治及社会研究联盟(ICPSR)在提供社会科学数据开放服务时,会先按照一定标准收集到数据,并对这些数据进行必要的格式处理和加工,再传播使用[17]。

英国生物技术与生物科学研究委员会意识到数据质量的重要性,认为数据应当附加相应的背景信息或元数据记录,使数据利用者能够了解数据来源或处理过程中的细节,防止数据的误用、误解或混淆[18]。

英国医学研究理事会也要求对科学数据附以合适、高质量的元数据来发布。

世界数据中心(WDC)则要求数据提供方需对他们提交的数据质量负责;WDC只能对他们自己生产的数据和数据产品实施质量控制,因此鼓励数据生产者和用户对数据质量进行评价。

  3.2.2数据合法保护政策数据版权保护是最常见也是最重要的部分之一。

科学数据的发布、出版系统,需要辅之以适当的许可证模式(License),这样可以使科学家在尊重著作权人知识产权权利和“合理使用”原则的前提下,使用公开发布的科学数据,并在其基础上创造新作品,进而再公布新作品。

因此,建立共享许可协议、共享认证对于科学领域,尤其是应用科学研究中的科学数据开放获取,是十分必要的。

对于众多科学领域的研究成果,应当通过创建认证、合同、技术等各种措施机制,来保证科学数据能合理合法地开放获取与共享。

但对于特定领域的科学数据或科学发现的共享,设定一定障碍也是必要的。

  此外,数据开放使用过程中应该尊重公共研究单位和所有利益相关者的其他合法权利与利益。

部分属于国家安全、隐私和保密、商业秘密和知识产权、法律过程等的科学数据,由于其本身的特殊性质,其获取与利用应受到知识产权法、隐私法,安全法等不同法律保护。

例如NIH为保护对象隐私,会对数据进行必要的处理以降低风险,如把对象身份信息隐藏等;对于敏感数据,NIH允许不予共享,但必须解释为什么不能共享,获取正式同意。

  3.2.3数据保存政策英国政府和相关机构对数据保存工作十分重视,纷纷颁布数据保存服务计划,通过数据保管中心、数据机构仓储库或者独立保存等各种方式实施科学数据存储和提供利用。

英国国际发展部、英国健康部都声明,与研究发现相关的数据都应当保存和提供获取利用;英国国家档案馆也在向政府部门提供一项“数字连续性计划”数据长期保存与共享服务。

英国生物技术与生物科学研究委员会要求受资助的个人或机构将研究过程中生成的数据,以论文或电子版形式安全地保存起来,保存年限期望是项目结束后10年。

英国医学研究理事会的数据共享与保存政策期望和规定,数据要在其整个生命周期内妥善保存[19],但没有提供的数据保管中心,数据由来源机构妥善保管;而英国国家环境研究委员会(NERC)则提供了数据中心,研究人员或机构将数据提交给数据中心统一保管,只有合理时间后才能由数据创建者独享[20]。

英国的多所大学则由研究人员或研究部门将数据保存在机构存储库中,一些大学由英国研究理事会资助开展数据保存活动。

  3.3数据共享利用政策

  各研究团体、组织机构的情况不同,各组织规定科学数据开放共享的对象、方式、途径、费用、时间长短上也有所差异。

总体而言,共享利用政策比较灵活,但整体上都是采用各种机制满足用户能够公正平等、即时有效、低成本获取科学数据的原则。

  英国PubMedCentral倡议的参与成员BBSRC,MRC等,在发表论文时,需向论文录用期刊提供支撑论文正文的附加材料与数据。

美国的ICPSR为了方便数据的传播、分析和利用,会收集、保存、开发综合性文件,提供关于数据集特征、分析技术和方法方面的咨询和培训,来促进用户对其数据资源的有效利用;另外,ICPSR的开放和公平获取数据(OpenandEquitableAccesstoTheseData)并不是对所有人的开放,只有交纳了年费的机构会员(包括大学、国家数据中心、统计和研究机构、政府部门和非营利性商业组织等)的用户才能免费获取数据;非机构会员的用户则需交纳一定的费用获取数据[21]。

  NIH的科学数据共享政策也十分典型,它规定[22-23]:

①被共享的对象为最终研究数据,即那些记录下来的被科学界普遍认可的对研究结果有重要意义的事实资料,而不包括部分数据集、初步分析、科学论文草稿、未来研究计划、同行评议报告、同事交流和物理实体,如凝胶或实验标本等。

②包括基础研究、临床研究及调查等在内的各类数据都应该共享,但为避免重复应保证是唯一性的数据。

③为了保证数据的时效性价值,NIH要求尽快公开和共享数据,至少不晚于基于最终数据集的主要研究成果被出版物录用的时间。

具体时间段还要受数据收集特征的影响,小研究项目的数据可以更快地分析并提交出版;如果数据是有关大型流行病或追踪性研究,通过几个离散的时间段搜集而来,数据的公开和共享可以推迟些。

④共享数据通过作者在个人网站、机构网站上发布实现共享,也可以存储到数据库(DataArchive)中,DataArchive是一个提供机器可读数据的获取、控制、存档以及最终传播给科学界供进一步分析的地方;而对于那些敏感数据还可以通过DataEnclave实现共享,DataEnclave是一个受控的安全环境,在那里资深研究者可以利用和分析那些受限数据(RestrictedData)资源,即那些由于国家安全或机密原因不能向大众公开的数据。

  4结束语

  国际上各国家政府、研究机构围绕科学数据开放获取广泛开展的服务与实践,值得我们学习和借鉴。

我国可以结合实际情况,总结建设经验,寻找并实施推动科学数据开放获取的政策、方法与机制。

在科学数据开放获取的战略实施进程中,考虑评估、资助和监督相关研究项目与实施计划;建立公共资助科学数据的开放获取的原则与标准;开发科学数据共享获取的技术标准与元数据,关注不同资源库、不同类型、不同学科数据的互操作问题;鼓励政府机构、研究资助机构以及大型的数据生成机构建立合作联盟;加快培养和提高政府部门、资助机构、研究机构、大学、研究人员及公众的“开放数据”意识;图书馆可以组织建设“数据图书馆”,设立科学数据服务馆员岗位,等等。

通过有计划、分阶段地执行科学数据开放获取策略,为支持研究人员乃至公众开展科学研究,提供便携可靠的科学数据

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 环境科学食品科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1