专利视角下云计算领域的知识图谱研究.docx
《专利视角下云计算领域的知识图谱研究.docx》由会员分享,可在线阅读,更多相关《专利视角下云计算领域的知识图谱研究.docx(18页珍藏版)》请在冰豆网上搜索。
专利视角下云计算领域的知识图谱研究
收稿日期:
2012-07-21
修回日期:
2012-09-03
基金项目:
江苏省社会科学基金
“江苏物联网产业发展路径及产业链培育问题研究”(编号:
10GLB004;江苏省高校哲学社会科学重点研究基地重大招标课题
“物联网产业技术路线与商业模式演进研究”(编号:
2010JDXM034。
作者简介:
黄卫东(1968-,男,博士,教授,研究方向:
知识管理、数据挖掘、物联网产业发展路径等;赵佳(1987-,女,硕士研究生,研
究方向:
技术创新管理、物联网产业发展路径。
专利视角下云计算领域的知识图谱研究
"
黄卫东
赵
佳
(南京邮电大学物联网产业发展研究基地
南京210046
摘
要
专利是科学技术的重要知识载体,在技术创新升级和产业跨越式发展中,发挥着不可或缺的作用。
利用可
视化工具,对专利数据库中云计算技术专利进行分析,研究合作网络及其聚类的知识扩散机制,在云计算专利权人特征描述的基础上,绘制云计算专利共被引、专利发明人以及专利发明机构的知识图谱,形象地反映出云计算领域技术发展态势及其研发主体间的合作关系。
结合研究结论,提出了引导我国深入布局云计算产业发展蓝图的对策建议。
关键词
云计算
专利
共被引分析
知识图谱技术扩散可视化
中图分类号
G306
文献标识码
A
文章编号1002-1965(201301-0086-06
ResearchontheKnowledgeMappingofCloudComputingfrom
thePerspectiveofPatentCitations
HuangWeidong
ZhaoJia
(TheResearchBaseofInternetofThingsIndustryDevelopment,NanjingUniversityofPosts
andTelecommunications,Nanjing
210046
Abstract
Patentsareimportantknowledgecarrierofscienceandtechnology,whichhaveplayedanindispensableroleinthetechnological
innovationupgradingandindustrialgreat-leap-forwarddevelopment.Withthehelpofvisualizationsoftware,thepatentsofcloudcom-putingfromtheDerwentInnovationsIndexdatabaseareprocessedtostudytheknowledgediffusionmechanismofcooperativenetworkandluster.Onthebasisofdescribinginstitutionscharacterizations,wedrawtheknowledgemappingofpatentco-citationnetwork,inventorcooperativenetworkandcooperationofinstitutionsnetwork,vividlyreflectingthedevelopmenttrendofcloudcomputingtechnologyanditsR&Dcooperationrelationsbetweeninventors.Combinedwithresearchfindings,weputforwardsuggestionstoguideourin-depthlayoutofthecloudcomputingindustryblueprint.Keywords
cloudcomputing
patents
co-citationanalysis
knowledgemapping
technologicaldiffusion
visualization
0引言
云计算被许多学者看做未来3-5年全球范围内最值得期待的技术革命。
它将拥有一个充满想象力的诱人的市场,对于正在进行的市场角逐,如何通过技术优势实现产业化的跨越发展,
将是国家竞争力的重要一环。
云计算技术的本质是一种新兴的共享基础架构的方法,
能够将巨大的资源池连接在一起以提供各种IT服务。
因此云计算有着数据或服务高度集中、虚拟化、
高可靠性、通用性、高扩展性、按需服务、成本低廉等优势。
2006年谷歌启动了一个服务器集群项目,利用核心软件MapReduce分解并整合所有由单个计算机反馈的任务,这就是云计算的雏形
[1]
。
云计算技术
专利大多与数据存储、数据管理安全有关,例如谷歌公司的MapReduce专利,
即高效大规模数据处理技术,是云计算最核心的专利之一,广泛运用于各类数据挖掘。
目前IBM、微软、谷歌等企业掌握着核心技术专利,2010年是云计算发展最快速的一年,除了发达国家外,
许多发展中国家的公司也抓住这一机遇,开始积极布局云计算技术研发与产业化应用,国内中兴通讯、
第32卷第1期2013年1月
情报杂志
JOURNALOFINTELLIGENCE
Vol.32No.1Jan.2013
华为公司等已经在云操作系统、SDPaaS云部署、类AppStore云应用程序平台等产品和解决方案上纷纷布局专利技术研发。
技术进步推动产业发展,核心技术演化和提升是以知识扩散为基础的,专利作为研究知识扩散的重要视角之一,能够展示技术创新的演进脉络和专利主体的协作路径。
因此研究云计算领域的专利发展情况,分析云计算核心技术、专利发明人及科研机构的知识共享演进过程和现状布局,能够为政府和企业决策者提供可信的竞争情报,有助于集中资源突破关键技术、实现技术赶超和产业跨越,布局我国云计算产业良性可持续性发展的战略蓝图。
1专利视角下的知识扩散研究现状
知识扩散,是知识管理领域的重要分支,反映组织内或组织间知识流动的状态和方式。
一项发明专利在前向引用和后向引证的过程中,不仅产生了知识流动,也显示了出技术扩散的轨迹。
因而专利引证经常被视为技术扩散的途径之一,来衡量科学技术发展中技术扩散的过程和效果[2]。
国内外专利视角下知识扩散的研究领域主要集中在以下六个方面:
国家间的知识外溢与扩散、专利流动对生产率及研发产出的影响、同一产业或不同产业间的知识流动和技术扩散、专利引证和网络分析方法结合的技术扩散研究、专利视角的技术扩散曲线和基于扩散模型的技术扩散预测[3]。
相应地,专利视角下知识扩散研究思路也从单纯的专利引用分析向更为复杂的网络分析演进,即从注重研究专利技术影响力的单纯专利引用,转而通过社会网络分析、路径网络、多维尺度聚类分析等复杂网络分析方法,可以更清楚地揭示出专利及其发明人之间合作引用关系和知识扩散的演化路径。
近年来,随着科学技术的发展和专利情报使用者需求的提升,专利知识扩散网络的可视化表达越来越被人所重视。
因此,知识图谱作为能够将复杂专利引文知识共享与扩散网络以图谱形式形象呈现出来的重要工具,已经成为当今学术界研究的热点。
具体来说,它是一种把现代科学技术知识的复杂领域通过数据挖掘、信息处理、知识计量和图形绘制等手段以可视化的图像形式形象地展现出来的科学研究方法[4,5]。
知识图谱最初是应用于研究学科演进规律的,学者们利用可视化图谱的结论来指导学科领域的学术研究,现在也被用来分析专利技术的演进路径。
目前活跃在专利知识图谱科研领域的专家主要有大连理工的WISE实验室和黄鲁成等。
大连理工学者将文献计量学可视化研究成果引入专利计量,通过多种可视化工具,分析了数字通信技术、太阳能光伏电池技术、纳米技术等领域的专利引文网络。
黄鲁成则从产业技术发展路径角度,通过绘制专利引文网络,找寻某产业核心专利的演进路径[6]。
在云计算专利方面,官思发已经开始尝试技术热点的可视化研究,进行了专利主题分析和发明人分析[7]。
但云计算领域的知识图谱研究尚未涉及,我们拟通过设计有效的共被引聚类算法,研究云计算专利中基础技术和前沿技术的扩散和演进,并用共被引网络图谱的方式展现出来。
2基于专利的云计算知识图谱分析
2.1数据选择及研究框架为反映云计算产业技术扩散水平,本文拟从专利共被引角度,绘制云计算共被引知识图谱。
其中样本数据,来源于德文特数据库(DerwentInnovationsIndexSM,简称DII。
Derwent是全球权威的专利情报和科技情报机构,其专利数据库也是专利情报领域公认最专业数据库。
在数据库上以“cloudcomputing”为主题词,时间节点截至2012年7月13日,经过筛选和整理,共检索到1082项专利。
数据整理工作完成之后,我们首先给出云计算产业技术扩散的研究方法框架。
通过梳理云计算专利权人信息,勾勒出其特征分布,为进一步深入分析专利权人共被引的关系做铺垫;针对合作网络引入聚类分析研究云计算领域专利可视化知识图谱,包括云计算专利共被引知识图谱、云计算发明人共被引知识图谱、云计算研发机构共被引知识图谱(见图1。
本文研究过程中采用了美国德雷克塞大学的CiteSpaceⅡ软件,CiteSpace能够导入引文知识库数据,在此基础上我们试图通过引文分析和聚类分析寻找研究热点及趋势,把科学文献之间的关系转换为几何问题和统计学问题研究其内在联系,并以可视化的方式展示,以便评测某种学科或领域的研究前沿和研究模式[8,9]
。
图1云计算领域专利知识图谱研究框架
2.2云计算专利热点领域演化之计量分析通过分析采集到的德温特数据库云计算专利,统计了专利数量前十名专利权人的基本信息如表1所示。
由常规专利分析可以看出,10个高产专利权人的专利申请
·
78
·
第1期黄卫东,等:
专利视角下云计算领域的知识图谱研究
量,占到了全部云计算专利的30.037%。
其中有6个是公司,可见公司仍然是知识创新的主体。
而美国的公司占据了8位,共有专利254件,占26.25%;中国企业2家,28项专利,占2.59%。
拥有云计算专利最多的公司是美国IBM公司,仅该公司一个,就拥有104项云计算专利,占到全球的9.6118%。
此外,美国的个人发明者共拥有68项专利,
占6.2846%,可见个人在云计算研究中也起着必不可少的补充作用。
总体而言,美国在云计算领域的科研实力在全世界遥遥领先。
中国唯有中兴公司能跻身于榜单第四名,一方面说明我国在云计算领域同发达国家存在巨大的差距,一方面也显示出我国企业努力追赶国际先进标杆,积极拓展技术研发的潜力和实力。
表1
云计算专利领域主要专利权人及所属国家
高产专利权人专利数量
所属国家所占比例%性质INT
BUSINESSMA-CHINESCORP104美国9.6118公司MICROSOFTCORP98美国9.0573%公司FERRISJM31美国2.8651个人ZTECORP16中国1.4787公司RIVEROSGE15美国1.3863个人NOVELLINC14美国1.2939公司CANONKK
13日本1.2015公司HONHAIPRECISIONINDCOLTD12中国1.1091公司FEING11美国1.0166个人MERRITTE
11
美国
1.0166
个人
要想实现云计算技术领域的快速发展和全面突破,掌握市场战略动态,就必须对该专利研发领域的技术演化及其专利权人合作机制进行深入分析。
首先我们引入文献计量学中的两个概念,“研究前沿”和“基础技术”,“研究前沿”是普赖斯最早提出的概念
[10]
用它
来描述研究领域的动态本质,某个领域的研究前沿是由科学
家积极引用的文章所体现的。
本文借鉴这一概念,将文献之间的引用关系转换为专利之间的引用关系,专利的研究前沿体现的是技术演化的发展趋势和路径。
我们用ψp(t标注由专利引文
形成的技术趋势“研究前沿”,用Ωp(t表示由被引文献构成的
“基础技术”,建立一个从专利研发前沿(技术趋势领域ψp(t到专利基础技术Ωp(t的映射,即φp(t:
ψp(t→Ωp(t。
我们利用共引聚类进行图谱
分析,有效地识别和显示随时间发展的专利基础技术到领域前沿的演化趋势。
据此,我们认为,专利基础技术是由被引专利组成
的,在共被引网络中表征为共引聚类。
我们需要对专利基础技术进行调谐,这是我们计量工作的核心。
从专利数量(c、共被引频次(cc、共被引系数(ccv三个层次调节专利基础技术的范围,经过反复对比试验,我们发现适当的组合比例能够使得专利基础技术在某一时段保持稳定。
同时,裁剪不必要的连接、精简网络有助于探寻专利热点演变趋势,
在映射模型基础上,我们改进了CiteSpace系统[11-12]
中Pathfinder算法的设
计,根据三角不等式(连接两点的一条路径不能超过其他任意多条连接路径长度检验以决定保留或者删除某些连接。
另外,
CiteSpace对处理的数据格式有固定要求,我们也编写程序调试,通过对某些特殊含义字段的转换,变德文特数据为软件工具中可识别的规范数据。
在完成理论梳理和数据预处理的基础工作后,
开始绘制专利技术演化图和专利权人合作图谱。
2.3
云计算专利前沿领域之知识图谱分析
2.3.1
云计算专利技术共被引知识图谱。
反映
专利前沿趋势领域演化的是专利技术的共被引图谱。
专利共被引反映的是专利之间互相引用关系,从图谱中能够形象地反映出专利之间的联系,通过数据关系也能够分析核心专利的影响力情况。
选取数据的时间区域从1996-2012,时间切片为1年,citedpatent为节点,运用我们改进的pathfinder算法,确定合适的阈值,绘制出云计算专利共被引图谱,如图2所示。
图2
云计算专利共被引知识图谱
云计算共被引专利知识图谱呈现出复杂网络化的相互引用关系,该图谱共有节点57个,连线81条,中心度(Density为0.0508。
图中每一个节点圆环代表一项专利,
引用年环代表这篇专利的引用历史,年轮的颜色代表相应的引用时间,年轮的厚度与某个时间分区内引文数量成比例,节点中心旁的数字代表整个时间跨度内的被引次数。
研究发现共被引网络知识图谱中的关键节点应当是图谱中连接两个以上不同聚类,被引频次较高且中心度较大的节点
[12]
。
因此,本文首
先将图谱中按照引用次数Freq排序,找出排名前5名
·88·情报杂志第32卷
的专利,即整个云计算领域最为核心的专利,如表2所示。
关键节点往往是产生研究领域变革的转折点,
即本文重点分析目标。
图谱中最核心的节点是专利高产专利权人FERRISJM发明的专利,它的美国专利申请号是US2009300210-A1的专利,其手工代码代表的意义相应是“Arrangementsforinterfacingwithnetworks、Sorting、Multiprocessorsystems、Servers、Systemandfaultmoni-toring、Browser”。
在云计算领域中,这些都属于关键技术。
如何改进排序算法、采取多重处理器系统、进行服务器的云端架构、实施云安全监控,能够保证云端优化畅通,将成为今后云计算领域技术突破的核心难题。
表2
云计算领域主要共被引专利(按频次排序
rankFreqCentralityyearCitedReference
190.012009FERRISJM,
2009,FERRISJM2402010FERRISJM,2010,FERRISJM330.012010LUOJ,1015,CHENGDUHUAWEI
SAIMENTIEKETECHNOLOGYL4302007LEWISJ&GARDNERP&KACPRZAK
D,
2007,DIGITALMOUNTAININC5
3
0.01
2010
GUHEENMF&MITCHELLJD&BARR-ESEJJ,2010,ACCENTURELLP
进而我们需要再找出中心度最大的3个节点,见表3。
中心度最高的两个是图谱中粉红色圆圈的节点,这些专利在最近两年也常被频繁引用,其特温特手工代码分别是WO2004002107-A1,即一种数据通信网络操作方法,和US2008082601-A1,即一种云网络下数据管理系统接口技术。
。
共被引知识图谱为我们提供了一种能够形象地将关键节点呈现出来的可视化表达手段。
表3
云计算领域主要共被引专利(按中心度排序
rankCentralityFreqyearCitedReference
1
0.34
2
2004
LAMBERTRB&FRYERRJ&DEVLINP&JASNOSZ
A&BRESLINDJ,2004
20.3422010
URAS&YONEMOTOY&WADAH&ISHIGAKIJ&NAKATSUCHIM&SASAKIK,2010,MATSUSHITAELECTRICINDCOLTD(MATU&MATSUSHITACOMMUNICATIONINDCORP(MATO&NTTMO-BILECOMMUNICATIONNETWORKINC(NITE30.0192009
FERRISJM,2009,FERRISJM
2.3.2云计算发明人共被引知识图谱。
专利权
人特征已简略描述了云计算专利领域专利权人的基本情况,但是专利发明人之间是否存在复杂的合作关系,这种关系如何描述仍然值得进一步研究。
通过分析发
明人共被引图谱,能够帮助我们找到云计算领域发展进程中各研究方向的重要学术带头人,连接各聚类的关键学者以探寻研究方向的演进过程。
我们选择时间切片1年、节点citedauthor,运用pathfinder寻径算法,得到一张节点数62个,连线83条,中心度(Density为0.0439的发明合作者共被引知识图谱,如图3所示。
图3云计算发明人共被引知识图谱
合作者共被引知识图谱中每个节点代表一名发明人,圆圈大小代表不同专利被引用次数,颜色代表时间。
我们不难发现云计算领域多数发明人之间存在多元网络化关系,
也有作者是孤立的研发个体。
表4按照频次统计列出云计算领域主要专利发明人,其中最关键的技术专家从频次来看是FERRISJM,该专家的发明专利影响深远,在全世界范围内被引用次数最多,即使在最近几年也常被频繁引用,是云计算领域的研发前沿和热点。
从中心度看是URAS和LAMBERT等专利权人处于聚类网络核心,与多位发明人有共被引关系,因此这些专家的技术影响深刻,在云计算领域被引用最广。
表4
主要云计算专利发明人(按照频次统计
RankFreqCentralityyearCitedAuthor
190.022009FERRISJM230.012010LUOJ
330.012010LEWISJ&GARDNERP&KACPRZAKD4302006HILLDC
5
3
2007
GUHEENMF&MITCHELLJD&BARR-ESEJJ
再进行聚类分析,找寻共被引知识图谱中的云计算领域专利技术发明主要合作群体。
图4节点中的连线代表了发明人之间的合作引用关系,
URAS与其他发明者的关系最为密切,
但是整个图谱却没有形成明显的合作群体,
说明云计算领域的技术研发过程还未能实现充分地知识共享、合作共赢。
2.3.3
云计算研发机构共被引知识图谱。
在专
利权人特征描述基础上,显见云计算领域公司是知识
·
98·第1期黄卫东,等:
专利视角下云计算领域的知识图谱研究
创新的主体。
通过分析云计算领域研发机构共被引关系,能够梳理全球云计算企业的分布情况,以及知识扩散程度。
同样设置参数,以institution为节点,绘制云计算研发机构共被引知识图谱如图5
。
图4
云计算发明人聚类网络图谱
图5云计算研发机构共被引知识图谱
这张共有97个节点、6条连线,中心度为0.0003的图中,分布有全球云计算产业的主要企业。
其中国际大型信息类跨国公司如IBM、微软、SALESFORCE高度重视技术研发与专利管理,是云计算技术研发的主力群体,节点中心度最大。
从云计算技术研发投入到技术产业化,
这些公司相继推出了大型云计算服务,例如IBM的“蓝云(BlueCloud”、微软的云计算平台Azure、Salesforce的云平台解决方案
。
图6云计算研发机构聚类网络知识图谱
对云计算研发机构共被引网络聚类,形成的聚类图谱中有四处共引用关系。
经研究发现,这些合作网络仅仅只是公司内部研究团体的自发引用,如IBM、SALESFORCE、DEHAANMP和LANGDHUABEI-JINGCONTRAOLTECHNOLOGYCO,而并不是企业之间合作开发。
这也说明在云计算领域,研发机构之间还未能提出广泛有效的专利技术知识共享和扩散机制,组建跨公司的合作开发团体,大规模的知识产权密集合作联盟至今尚有待形成。
我们还可以从时间演进的角度看待云计算专利的发明进程,图7展示了专利前沿技术领域和基础技术之间的顺时模式,即共被引节点随时间发展的趋势。
可以看出,早在1996年ALCATEL公司就申请了云计算专利,
2006年谷歌公司的计算机系统用户个性化体验专利,解决了云端分析存储特定用户的兴趣以及反馈到中央集群的难题,奠定了云计算雏形。
自2008年之后,云计算专利呈现出剧增态势,微软、IBM、Intel都纷纷发布了技术专利,从被引频次来看IBM的虚拟化技术专利影响力最大,微软公布的用于点对点通信系统的点对点网络构架的专利也有较高的引证频次。
我国的中兴通讯、华为公司也继而在云计算领域实现了突破,申请了多项专利。
3结论与对策建议
专利信息是科学技术知识共享和扩散的重要载
体,能够揭示出产业发展的现状、特征及未来演进路径。
本研究通过云计算专利知识图谱的绘制,在概述云计算专利权人特征的基础上,
深入分析了云计算专利共被引关系、专利发明人合作关系以及专利研发机构合作关系,可以得出以下结论。
全球范围内,云计算技术的领跑者主要是国际化IT巨头企业,例如IBM、微软公司,这些企业掌握了核心的技术专利,并通过专利共被引关系,将技术扩散到世界各地的公司和研发团体,
但这种扩散并没有形成密集的合作模式。
我国云计算技术同发达国家相比存在较大差距,云计算专利、专利发明人、专利研发公司的数量以及深度都全面落后于欧美,但另有少数通信企业如ZTE中兴、华为的技术研发实力已经达到了国际先进水平,具备了一定的技术影响力。
结合云计算知识图谱揭示的信息,笔者认为我国的云计算产业战略蓝图应当从以下几方面进一步完善:
a.关注云计算技术热点领域和核心专利,持续推进技术突破。
云计算专利共被引知识图谱中高频、高中心度节点说明了云计算热点领域集中于排序算法、
多重处理器系统、服务器的云端架构、云安全监控等,
·09·情报杂志第32卷
第1期黄卫东,等:
专利视角下云计算领域的知识图谱研究参考文献[1]何(5)明,郑·91·翔,赖海光,等.