数学与生物信息科学交叉研究领域文献分析报告.docx
《数学与生物信息科学交叉研究领域文献分析报告.docx》由会员分享,可在线阅读,更多相关《数学与生物信息科学交叉研究领域文献分析报告.docx(28页珍藏版)》请在冰豆网上搜索。
数学与生物信息科学交叉研究领域文献分析报告
数学与生物信息科学交叉研究领域文献分析报告
邵伟文
中国科学院国家科学图书馆
冯雷
中国科学院数学与系统科学研究院
摘要:
中科院“创新2020”方案中包括了筹建数学科学交叉应用研究中心这一重要内容,该中心将涉及到“数学与生物信息”这一重要交叉领域,为了对数学与生物信息科学交叉研究领域的发展状况有一个比较清晰的了解,我们从现有文献入手,拟对这方面的SCI收录文献做一个全面的分析整理,试图从国际范围内探索这一领域的发展趋势和前景。
本报告详细分析了数学与生物信息科学交叉研究领域现有文献的状况,包括论文产出的增长趋势、论文被引用情况和增长趋势、论文产出的国家和地区以及科研机构、论文产出涉及到的交叉学科、论文登载的期刊情况,详细列出了这些项目的论文数量排名靠前的名单,另外也分析了中国学者在这一领域的研究情况,最后小结提出一些建设性建议。
一、论文产出数量和增长趋势
从ISI数据库检索到国际上“生物信息科学”领域中被SCI收录的相关文献22454篇,其中与“数学”学科具有交叉的文献3008篇,占这一领域文献量的13.40%,这些文献与数学中各二级类别的交叉分布状况见表一:
表一、数学与生物信息科学领域交叉文献
中文名称
英文名称
篇数
百分比
数学与计算生物学
MATHEMATICAL&COMPUTATIONALBIOLOGY
2380
10.5994%
数学
MATHEMATICS
24
0.1069%
应用数学
MATHEMATICS,APPLIED
287
1.2782%
数学跨学科应用
MATHEMATICS,INTERDISCIPLINARYAPPLICATIONS
118
0.5255%
运筹学与管理科学
OPERATIONSRESEARCH&MANAGEMENTSCIENCE
127
0.5656%
数学物理
PHYSICS,MATHEMATICAL
47
0.2093%
统计学与概率论
STATISTICS&PROBABILITY
959
4.2710%
使用ISI分析工具,统计分析数学与生物信息科学交叉领域被SCI收录的3008篇论文的发表年代,可以清晰地看到该领域的论文的产出趋势:
从1979至1997年,该领域的文献非常稀少,只是零星的有一些探索,自1998年以来,该领域的文献呈现线性增长趋势,这一阶段到2006之后突然出现一个三年的跳跃式增长,目前仍然在快速增长中(图一)。
图一、数学与生物信息科学交叉领域文献产出数量和趋势
该领域的3008篇文献至今已经被引用25553次,篇均被引8.5次,单篇最高被引685次,引文自二十一世纪以来呈现指数增长的趋势(图二),该领域的文献价值的影响力越来越大,说明这一交叉领域得到了科研人员较大的关注。
另外表二列出了该领域被引Top25文献,中国学者有两篇论文进入top25文献。
图二、数学与生物信息科学交叉领域文献引文产出数量和趋势
表二、数学与生物信息科学交叉领域被引Top25文献
序号
文献信息
被引次数
年均被引
1
标题:
UsingBayesiannetworkstoanalyzeexpressiondata
作者:
FriedmanN,LinialM,NachmanI,etal.
会议信息:
4thAnnualInternationalConferenceonComputationalBiology(RECOMB2000),APR08-11,2000TOKYO,JAPAN
来源出版物:
JOURNALOFCOMPUTATIONALBIOLOGY 卷:
7 期:
3-4 页:
601-620 出版年:
2000
685
62.27
2
标题:
Thesystemsbiologymarkuplanguage(SBML):
amediumforrepresentationandexchangeofbiochemicalnetworkmodels
作者:
HuckaM,FinneyA,SauroHM,etal.
来源出版物:
BIOINFORMATICS 卷:
19 期:
4 页:
524-531 出版年:
MAR12003
540
67.50
3
标题:
Modelingandsimulationofgeneticregulatorysystems:
Aliteraturereview
作者:
DeJongH
来源出版物:
JOURNALOFCOMPUTATIONALBIOLOGY 卷:
9 期:
1 页:
67-103 出版年:
2002
503
55.89
4
标题:
FatiGO:
awebtoolforfindingsignificantassociationsofGeneOntologytermswithgroupsofgenes
作者:
Al-ShahrourF,Diaz-UriarteR,DopazoJ
来源出版物:
BIOINFORMATICS 卷:
20 期:
4 页:
578-580 出版年:
MAR12004
400
57.14
5
标题:
Taverna:
atoolforthecompositionandenactmentofbioinformaticsworkflows
作者:
OinnT,AddisM,FerrisJ,etal.
来源出版物:
BIOINFORMATICS 卷:
20 期:
17 页:
3045-3054 出版年:
NOV222004
330
47.14
6
标题:
Evaluationofmethodsforthepredictionofmembranespanningregions
作者:
MollerS,CroningMDR,ApweilerR
来源出版物:
BIOINFORMATICS 卷:
17 期:
7 页:
646-653 出版年:
JUL2001
300
30.00
7
标题:
Cd-hit:
afastprogramforclusteringandcomparinglargesetsofproteinornucleotidesequences
作者:
LiWZ,GodzikA
来源出版物:
BIOINFORMATICS 卷:
22 期:
13 页:
1658-1659 出版年:
JUL12006
249
49.80
8
标题:
GOTreeMachine(GOTM):
aweb-basedplatformforinterpretingsetsofinterestinggenesusingGeneOntologyhierarchies
作者:
ZhangB,SchmoyerD,KirovS,etal.
来源出版物:
BMCBIOINFORMATICS 卷:
5文献编号:
16 出版年:
FEB182004
218
31.14
9
标题:
InvestigatingsemanticsimilaritymeasuresacrosstheGeneOntology:
therelationshipbetweensequenceandannotation
作者:
LordPW,StevensRD,BrassA,etal.
来源出版物:
BIOINFORMATICS 卷:
19 期:
10 页:
1275-1283 出版年:
JUL12003
190
23.75
10
标题:
Reconstructionofmetabolicnetworksfromgenomedataandanalysisoftheirglobalstructureforvariousorganisms
作者:
MaHW,ZengAP
来源出版物:
BIOINFORMATICS 卷:
19 期:
2 页:
270-277 出版年:
JAN222003
159
19.88
11.
标题:
PredictionofMHCclassII-bindingpeptidesusinganevolutionaryalgorithmandartificialneuralnetwork
作者:
BrusicV,RudyG,HoneymanM,etal.
来源出版物:
BIOINFORMATICS 卷:
14 期:
2 页:
121-130 出版年:
1998
152
11.69
12.
标题:
GMD@CSB.DB:
theGolmMetabolomeDatabase
作者:
KopkaJ,SchauerN,KruegerS,etal.
来源出版物:
BIOINFORMATICS 卷:
21 期:
8 页:
1635-1638 出版年:
APR152005
143
23.83
13
标题:
Automatedgenomesequenceanalysisandannotation
作者:
AndradeMA,BrownNP,LeroyC,etal.
来源出版物:
BIOINFORMATICS 卷:
15 期:
5 页:
391-412 出版年:
MAY1999
134
11.17
14
标题:
Phospho.ELM:
Adatabaseofexperimentallyverifiedphosphorylationsitesineukaryoticproteins
作者:
DiellaF,CameronS,GemundC,etal.
来源出版物:
BMCBIOINFORMATICS 卷:
5文献编号:
79 出版年:
JUN222004
127
18.14
15
标题:
Computationalclustervalidationinpost-genomicdataanalysis
作者:
HandlJ,KnowlesJ,KellDB
来源出版物:
BIOINFORMATICS 卷:
21 期:
15 页:
3201-3212 出版年:
AUG12005
120
20.00
16
标题:
Miningliteratureforprotein-proteininteractions
作者:
MarcotteEM,XenariosI,EisenbergD
来源出版物:
BIOINFORMATICS 卷:
17 期:
4 页:
359-363 出版年:
APR2001
120
12.00
17
标题:
Inferringqualitativerelationsingeneticnetworksandmetabolicpathways
作者:
AkutsuT,MiyanoS,KuharaS
来源出版物:
BIOINFORMATICS 卷:
16 期:
8 页:
727-734 出版年:
AUG2000
118
10.73
18
标题:
FunctionalandstructuralgenomicsusingPEDANT
作者:
FrishmanD,AlbermannK,HaniJ,etal.
来源出版物:
BIOINFORMATICS 卷:
17 期:
1 页:
44-57 出版年:
JAN2001
117
11.70
19
标题:
Combiningphylogeneticdatawithco-regulatedgenestoidentifyregulatorymotifs
作者:
WangT,StormoGD
来源出版物:
BIOINFORMATICS 卷:
19 期:
18 页:
2369-2380 出版年:
DEC122003
116
14.50
20
标题:
DatamininginbioinformaticsusingWeka
作者:
FrankE,HallM,TriggL,etal.
来源出版物:
BIOINFORMATICS 卷:
20 期:
15 页:
2479-2481 出版年:
OCT122004
111
15.86
21
标题:
Adynamicprogrammingapproachtodenovopeptidesequencingviatandemmassspectrometry
作者:
ChenT,KaoMY,TepelM,etal.
来源出版物:
JOURNALOFCOMPUTATIONALBIOLOGY 卷:
8 期:
3 页:
325-337 出版年:
2001
108
10.80
22
标题:
Mismatchstringkernelsfordiscriminativeproteinclassification
作者:
LeslieCS,EskinE,CohenA,etal.
来源出版物:
BIOINFORMATICS 卷:
20 期:
4 页:
467-476 出版年:
MAR12004
105
15.00
23
标题:
TAMBIS:
Transparentaccesstomultiplebioinformaticsinformationsources
作者:
StevensR,BakerP,BechhoferS,etal.
来源出版物:
BIOINFORMATICS 卷:
16 期:
2 页:
184-185 出版年:
FEB2000
104
9.45
24
标题:
EXACTANDAPPROXIMATIONALGORITHMSFORSORTINGBYREVERSALS,WITHAPPLICATIONTOGENOMEREARRANGEMENT
作者:
KECECIOGLUJ,SANKOFFD
来源出版物:
ALGORITHMICA 卷:
13 期:
1-2 页:
180-210 出版年:
JAN-FEB1995
104
6.50
25
标题:
Areviewoffeatureselectiontechniquesinbioinformatics
作者:
SaeysY,InzaI,LarranagaP
来源出版物:
BIOINFORMATICS 卷:
23 期:
19 页:
2507-2517 出版年:
OCT12007
102
25.50
26
标题:
Ensembleclassifierforproteinfoldpatternrecognition
作者:
ShenHB,ChouKC
来源出版物:
BIOINFORMATICS 卷:
22 期:
14 页:
1717-1722 出版年:
JUL152006
102
20.40
二、论文产出科研机构状况
该领域产出的这些文献来自全球70多个国家和地区,在这3008篇文献中,美国学者以1205篇的数量高居榜首,其次是德国和英国,中国学者以227篇排名第四,意大利、法国、加拿大、西班牙和日本紧随其后,这九个国家和地区的文献产出超过整体产出的90%,文献产出前20的国家和地区如图三所示(合作论文重复计算)。
图三、数学与生物信息科学交叉领域文献产出前20的国家和地区
同时这些文献来自全球一千四百多个科研机构,其中哈佛大学、曼彻斯特大学、加州大学圣地亚哥分校的论文产出排名三甲,中国科学院排名第五位,表四列出了全球该领域论文产出排名前30的科研机构。
表四、数学与生物信息科学交叉领域文献产出前30的科研机构
科研机构名称
篇数
百分比
HARVARDUNIV
58
1.93%
UNIVMANCHESTER
57
1.89%
UNIVCALIFSANDIEGO
46
1.53%
STANFORDUNIV
38
1.26%
CHINESEACADSCI
36
1.20%
MIT
32
1.06%
UNIVCALIFBERKELEY
30
1.00%
UNIVWASHINGTON
30
1.00%
EUROPEANBIOINFORMATINST
29
0.96%
MAXPLANCKINSTMOLGENET
27
0.90%
RUTGERSSTATEUNIV
26
0.86%
UNIVTOKYO
26
0.86%
COLUMBIAUNIV
25
0.83%
UNIVCALIFLOSANGELES
25
0.83%
YALEUNIV
25
0.83%
NATLUNIVSINGAPORE
24
0.80%
TEXASA&MUNIV
24
0.80%
UNIVQUEENSLAND
24
0.80%
UNIVBIELEFELD
23
0.76%
UNIVCAMBRIDGE
23
0.76%
CNR
22
0.73%
INDIANAUNIV
22
0.73%
UNIVBRITISHCOLUMBIA
22
0.73%
UNIVMUNICH
22
0.73%
CNRS
21
0.70%
TELAVIVUNIV
21
0.70%
UNIVILLINOIS
21
0.70%
GEORGIAINSTTECHNOL
20
0.66%
UNIVHEIDELBERG
20
0.66%
UNIVROSTOCK
20
0.66%
三、学科分布和学科领域活跃学者情况
全球在该领域从事研究的科研人员达到7000多人,目前,该领域最活跃的研究人员是YANG,JY、JIANG,T、VALENCIA,A、CHEN,L、MILANESI,L、WANG,Y等,同时,该领域牵涉到很多的交叉学科,表五和表六分布列出了论文产出排名前15的学者和论文产出排名前15的交叉学科。
表五、数学与生物信息科学交叉领域前15个活跃学者
作者
篇数
百分比
YANG,JY
44
1.46%
JIANG,T
16
0.53%
VALENCIA,A
16
0.53%
CHEN,L
13
0.43%
MILANESI,L
13
0.43%
WANG,Y
13
0.43%
WEBER,GW
13
0.43%
AKUTSU,T
12
0.40%
KELL,DB
12
0.40%
NOBLE,WS
12
0.40%
WANG,LS
12
0.40%
WOLKENHAUER,O
12
0.40%
BOURNE,PE
11
0.37%
ZHANG,XS
11
0.37%
LENGAUER,T
10
0.33%
LI,X
10
0.33%
表六、数学与生物信息科学交叉领域前15个学科论文产出情况
学科类别
记录数
百分比
MATHEMATICAL&COMPUTATIONALBIOLOGY
2380
79.12%
BIOCHEMICALRESEARCHMETHODS
1777
59.08%
BIOTECHNOLOGY&APPLIEDMICROBIOLOGY
1439
47.84%
COMPUTERSCIENCE,INTERDISCIPLINARYAPPLICATIONS
970
32.25%
STATISTICS&PROBABILITY
959
31.88%
MATHEMATICS,APPLIED
287
9.54%
BIOLOGY
175
5.82%
COMPUTERSCIENCE,INFORMATIONSYSTEMS
153
5.09%
OPERATIONSRESEARCH&MANAGEMENTSCIENCE
127
4.22%
MATHEMATICS,INTERDISCIPLINARYAPPLICATIONS
118
3.92%
ENGINEERING,BIOMEDICAL
113
3.76%
COMPUTERSCIENCE,THEORY&METHODS
76
2.53%
COMPUTERSCIENCE,ARTIFICIALINTELLIGENCE
74
2.46%
CELLBIOLOGY
71
2.36%
COMPUTERSCIENCE,SOFTWAREENGINEERING
62
2.06%
ENGINEERING,ELECTRICAL&ELECTRONIC
61
2.03%
三、论文产出发表的期刊
该领域产出的文献分布在300多种期刊中,其中有超过80%的论文集中发表在30种期刊中,表七详细列出了这30种期刊名称和论文数量。
表七、数学与生物信息科学交叉领域论文发表前30期刊
来源出版物
记录数
百分比
BIOINFORMATICS
679
22.57%
BMCBIOINFORMATICS
677
22.51%
BMCSYSTEMSBIOLOGY
121
4.02%
PLOSCOMPUTATIONALBIOLOGY
118
3.92%
LECTURENOTESINBIOINFORMATICS
99
3.29%
JOURNALOFTHEORETICALBIOLOGY
85
2.83%
JOURNALOFCOMPUTATIONALBIOLOGY
68
2.26%
INTERNATIONALJOURNALOFDATAMININGANDBIOINFORMATICS
61
2.03%
IEEE-ACMTRANSACTIONSONCOMPUTATIONALBIOLOGYANDBIOINFORMATICS
57
1.89%
CURRENTBIOINFORMATICS
49
1.63%
PROCEEDINGSOFTHE7THIEEEINTERNATIONALSYMPOSIUMONBIOINFORMATICSANDBIOENGINEERING,VOLSIANDI