从ACM会议看中国大陆计算机科学与国外的差距.docx

上传人:b****4 文档编号:3928421 上传时间:2022-11-26 格式:DOCX 页数:26 大小:31.66KB
下载 相关 举报
从ACM会议看中国大陆计算机科学与国外的差距.docx_第1页
第1页 / 共26页
从ACM会议看中国大陆计算机科学与国外的差距.docx_第2页
第2页 / 共26页
从ACM会议看中国大陆计算机科学与国外的差距.docx_第3页
第3页 / 共26页
从ACM会议看中国大陆计算机科学与国外的差距.docx_第4页
第4页 / 共26页
从ACM会议看中国大陆计算机科学与国外的差距.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

从ACM会议看中国大陆计算机科学与国外的差距.docx

《从ACM会议看中国大陆计算机科学与国外的差距.docx》由会员分享,可在线阅读,更多相关《从ACM会议看中国大陆计算机科学与国外的差距.docx(26页珍藏版)》请在冰豆网上搜索。

从ACM会议看中国大陆计算机科学与国外的差距.docx

从ACM会议看中国大陆计算机科学与国外的差距

从ACM会议看中国大陆计算机科学与国外的差距

本文分析中国大陆学者在ACM各个会议中论文发表情况。

希望以此了解中国

在计算机学科的各个分支中所处的地位。

找出那些分支是中国的强项,那些分支是

中国的弱项,那些分支中国还处在空白状态。

为计算机科学发展决策提供参考。

ACM名下的计算机专业会议涵盖了计算机科学的几个主要分支最高水平的

会议。

其中包括集成电路设计方面的DAC,ISSS,ICCAD会议,体系结构方面的ISCA和

MICRO会议,超级计算方面的SC和ISC会议,程序语言方面的POPL,PPDP会议,操作

系统方面的SOSC会议,数据库方面的SIGMOD和PODS等等。

尽管还有许多重要的会议

不在ACM会议集之中,但是对ACM会议论文发表情况依然可以成为衡量一个国家计算

机科学研究水平的重要依据。

这项研究工作是业余进行的,所以没有使用那些需要付费的论文数据库系

统。

研究方法是使用PERL程序直接从ACM网站[4]上抽取出所有的会议论文网页,再

从这些网页中抽取出每篇论文第一作者所在单位和国别,然后用AWK程序计算每一种

会议中各个国家的论文数,最后把各个会议中中国的论文数同其他国家的论文数进

行比较。

由于一些文章的作者单位栏中没有包含国别,所以这项统计只是一个近似

的结果。

中国大陆的文章通常写明China,所以遗漏中国论文的情况很罕见。

此外,

我们把单位名中包含Beijing,Pekin,Shanghai等关键字的记录都统计在中国论文

内。

中国台湾省和香港特区作者的单位名中有时也包含China,统计程序把这些记录

都排除。

本文中除特别说明之外,“中国论文”专指只中国大陆学者的论文。

统计

中,遗漏其他国家论文的情况相对多一些,比如加拿大多伦多大学有时不标明加拿

大,因此,对其他国家论文数的统计可能偏少,但不会差的很远。

美国的单位一般

不含国名,因此目前程序还没有统计美国的论文总数。

作为一个替代,程序统计了

美国加州的论文数。

程序运行结果表明,美国加州的论文数通常高于其他发达国家

平均数的数倍。

下面会看到,中国同美国加州的差距已经很大。

网络上抽取论文信息的程序日夜运行整整一个星期,共收集了ACM173个

会议总共八万多篇论文。

这个收集工作包含了大部分ACM会议,个别只有一两年会议

历史,尚无历史文档的会议没有统计在内。

附录中列出在每个会议中中国的论文数,

占总数百分比以及同国外的比较。

统计结果显示,在这173个会议中,中国论文超过100篇的会议有三个,

它们是:

会议中国占总数美国六个发达国家

代号论文数百分比加州平均数

AICPS1673.85%136174

ASPDAC1027.23%16147

MM1025.91%17458

上表中的中国论文数指中国大陆学者在该会议中历年发表的论文总和。

为了比较,我们同时列出中国论文数占会议论文总数的百分比,美国加州在该会议

中的论文总数,六个发达国家(德,法,意,加拿大,澳大利亚和日本)论文总数的

平均值。

该表显示中国在这三个会议中的情况比较好,论文数超过或接近几个发达

国家的平均水平。

但是在ASPDAC和MM会议中只有美国加州论文数的2/3。

在上述三个会议中,AICPS是一大批会议的总和,其中有些是地区性会议,

有些是近年的专业会议;ASPDAC是南亚地区的集成电路设计会议。

虽然地区性会议

不一定代表专业领域的最高水平,但是上述数据也表明中国在集成电路研究方面的

活跃。

在该会中,清华大学表现最为出色,论文数为56篇,占了中国论文数的一半

以上。

MM是国际多媒体会议,在这个会议上中国论文数超过六个发达国家平均数几

乎一倍,说明中国已在这一领域进入国际先进行列。

在MM中国论文中,微软中国研

究所36篇,清华27篇,其次是中国科大和浙大。

中国论文数在10篇到99篇之间的会议有8个,它们是:

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

SIGGRAPH1021650.46%19044

CSC1111500.96%3711

VRST122814.27%1310

CIKM1610141.58%6830

ISSAC177142.38%2345

SAC2321171.09%8476

SIGIR2813522.07%5036

WWW367314.92%9725

其中互联网会议WWW和虚实体软件会议VRST的论文数超过论文总数的4%,也

超过了六个发达国家的平均数。

VRST中表现突出的是浙江大学,占了12篇论文中的

7篇。

其次是符号代数计算会议ISSAC,信息检索会议SIGIR以及信息和知识管理会议

CIKM,中国论文数占总数的1.58%到2.38%之间。

图像学和交互式系统会议SIGGRAPH虽

然有10篇论文,但只占会议论文总数的0.46%,是发达国家平均数的1/4,是美国加

州论文数的1/19。

在这个领域中国同国际水准差距很大。

CSC(计算机科学)和SAC(应

用计算)两个会议从名字上看难以归入专业会议,其水平需要内行专家来评价。

在上述“中国论文”中,有很大一批是微软中国研究院的论文,还有一些

是中国研究单位同国外合作的成果。

比如SIGGRAPH的10篇论文中有9篇来自微软,

另一篇文章是复旦大学同美国加州DAVIS大学合作成果。

微软中国的论文在WWW中占

了9篇,在SIGIR中占了12篇。

如果按论文占会议总数的百分比排列,那么中国论文占论文总数2%以上的会

议一共有13个:

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

DOLAP21002.00%04

SIGIR2813522.07%5036

Middleware1472.13%41

ISSAC177142.38%2345

ASE41622.47%66

CF31082.78%74

WIDM31012.97%43

GRAPHITE51593.14%05

AICPS16743333.85%136174

VRST122814.27%1310

WWW367314.92%9725

MM10217275.91%17458

ASPDAC10214107.23%16147

除上面分析过的几个会议之外,其他几个会议规模比较小,其中每个会议

中中国论文总数不到5篇。

这次分析的ACM会议总共有173个,上面13个会议不到会议总数的8%。

下面

是按照中国论文占会议总数的百分比列出中国论文在ACM会议中的分布情况:

中国论文占会议会议数

论文总数百分比

>2%13

>1%30

>0%76

=097

上表显示,在97个ACM会议中,中国没有一篇论文,这些会议占了本次统计

的ACM会议总数的56%。

下面对ACM会议的几个大方向做进一步的分析。

核心领域论文发表情况

一.集成电路设计。

设计自动化会议(DesignAutomationConference(DAC))是ACM在集成电路

领域历史最悠久的会议。

自1964年以来的42年中,该会议上共发表过的3281篇论文,

其中中国的论文只有9篇,仅占论文总数的0.27%。

相比之下,法意德在该会议中的

论文数分别为:

43,36,99,高出中国4倍到10倍;南朝鲜和台湾的论文数为:

36和

56,高出中国大陆4倍到6倍;美国仅加州一地在该会议上的论文数就达673篇,高出

中国七十几倍,中美间的差距之大几乎无法衡量。

在中国的9篇论文中,有6篇是同美国大学或公司合作的论文,3篇完全独

立写成的文章全部是15年前写的。

值得指出的是,清华大学的论文占了9篇中的6篇。

下面是集成电路设计相关的几个主要会议上中国论文发表情况(南亚地区

会议ASPDAC没包括在内):

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

CODES03980.00%5114

ISSS03220.00%5314

SBCCI01110.00%65

DATE314140.21%12051

DAC932810.27%67359

ICCAD514830.34%34225

EuroDAC24870.41%4826

ISLPED47460.54%11617

FPGA54591.09%10015

ISPD63381.78%885

GLVLSI73681.90%349

总计4192960.44%1625235

在这些会议中,清华大学的论文数为21篇,占中国论文数一半以上。

显示出

清华大学在集成电路研究方面的国内领先地位。

尤其是在物理设计领域,清华占了

6篇论文中的5篇。

另外,复旦大学在FPGA领域比较突出,占了5篇论文中的3篇。

整体而言,中国在上述集成电路会议中的论文数不到六个发达国家平均数的

1/5,相当于美国加州论文数的1/40。

相比之下,中国在物理设计(ISPD)和可编程逻

辑(FPGA)方面情况稍好,在系统设计(CODES,ISSS,SBCCI)方面的研究最差。

其次

是设计测试(DATE)和设计自动化(DAC,ICCAD,EuroDAC)。

下面是这几个会议的中文简称,开始年份和论文录取率情况。

代号中文简称起始年录取率

CODES软硬件协同设计9430%

ISSS系统综合9435%

SBCCI集成电路与系统设计9734%

DATE设计与测试9821%

DAC设计自动化6430%

ICCAD辅助设计9226%

EuroDAC欧洲设计自动化90无

ISLPED低功耗设计9532%

FPGA可编程逻辑9550%

ISPD物理设计97无

FPGA可编程逻辑9550%

GLVLSI大湖区集成电路00无

二。

体系结构

在体系结构方面,中国的论文发表情况比集成电路更差。

在有33年历史的计

算机体系结构权威会议ISCA中,中国的论文数是零。

在微体系结构会议MICRO上,

中国有9篇论文,占论文总数的1.48%,可是这些论文都是在1994年之前的,大部分

是在85年到88年之间所做,95年之后一篇论文也没有。

仅从论文数量看,最近十年

中国在体系结构方面的学术研究不但没有前进,反而出现倒退。

这种情况可能同中

国当前的“芯片热”有关,许多研究人员转向了芯片的产品开发,离开了体系结构

的学术研究。

另一个原因是有能力在这些重要会议上发表论文的学者转到了国外,

比如在MICRO上发表了4篇论文的清华学者BogongSu先生,现在在美国William

Paterson

大学工作,总共发表了34篇论文。

下面是ACM会议中几个主要的体系结构有关的会议中,中国论文的发表情况:

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

ASPLOS02640.00%412

CASES01960.00%284

ISCA09920.00%11611

PACT0670.00%30

SPAA05590.00%5618

SC112290.08%14316

ICS17290.14%4620

MICRO96081.48%686

Total1146440.24%50177

在这七个会议中,中国在五个会议中的论文数是空白。

超级计算会议SC中

唯一的一篇论文是北京基因组研究所的计算机应用论文,不能算作体系结构方面的

论文;另一个超级计算会议ICS的论文是计算所编译组同INTEL和DELWARE大学合作的

论文;MICRO方面的9篇论文是10年前的论文。

换句话说,中国在最近十年内,在ACM体

系结构方面的论文是空白。

当然,这并不等于说中国在体系结构学术研究方面是空白。

在ACM之外,还

有相当一批重要的体系结构会议,比如ISCIS,HPCA,ICCD,ASAP等等。

但是中国在

ACM会议中的情况,毕竟反映出中国在体系结构方面研究力量的薄弱。

另外,下表显示,ACM这几个会议都是论文竞争相当激烈的会议,尤其ASPLOS,ISCA和

MICRO这几个历史长久的会议,录取率仅在20%,五篇论文中只录取一篇。

中国在这

些会议中没有论文,至少说明中国缺乏高水平的研究工作。

下面是上述ACM体系结构会议的中文简称以及论文录取率等信息:

代号中文简称起始年录取率

ASPLOS对语言和操作系统的体系结构支持7320%

CASES嵌入式系统编译,体系结构和综合0025%

ISCA体系结构7320%

PACT并行体系结构及编译技术93无

SPAA并行算法和体系结构8937%

SC超级计算8824%

ICS超级计算8930%

MICRO微体系结构7320%

三.软件工程,数据库和人机界面。

在这个栏目下面,我们把软件工程,数据库,交互式系统,文档,超文本的会

议都放在一起。

这种分类可能会有争议。

但是从我们提供的数据中不难分析出各专

门领域的情况。

下面是归在此类的所有会议:

代号中文简称起始年录取率

ISSTA软件测试与分析7320%

SIGSOFT软件工程基础8225%

ICSE软件工程7617%

PODS数据库系统原理8222%

SIGMOD数据管理7417%

VLDB超大规模数据库82无

SIGIR信息检索7120%

SIGDOC计算机文档8250%

UIST用户界面软件与技术8821%

ICIS信息系统89无

IUI智能用户界面8930%

CHI计算机系统中人的因素7720%

DIS交互式系统设计95无

HT超文本8740%

SV软件可视性7320%

SSR软件可重用性9543%

SCM软件配置管理(workshop)89无

WOSP软件与性能(workshop)9855%

在这些会议中ISSTA,SIGSOFT,ICSE是软件工程方面的主干会议,论文录

取率在20%左右。

在这三个会议中,中国的论文总数是6篇,占全部论文数的0.21%。

其中SIGSOFT的三篇文章全部是北大的。

ICSE中也有一篇北大文章。

SIGMOD和PODS是数据库方面的主要会议。

前者录取率为35%,上面有9篇中国

论文;后者录取率只有18%,该会议上唯一的一篇中国论文是重庆大学KeWang所写

的论文,但时间是17年前。

SIGIR信息检索会议是这批会议中中国论文最多的一个会议,中国共有28篇

论文,占总数2%多。

在这批论文中,微软占了12篇,其次是清华大学5篇,其中有2篇

是同微软合作成果。

在用户界面会议方面,中国在IUI会上的论文占论文总数0.84%,这个比例在

各个会议中占第二名。

IUI的5篇中国论文中有3篇出自北京中科院。

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

DIS02370.00%203

ISSTA02050.00%183

SCM0550.00%41

SIGDOC06070.00%3513

SSR01050.00%83

VLDB01460.00%153

CHI644710.13%59597

PODS16710.15%7518

ICSE319180.16%12970

UIST14720.21%8015

ICIS14320.23%05

HT26210.32%5717

SIGSOFT36750.44%5021

SIGMOD917900.50%22335

WOSP11640.61%108

IUI55950.84%6021

SIGIR2813522.07%5036

Total60145160.41%1429369

在这17个会议中,中国在6个会议中尚处空白状态。

另外,CHI的6篇文章

有5篇是微软的,另外1篇来自IBM中国研究所。

PODS上的文章是17年前的。

所以,在

最近17年中,中国实际上在8个软件会议中是空白。

其他几个会议,除SIGIR以外,

论文数量占会议论文总数的百分之一以下。

在软件工程这个领域中,中国论文数是

六个发达国家平均数的1/6,是美国加州的1/23。

四.操作系统,网络通讯和分布式计算。

在这个栏目下面我们很勉强地把操作系统会议SOSP,通讯会议COMM和分布是

计算会议PODC放在一起。

这几个领域不象其他行业那样有一大批相关的ACM会议。

而这几个会议历史都很长,率取率也比较低。

SOSP会议是一个有将近40年的操作系

统会议,在此会议上中国论文一篇也没有。

分布式计算会议PODC上也没有中国的论

文。

COMM上有两篇中国论文,一篇来自国防科大,另一篇来自南京通讯工程学院。

国防科大的文章发表在2003年,当年的录取率仅为11%,几乎是10文章中挑选1篇;

南京通讯工程学院GuoChuanxiong的文章发表在2001年,当时的录取率为9%。

代号中文简称起始年录取率

SOSP操作系统原理6718%

COMM计算机通讯的应用技术和体系结构6911%

PODC分布式计算原理8230%

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

PODC08490.00%7513

SOSP03310.00%541

COMM28170.24%9414

Total219970.10%22328

五.图形学与多媒体

在虚拟实体会议VRST和多媒体会议MM上,中国的情况比较好,非常罕见的能

够占到论文总数的4%--6%之间。

VRST上的论文都是中国自己独立完成的,MM上虽然

有32篇微软的论文,但中国自己的论文还是占了大多数。

图形学本身的论文情况接

近空白。

SCG上唯一的一篇论文是明尼苏达大学同北京中科院合写的文章,SIGGRAPH

上有8篇文章出自微软,1篇出自IBM,另一篇是复旦与美国DAVIS大学合作。

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

PVG0450.00%51

SCCG01140.00%12

SI3D02200.00%131

SCG19070.11%7228

SIGGRAPH1021650.46%19044

VRST122814.27%1310

MM10217275.91%17458

Total12554592.29%468144

代号中文简称起始年录取率

PVG并行和大规模数据可视性99无

SCCG图形学73无

SI3D交互式3D图像8727%

SCG计算几何8535%

SIGGRAPH图像与交互式技术74无

MM多媒体9348%

VRST虚实体软件与技术9736%

六.程序语言。

ACM集中了程序设计语言的许多重要会议,在这些会议的有关信息及中国

论文发表情况见下面的两个表。

代号中文简称起始年录取率

POPL程序语言原理7320%

OOPSLA面向对象程序语言8619%

PLDI程序语言设计与实现8722%

PPoPP并行程序设计原理9030%

PPDP说明式语言与实现0046%

ICFP函数式语言9630%

CGO代码生成与优化0332%

PEPM部分求值和基于语义的程序变换9150%

LCTES嵌入式系统的语言,编译和工具9526%

会议中国论文中国论文美国六个发达国家

代号论文数总数占总数百分比加州平均数

LCTES01680.00%133

POPL08600.00%5816

PPDP01420.00%38

OOPSLA112050.08%8824

ICFP13100.32%59

PLDI24950.40%656

PEPM11660.60%26

PPoPP21881.06%242

CGO1891.12%40

Total836230.22%26274

POPL是历史最久,名望最高的会议,在这个会议的33年历史上,全中国没

有一篇论文(包括中国大陆,香港和台湾)。

面向对象语言OOPSLA,函数语言ICFP,

语言设计与实现PLDI以及嵌入式系统语言和编译LCTES均属于语言方面有相当规模的

高水平会议。

PLDI上仅有的两篇论文来自INTEL中国软件中心,作者是普林斯顿大学

博士毕业。

ICFP和OOPSLA两个会议上各有一篇中国大陆论文,ICFP上的论文作者是

软件所ChenHaiming。

OOPSLA上唯一的中国论文作者是YingliangZhao,他署名的

单位是西安交大和加拿大Regina大学。

LCTES则没有中国大陆的论文。

PPDP是一个比

较新的语言会议,没有中国论文。

并行程序设计PPoPP是一个跨领域的会议,其中的

一部分内容是并行语言。

该会上有两篇中国论文,一篇来自INTEL上海软件中心,另

一篇是中国科技大学与INTEL编译组合写。

PEPM和CGO是语言领域内比较专门的两个

方向,这两个会各有一篇中国论文。

PEPM上的论文是一个在武汉大学(学习/工作?

)的俄罗斯人的论文,CGO上的论文来自INTEL软件中心。

总体而言,在8篇论文中,INTEL占了5篇(包括与科大合作的一篇),外国

人一篇,在中加两个单位同时工作的学者一篇。

能够完全算做中国独立完成的论文

只有软件所ChenHaiming在ICFP上的论文。

即使按8篇论文计算,中国在语言方面的论文也只有6个发达国家平均值的1/9,

美国加州论文数的1/32。

总体分析

以上是ACM会议里几个比较大的研究领域中中国论文的分布情况。

其他研

究领域不再一一分析。

附录中列出了每个会议的情况。

在本次统计的173个ACM会议(包括会议集)中,中国大陆第一作者的论文

总共有713篇,占论文总数83227的0.83%。

相比之下,六个发达国家的平均数为1926篇,

美国加州的论文数为7481篇。

在713篇中国论文中,大约有90篇是外国研究单位的论

文,其中微软73篇,INTEL有9篇,IBM有6篇,此外还有一部分是中外合作论文,完

全由中国独立完成的论文估计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 日语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1