Citespace软件操作问答.docx

资源描述

Citespace软件操作问答.docx

《Citespace软件操作问答.docx》由会员分享，可在线阅读，更多相关《Citespace软件操作问答.docx（9页珍藏版）》请在冰豆网上搜索。

Citespace软件操作问答.docx

Citespace软件操作问答

说图，理想的知识图谱应该是能够正确反映文献实际情况的那一张图。

所以，知识图谱的绘制并不是一蹴而就的，阈值的不断切换就是为了找到符合实际情况的知识图谱；在操作过程中经常会遇到有的文献被引频次很高，但是中心度却很低，而有的文献被引频次很低，中心度却很高，对于这样的现象我该怎样去理解？

这两类文献中那一种才是关键文献或重要文献？

为什么会出现这样的情况。

另外，阈值设定中：

topNperslice或者Threshold（c，cc，ccv）数值大小，选用Pathfinder或者MinimumSpanningTree，即使小小的变化，软件选择出的被引文献或者关键词其中心度变化很大。

如果选择了其中的一组数据进行分析，自己都无法解释选择为什么要选择这组数据？

我应该依据什么去选择分析？

被引频次和中心度是两种不同的度量。

中心度是定义在网络结构上的。

至于什么是关键文献或重要文献，取决于你要研究什么问题。

如果波动很大说明你选的topN还不够大。

使用默认的top30与设置c、cc，ccv的差别很大，不知什么原因常常软件跑不动了，能给出点阈值调节的具体知道吗？

c/cc/ccv的选法不太容易掌握（由下往上选），所以现在系统界面推荐topN的选法（由上往下选）。

建议先用系统预定参数，然后根据选入节点的数量等在调节参数：

topN:

30,50,100,...由低望高增加。

c/cc/ccv:

，c:

30,25,20,15,10,5,...由高往低减少。

cc:

30,25,20,15,10,5,...，ccv:

30,25,20,15,10,5,

（9）如何解读CiteSpace产生的图谱

CiteSpace的核心功能是产生由多个文献共被引网络组合而成的一种独特的共被引网络，以及自动生成的一些相关分析结果。

每个文献共被引网络对应于一个历时一年或几年的时间段。

最终显示的网络不是各个网络之间的简单叠加，而是要满足一些条件（详见2004年PNAS的论文）。

解读这样的网络（我称为递进式知识领域分析）的要点包括：

网络整体结构，网络聚类，各聚类之间的关联，关键节点（转折点）和路径。

解读时可从直观显示入手，然后再参照各项指标。

结构：

是否能看到自然聚类（未经聚类算法而能直观判定的组合），是否包括转折点（有紫色外圈的节点），通过算法能得到几个聚类？

每个节点大小代表它的总被引次数。

大圈则总被引高。

时间：

每个自然聚类是否有主导颜色（出现时间相对集中），是否有明显的热点（节点年轮中出现红色年轮，即被引频率是否曾经或仍在急速增加）？

通过各个年轮的色彩可判断被引时间分布。

时间线显示将每一聚类按时间顺序排列，相邻聚类常常对应相关主题（聚类间共引）。

聚类之间的知识流向也可从时间（色彩）上看到（由冷色到暖色）。

内容：

每个聚类的影响（被引时涉及的主题，摘要，和关键词）和几种不同算法所选出的最有代表性的名词短语？

指标：

每个聚类是否具有足够的相似性（silhouette值是否足够大，太小则无明确主题可言），整个聚类是否有足够节点（太少则很可能全都出自同一篇文献的参考文献，因而缺乏普遍意义）？

Tips：

每个节点上，右键弹出的选择中，有一项是通过DOI连接到原文出版社提供的网页。

可用CiteSpace的图谱作为一个直接浏览相关文献的界面

黑色字体是提问，蓝色是陈超美的回答，一些很具体的操作，非常实用

（图谱各指示值含义类问题）在某文章的sigma值表示什么意思呢？

绝大多数的sigma值是1.00，表示结构上和引文变化中都非常重要。

（具体操作类问题）如何在citespace生成的聚类中查看该聚类成员的文章标题呢？

右键点被引成员->OpenDOI，我用CiteSpace做被引文献聚类后，想知道每个类中所含被引文献的具体数量，该怎么操作？

是否可以将相关数据导出为excel类型文件进行查看？

clustering菜单下：

summarytable里显示具体个数；我刚开始使用这个软件，请问转折点文章的列表能自动生成，直接链接出来吗？

在Display窗口，Networks菜单下，（？

？

）我在您的有关文献里看到citespace的操作步骤1、2、3（extractnounphrasetermfromtitle,abstract,descriptors,identifiersofcitingarticlesinthedataset）4----，关于步骤3我在实际操作的过程中并没有执行，而是直接分析共被引等内容，这样的话结果会有影响吗？

如果我在分析了共被引等后，然后想作前沿词的探测的话会对结果有影响吗？

另外关于提取名词的操作步骤是这样的对面，选择了timescling,termsource,然后在termtype里选择nounphrase，然后点go对吗？

如果我想探测突现词，必须先进行名词短语的提取然后选择burstterm--detectbursts吗？

可是这样只能在窗口里显示了几个探测词，我往往再选择go，才能出现相应谱图？

CiteSpace中的burstdetection有两种用法：

1。

名词短语和2。

单词。

1需要事先提取。

2则不用。

如果后面的分析不涉及名词短语，结果不会受影响。

最后几个问题：

对；是；应该如此。

这次的问题是timeline和timezone选项怎么使用和解读呢？

timeline是先把整个网络划分为几个聚类，然后按时间顺序排列出各个聚类中的文献。

这样可以观察到很多现象。

这个状态下的选项主要是显示聚类的标签，节点的特征等等。

如何在生成的可视图中为各个节点标出相应的文字说明？

统一标：

ArticleLabeling下面的组合控制，如Freq+threshold（越小符合显示要求的会越多）。

单独标：

右键》LabeltheNode.也可随后右键取消。

我想请问下关于CITESPACE怎么保存图谱，我是做教育经济的，图点很散，怎么样吧图点聚集起来输出，看起来一目了然可以存成.viz格式，以后可以直接用CiteSpace打开使用：

File>SaveVisualization也可以:

File>SavePNG如能增加更多联接，也许能把整体集中一些:

增加timeslice的长度，增加topN,topN%等。

第一，在节点个数问题上，一般通过设置，最后多少节点是理想的？

（我目前运行时得到节点关键词308个，连线2057条）；第二，在进行时间线视图时（timeline），每一个聚类后面的名称是依据什么来标注的？

（通过运行，发现有的聚类名称和研究领域联系不大）1.这个问题可参考我以前的博客。

主要考虑是网络结构是否能回答在比节点本身更高抽象层次上的一些问题。

2。

是由引用各聚类的论文决定的，具体词组可选自论文的标题，摘要，和索引词，再由3种办法之一度量。

如“联系不大”，可解释为施引/被引之间的“距离”较大，参照silhouette值。

，1.在关键词可视化视图生成过程中，左边会出现相应的按词频排列的关键词排序，一些关键词会出现两次，这该怎么解释呐？

而有些关键词只是单复数的区别，如library和libraries。

在分析时应该将两者的频次相加，还是只取其中一个的数据呢？

在图中右键将要保留的词选为AliasPrimary，再将另一词选为Aliassecondary.重新GO!

一下,会将二者合并。

问articlelabeling和termlabeling分别是指什么类别？

Term:

TermsArticle:

Authors,CitedReferences,Institutions,Countries,Keywords,etc.“Themostactivecitertotheclusteris0.45ISI:

000086822800018Mines,M（2000）ocularinjuriessustainedbysurvivorsoftheoklahomacitybombing.”里面的0.45指的是什么指标呀？

0.45=45%.Mines,M.引用了该类中45%的文献。

检索结果与主题相关程度：

右键弹出的菜单上有个CitationHistory里面的第二个tab列出了施引文件，点击这些条目可得到两种结果：

1。

如果有DOI信息，将直接打开原文的网上地址。

2。

否则，将显示标题和摘要。

你可根据这些信息进一步判断引用的原因。

我用的中文数据，节点类型选择citedreference.在阈值选择上，如果所有c=3的情况下，每个slices的节点最多只有10个左右，连钱每个slices都只有几条，构不成聚类，而所有的c=2的情况下，每个slices的节点就都有几百个，连线上千条。

生成的图谱一盘散沙，都是小型聚类，并且聚类之间都没有连线。

这样的数据好像缺乏主题和核心-所以有可能还算不上一个领域。

CiteSpac也没办法:

-）

（数据去重复与阈值选择类问题）如何运用citespace这个软件除重呢？

Data->Import/Export->WoS->DuplicateRemoval1）从WOS下载的文本中有重复文献，CiteSpace能直接对重复文献过滤吗？

若不能，该如何处理这些重复文献呢？

用NoteExpress去重后，再重新导入CiteSpace可以吗？

（本人还没尝试）2）Project一旦建立，其“DataDirectory”便不能更改了吗？

为什么点了“Edit”之后没有反应？

3）在“ProcessReports”中显示"Recordsinthedataset:

95676"，这里的Records是指所有.txt文件中包括的的文献吧，但实际数量只有1万条左右，这是为什么呢？

4）设定slice为1year，在“ProcessReports”中，每一年的记录情况均显示了两次，是代表CiteSpace对每一年的情况都做了两次统计吗？

1.Data>Import/Export>WebofScience>DuplicatesRemoval2.可以更改。

再试试。

3。

选的是被引参考文献吗？

4。

检查一下你是不是有两份文件。

（看看周斌有没有遇到这个问题）我最近在用citespace对作者进行分析，我想让每个节点所代表的作者名都能显示出来，我用了display-showclusterlabel等方法均不行，试以下Display>LabelFontSize:

Node...在做作者或机构或国家合作网络知识图谱时，Freq指的是被引频次呢，还是发文数量？

这时Freq为发文数量。

在选择“节点类型”的问题上有一点不明白。

我想做共词分析的图谱，选择keyword那一项就可以了吗，感觉这样画出的图谱好像没有体现出共词的关系呐。

Term和Keyword都可生成co-word网络。

Keyword是WebofScience记录中KeywordPlus字段里的词。

（有关研究前沿确定方法的问题）一个图谱的研究前沿是怎么确定啊？

我看的文章有的是直接把关键节点（有紫色外圈的）看做研究前沿，这样对吗？

分析研究前沿时termtype选择nounphrases还是burstterms？

NodeType选择Citedreference，这样对吗？

谢谢老师啦！

对错往往是相对的，主要取决于你要发现什麽问题。

（如何发现研究前沿）下面是一种方法：

1.CitedReferences2.生成网络3.CitationBurst（需按2次）红色为被引burst,是前沿的‘脚印’。

按CitationBursts（button）两次，图中一般便会加上红色圈圈，这样以后才有burst的数值。

Sigma最高的节点为重要地区留下的脚印。

4.生成聚类。

在ClusterExplorer里，选则右侧列表中脚印所在的聚类（参考#3）。

这时中间列表所显视的论文可视为一组前沿文献。

5.Synthesize>GenerateaNarrative中包括一些#4中提到的文献。

步骤3中所提到的前沿的“脚印”，是不是就是说它们在当时的那个时间里是研究前沿，即曾经是研究前沿？

非常谢谢老师详细的解答！

严谨地说，‘脚印’只是前沿所留下的线索，蛛丝马迹，并非其真面目。

熊猫的脚印不等于熊猫。

第5步才涉及到脚印到底是那个熊猫的。

如何用基于CSSCI的数据绘制“研究前沿突变术语”的图谱？

（burst来源为名词短语）1.抽取名词短语，选需要的年份，选NounPhrases，等左边窗口出现回应后，GO.等到提示visualize,save,cancel，选cancel.以上这步只需做一次2。

选burst,用名词短语3.NodeType选CitedReferences和Terms.4。

GO.

在您的文章：

《citespace2：

科学文献中新趋势与新动态的识别与可视化》中第409页，大规模生物种群灭绝中用了四种视图：

1，共被引文章的合并网络；2经pathfinder裁剪的个体共引网的合并网络；3经pathfinder剪枝的混合网络；4经pathfinder裁剪的混合网络的时区视图。

在具体软件设置上我做如下设置对吗：

对于视图1:

选中burstTerms和citedReference。

对于视图2:

选中burstTerms和citedReference及pathfinder和pruningslicednetworks。

对于视图3:

中的混合网络如何设置？

混合网络是如何定义的？

在做文献分析的时候都需要做上面四种视图的分析吗？

对应图应为图3-图6。

图3：

CitedReferences图4：

CitedReferences加Pathfinder图5：

CitedReferences和burstterms

我看您的著作《TheStructureandDynamicsofCo‐CitationClusters:

AMultiple‐PerspectiveCo‐CitationAnalysis》中关于ACA的操作，在做出来ACA的timeline图谱之后，表4做的是“labelsofthe largestACAclusters”，我知道操作，但后面的表5top-10mostcitedauthorsofthe largestACAclusters“的具体操作时怎样的，可按下列步骤：

1-cluster2-label3-Synthesizing>ClusterExplorer细节上有些变动，如引文前面0.41指该文引用了相应聚类中41%的文献。

我在DCA聚类分析中，按步骤做到了ClusterExplorer,但是无法做到像您的著作《TheStructureandDynamicsofCo‐CitationClusters:

AMultiple‐PerspectiveCo‐CitationAnalysis》中，从最大的聚类中找到citedreferencesastheIntellectualBase或者CitingArticlesasResearchFronts，那些citedreference还有citingarticle是怎么找出来的？

我在clusterexplorer中可以找到每个聚类的clustermembers还有clustermakers。

clustermembers中有author但是title下面都是省略号“.....”。

clustermakers显示正常，下面的文献是不是应该对应的是citingarticle呢？

clustermembers==citedreferences==intellectualbase，clustermakers==citingarticles==researchfronts，citedreferences的title你要逐个找一下，最简单的办法是在网络中找到相应的节点，右键》DOI,或GoogleScholar来找title。

citespace对一个领域做了DCA聚类分析之后，对较大的聚类做了clustermembers==citedreferences==intellectualbase，clustermakers==citingarticles==researchfronts知识基础和研究前沿分析，那么这些研究前沿可以代表本领域的研究前沿吗？

是根据burstterm得到的吗？

此前沿可代表本领域的主要研究前沿，是由其对偶关系决定的，即在知识基础上的新知识。

在ClusterExplorer中这个关系是由左，中两列文献表示的。

termlabeling和articlelabeling分别是什么意思？

因为改变两个的阀值显示的词语是不同的，那我们分析的时候是应该用termlabeling显示的词语进行分析，还是用articlelabeling显示的词语进行分析呢？

而且两个显示的方式一个是圆形的，一个是方形的，我始终不清楚这两个都是代表什么意思。

圆形节点：

包括被引文献（citedreference）,被引文献的作者（citedauthor）等。

方形节点：

引用文献中的词/字（term）.这两类节点在用户界面上是分开的。

termlabelingandarticlelabeling分别控制这两类节点的labels.你需要哪类节点的信息，就用哪个控制。

如果我想分析关键词共词图谱，是不是应该选择圆形节点进行分析？

是.选Terms.文献共引图谱中节点之间的距离能说明什么？

为什么有些节点距离近？

有些节点相距远，如何判读？

还有被引频次多不一定节点就大，这如何解释？

距离本身什么也不说明。

应该只以是否有连线为准。

参见我以前的论文。

节点大小在default显视中是和被引频次成比例的，在其他显示模式中是和其他度量成比例的老师说节点距离本身什么也不说明，是否意味着距离近的这些节点不能当做一种聚类？

判断聚类的依据是什么？

仅仅根据连线颜色划分聚类可以么？

能否站得住脚呢？

节点之间连线粗细与共被引次数成比例，对么？

）：

？

1：

是。

？

2：

参见：

Chen,C.,Ibekwe-SanJuan,F.,&Hou,J.（2010）Thestructureanddynamicsofco-citationclusters:

Amultiple-perspectiveco-citationanalysis.JournaloftheAmericanSocietyforInformationScienceandTechnology,61（7）,1386-1409.10.1002/asi.21309？

3：

仅靠颜色只说明时间。

？

4：

粗细：

对。

向您请教一下，citespace中的指数“modularity”和“silhouette”分别表示什么，有什么意义参见Chen,C.,Ibekwe-SanJuan,F.,&Hou,J.（2010）Thestructureanddynamicsofco-citationclusters:

Amultiple-perspectiveco-citationanalysis.JournaloftheAmericanSocietyforInformationScienceandTechnology,61（7）,1386-1409.

（如何删除以前数据，重装软件）我之前用的是3.0R2的版本，由于我是初学阶段，用个很多不同的数据去尝试，但后来我觉得数据太多我想删除一些数据和一些临时文件，我就在输入数据路径上面点击了clear后，再重新启动Citespace软件就怎么也进不去了，点了后就是显示启动Javaw6.0......,小方框，点点闪闪表示启动可是等这个完了就什么界面也没显示。

我后来想是不是我的Javaw程序出了问题，我重新安装了好几遍也是这样，还换了其他版本也不行，我后来还装了3.0R5,点击后还是这样，出不来citespace的界面。

在命令行：

javaws–viewer，从中删除所有CiteSpace的条目。

然后再重新下载安装CiteSpace。

linkstrengthsshow之后出现的数字表示什么意思？

2、在哪里能看到节点间共现次数？

我在data->import/export->里面看到可以sql查询，其中有下拉菜单选项author*authorcollaborationcounts这个应该就可以知道合作次数了吧？

但是我输入已有的project名称始终都说Notfoundanyrecords.articles。

对于里面的操作我在wiki上看到过相关文章，但是和我目前用的最新版本有所不同，比如database选择open后没有任何对话框弹出。

还请教陈老师告知project和database之间的关系，以及project中应该输入什么才能出来查询结果？

1.余弦2。

两个project不一样。

要在import/export建立。

中文数据做关键词共现时，可视化界面左侧的列表有重复的记录，这要如何合并，并将合并后的结果反应到中间的图谱中？

图中以右键选择PrimaryAlias/SecondaryAlias,然后再GO!

一遍。

我选择了nounphrases，点运行后，图没有显示，后面processreport里写有mergednetwork:

nodes=0,links=0,exclusionllist=0.试试NodeType:

Terms1、CSSCI数据聚类后，我选择“labelclusterswithindexingterms”来自动标注聚类标签，是否可行？

citespace中tf*idf、LLR和MI三种算法是否可以正确计算出top-ranked的中文标引词？

2、聚类类别选择“coloredbyclustersmembership”后，图谱中各个节点的颜色传递什么信息？

1。

应可以。

2。

同一颜色属于同一cluster.我想用citespace来分析中文每年数据对应的参考文献数，操作如下：

termtype=none，nodetypes=CR，点击GO后，请问citespace中什么标准的参考文献为validreferences，什么样的参考文献是invalidreference？

spacestatus中对space数值和processReports中的validreference数值有关联不？

我感觉二者数值应该一样才是，请问space值代表的参考文献是以什么标准来得到的？

含有author,year,source等信息。

缺少这三者其一便invalid

（专利分析）最近在用citespace做专利分析，1、用sigma值来表示结点大小，为什么结点都一样大呢？

2、我生成的图谱有的结点的burst值很大但是却没有红色的突变标记，1.Display>Label:

proportional/uniform2.点两下CitationBurst.

应用citespace在取“nodetype”，同时选择term和keyword以及citedreference，或者更多，那么形成的网络是哪种关系的共现网络呢？

而且，同时选择多种类型后，“articlelableling”的标示词应该显示哪种呢，是作者还是被引文献？

另外，要寻找研究主题的研究前沿，您认为“nodetype”里面必选哪几项呢？

因为我发现不同选择聚类不同。

恳请老师指教~1.term/key

展开阅读全文