KNIME教程.docx
《KNIME教程.docx》由会员分享,可在线阅读,更多相关《KNIME教程.docx(58页珍藏版)》请在冰豆网上搜索。
KNIME教程
入门指南
我们现在想把你整个过程一步一步的建立一个小的、简单的工作流:
我们读在数据从一个ASCII文件,指定颜色,集群数据并显示数据表和散点图。
当我们执行这个流程我们将检查数据模型已经建立。
我们假设你刚刚开始KNIME空着的工作流。
更全面的KNIME快速入门指南,也包含在KNIME下载可以在这里找到。
添加节点
在节点库扩大“输入输出”和“读”类别中,如低于(左图像)和拖放文件阅读器图标工作流编辑器窗口。
下一个节点现在将k-均值聚类算法。
扩大“挖掘”类别紧随其后的是“聚类”的类别,然后拖动节点k-Means流(图右)。
在搜索框中输入“颜色”节点存储库并按下enter。
这限制了节点显示的“颜色”在他们的名字(见上图中)。
拖动颜色马槽节点工作流(该节点将定义在数据视图的颜色之后)。
看到所有节点在库再一次,按下ESC或退格键在搜索字段节点的存储库。
现在,拖动互动表和散点图从“数据视图”范畴的工作流编辑器和位置它右边的颜色管理器节点。
连接节点
现在你需要连接节点为了得到数据流。
点击一个输出端口并拖动连接到一个适当的输入端口。
完整的流程如下图所示:
你的节点不会显示一个绿色的状态,只要他们不是配置和执行。
配置节点
完全连接节点和一个红色状态图标需要配置。
先从文件阅读器,右键单击它并选择“配置”菜单。
导航到“IrisDataSet”目录KNIME位于安装目录。
选择数据。
所有文件从这个位置。
文件阅读器的预览表显示了一个示例数据。
点击OK以关闭对话框的文件阅读器节点。
一旦节点已被正确配置,它切换到黄色(意味着准备好执行)。
在那之后,k-均值节点立即变成黄色,作为其默认设置被应用。
可以肯定的是,默认的设置符合您的需要,打开对话框,检查默认设置。
为了配置颜色管理器节点你必须首先执行节点k-均值。
执行后,所有的名义值和范围的属性是众所周知的:
这个meta信息被传播到继任者节点。
颜色管理器需要这个数据之前可以对它进行配置。
一旦执行k-均值节点,打开配置对话框的颜色马槽节点。
执行节点
现在执行散布图节点:
工作台为您执行所有的前任节点。
在一个更大、更复杂的流程你可以选择多个节点和触发执行给他们所有的人。
工作流管理器根据需要执行节点,如果可能的话在平行。
检查结果
为了检验数据和结果,打开节点”的观点。
在我们的示例中,k-均值,互动表和散点图有观点。
开放他们从节点的上下文菜单。
Hiliting
选择一些点散点图,选择“HiliteSelected”从“Hilite”菜单。
这个hilited点标记一个橙色的边境。
您还将看到hilited分在表视图。
传播的醒目地位适用于所有视图在所有部门的流动显示相同的数据。
开始你自己的探索之旅!
这只是一个非常简单的例子来让你开始。
有更多的发现。
玩它!
我们试图保持简单和直观的。
这将是伟大的,收到你的反馈,找出你喜欢的和你不喜欢,东西你找到尴尬或事情似乎并未奏效。
工作台
描述可用的视图
在以下的KNIME工作台及其特性进行更为详细的描述。
当KNIME最初打开它始于以下安排视图:
WorkflowProjects
所有KNIME工作流是显示在工作流项目视图。
工作流的状态表示一个图标显示工作流是否关闭、闲置、执行或者执行完成。
FavoriteNodes
最喜欢的节点视图显示你最喜欢的,最常用的和去年使用的节点。
一个节点被添加到你的收藏夹通过拖动它从节点存储库到个人最喜欢的节点类别。
当一个节点拖动到工作流编辑器,最后使用和更新最频繁使用的类别。
最喜欢的节点视图有以下操作菜单栏的视图:
收起所有扩展类别
扩大所有类别
清除过去的使用和最经常使用的类别
删除选中的节点从您的收藏夹
节点的数量在去年使用最频繁和类别默认限制为10节点。
这个数字可以调整,在偏好。
选择“文件/首选项..“/KNIME/KNIMEGUI设置不同的值的最大大小常用节点和最大数量的最后使用节点。
NodeRepository
节点存储库包含所有节点KNIME下令在类别。
一个类别可以包含另一个类别,例如,阅读类别是一个子类的IO范畴。
节点从存储库中添加工作流编辑器通过拖放它们到工作流编辑器。
选择一个类别显示所有包含节点的节点描述视图,选择一个节点显示为该节点的帮助。
如果你知道一个节点的名称可以输入部分的名字在搜索框中节点的存储库。
当你输入所有节点都立即过滤那些包含输入的文本在他们的名字:
Outline
outline视图提供了一个概述整个工作流即使只有一小部分是可见的工作流编辑器(标记为灰色在大纲视图中)。
outline视图还可以用于导航:
灰色矩形可以移动鼠标,导致编辑器向下滚动,可见部分匹配的灰色矩形。
Console
控制台视图打印出错误和警告消息为了给你一个线索:
底层怎么回事。
相同的信息(调试详细级别是写入一个日志文件,它位于{workspace}/.metadata/knime/knime.log)。
如果你想改变这个级别的细节(这两个日志文件或控制台视图)去
File/Preferences.../KNIME详细级别的日志文件或去
File/Preferences.../KNIME/KNIMEGUI的细节层次控制台视图。
你可以选择:
DEBUG
主要用于开发调试消息。
不建议使用这个控制台视图,因为它KNIME减慢。
INFO
日志信息消息。
不是真的重要,但也不是完全无用!
WARNING
如果一个节点不能在配置一个警告消息也发布了。
警告消息不是致命的;通常工作流可以继续执行,但他们表示,一些值得了解已经发生。
违约和推荐级别控制台视图。
ERROR
只有当事情发生了致命的发行,即工作流可以不再被执行。
NodeDescription
节点描述显示选中的节点信息(或节点包含在一个选定的类别)。
特别是,它解释了对话框选项,可用的视图,预期的输入数据和输出结果数据。
在Linux下有一些问题与这一观点,因为它需要系统的web浏览器。
KNIME/Eclipse试图找到一个基于mozilla的浏览器自动,如果环境变量没有设置MOZILLA_FIVE_HOMEKNIME。
。
承宪应该注意浏览器,它是用在这种情况下。
你可以尝试显式地设置到firefox目录和MOZILLA_FIVE_HOME如果这没有帮助你也可以尝试通过“-Dorg.eclipse.swt.browser.XULRunnerPath=…“knime.sh。
有一个已知问题和Firefox3(和使用xulrunner>=1.9),对于那些没有解决方法除了使用的是旧版本。
这也可能导致你一些麻烦。
参见链接的Eclipsebug报告
为了提供一个完整的文本搜索,节点的描述也集成在Eclipse帮助。
选择帮助/帮助菜单中的内容以打开Eclipse内置的帮助。
有一个KNIME范畴,它有一个节点描述子菜单。
在搜索字段可以执行全文搜索在所有节点的描述。
例如,如果你输入“集群”,所有节点描述包含词集群显示:
Preferences
偏好与文件/打开首选项…KNIME-related的偏好被分成三个类别:
KNIME
偏好的KNIME也适用于KNIME如果开始在批处理模式
日志文件日志级别
的详细级别的日志文件。
默认值是调试,这意味着开发人员也记录信息。
这个日志文件发送给我们如果你遇到任何意外的行为可能会给我们一个提示,是什么导致了这个问题。
最大工作线程对所有节点:
这个KNIME工作流管理器试图优化执行时间的节点,例如,通过分配单独的分支的工作流来几个线程。
它可以归结为并行运行节点尽可能。
这里您可以输入多少线程应该用于并行化。
默认情况下它是CPU的数量的两倍。
这已经被证明是一个良好的数额。
目录为临时文件
KNIME需要存储一些临时文件(数据的执行但尚未保存工作流)某处。
您可以在这里指定位置。
KNIMEGUI:
偏好相关的KNIME图形用户界面。
控制台视图日志级别
的详细级别的日志信息显示在控制台视图。
通常警告是足够的。
调试减缓性能和主要适用于发展。
确认节点复位
请选择你想要的是否一个确认对话框弹出当你重置一个已经执行节点。
如果你检查了“不又问“复选框在这种类型的对话框中,选择“选项”,使它们再次出现。
确认节点/连接删除
上面提到的一样,但是对于确认删除节点和/或连接。
确认重新连接已连接的节点
截至KNIME2.0可以拖动一个连接到一个已经连接的端口。
连接被替换如果配置节点,但如果它被执行(因此将重置取代连接)一个确认对话框。
这个确认对话框也可以被开启或关闭通过这种偏好。
最大尺寸为最常用的节点
节点的数量来维持最频繁使用的节点类别的最喜欢的节点视图。
最后使用节点最大尺寸
节点的数量由去年使用节点类别的最喜欢的节点视图。
MasterKey
KNIME不存储任何密码(例如数据库)在普通测试,但通过一个主密钥加密.
WorkflowEditor
工作流编辑器是用来装配工作流程、配置和执行节点,检查结果和探索你的数据。
本节描述了交互可以在编辑器。
NodeOptions
Configure
当一个节点拖到工作流编辑器或连接,它通常显示红色的状态灯显示它需要配置,即对话框已被打开。
要做到这一点,可以双击节点或用鼠标右键单击节点打开上下文菜单。
第一个条目的上下文菜单是“配置”,打开对话框。
如果节点被选中您还可以选择相关的按钮上面的工具栏编辑器。
按钮看起来像旁边的图标上下文菜单项。
Execute
在接下来的步骤中,您可能希望执行节点,即您希望节点实际执行其任务的数据。
为实现这一目标右键单击节点为了打开上下文菜单,并选择“执行”。
你也可以选择相关的按钮从工具栏。
按钮看起来像旁边的图标上下文菜单项。
没有必要执行每一个节点:
如果执行最后一个节点连接的但尚未执行节点,节点将执行所有的前任执行之前最后一个节点。
ExecuteAll
上面的工具栏编辑器还有一个按钮来执行所有未执行节点工作流。
这同样适用,如果一个节点在流点着红状态灯由于信息缺失的前任节点。
当节点执行的前身和节点与红状态灯可以应用其设置执行以及其继任者。
底层的工作流管理器还试图执行的分支并行的工作流。
ExecuteandOpenView
节点的上下文菜单还包含“执行并打开视图”选项。
这个执行节点,并立即打开视图。
如果一个节点有多个视图只有第一个视图打开。
OpenView
一个节点可以没有,一个或多个视图。
每个视图显示为一个条目在节点的上下文菜单。
选择它为了打开相关的视图。
一种观点认为,之前被打开节点已经执行,尽快更新节点执行。
你可以打开视图的一个节点几次,例如如果你想要比较不同的列在散点图。
一个视图是自动复位如果节点是复位。
OpenOut-portView
如果一个节点没有一个观点,你有兴趣结果节点的数据操作,您可以检查数据。
它可以在节点的输出端。
底部的上下文菜单中有一个条目,每个节点的输出港。
每一个打开引用视图输出端。
注意,输出端视图不支持任何交互或hiliting。
如果你想看到hilited醒目数据或数据输出端连接到互动表节点。
Reset
你可以重置一个节点通过选择重置选项从上下文菜单。
节点返回的执行状态(绿色状态灯)来配置状态(黄色状态灯)。
如果节点被选中您还可以选择相关的按钮上面的工具栏编辑器。
按钮看起来像旁边的图标上下文菜单项。
Cancel
如果一个节点是当前执行你可以取消执行通过选择“取消”选项从上下文菜单或相关按钮(相同的图标,在上下文菜单)从工具栏。
CancelAll
工具栏还包含一个“取消”按钮,取消所有正在运行的节点的执行。
EnterCustomNodeName
当一个节点拖到工作流它有一个名字,比如“节点1”或类似的默认情况下低于状态灯。
你可以改变这个名字更好地描述节点实际上是做,例如。
“过滤器值>10”。
这可以通过选择节点,然后单击名称:
名称变成可编辑。
按“返回”应用您的更改。
EnterCustomNodeDescription
在上下文菜单中你还会找到“节点名称和描述”选项。
这将打开一个对话框来选择输入一个新的名称为节点。
此外您可以输入一个更详细的描述或说明该节点。
这个动作也可以通过工具栏中的按钮。
Connections
你可以连接两个节点通过拖动鼠标从一个节点的输出端到另一个节点的停港。
循环是不允许的。
如果一个节点已经连接你可以替换现有的连接通过拖拽一个新的连接到它。
如果节点已经连接,您会被要求确认结果重置目标节点。
你也可以拖动结束的一个现有的连接到一个新的停港(或者相同的节点或一个不同的节点)。
Import/Exportofworkflows
ImportofWorkflows
您可以导入一个工作流可以从一个不同的工作区或从一个zip文件,例如如果工作流是KNIME出口。
导入向导可以打开菜单中的“文件/导入KNIME工作流……”或通过打开上下文菜单在工作流项目视图并选择“导入KNIME工作流……”。
选择根目录,如果您想要导入工作流从另一个工作区。
选择存档文件的选择如果你想浏览压缩工作流。
选择您想要导入的工作流。
如果一个工作流具有相同名称已经存在在当前工作区中您可以重命名导入的一个在向导的下一个页面。
通过点击OK项目导入到您的工作区。
如果你不“复制项目进入工作区”,更改到这个工作流也将适用于工作流在源位置。
ExportofWorkflows
出口流程操作也可以通过菜单(文件/出口KNIME工作流…”)或通过上下文菜单中的工作流项目视图。
两个打开出口流程向导。
选择你想要导出的工作流。
如果你右键单击一个工作流打开导出向导这个工作流是预选。
在第二场浏览到目标位置或输入路径导致出口位置。
选择排除数据被导出默认激活。
如果勾选此项,只有结构的工作流是出口,这将导致一个配置但非执行工作流如果是被。
如果您显式地共享数据(例如,如果对方不能访问数据库)你可以取消选中此选项。
元节点
UsingMetaNodes
元节点节点包含subworkflows,即在工作流它们看起来像一个节点,尽管他们可以包含很多节点,甚至更多的元节点。
他们正在创建的帮助元节点向导。
你可以打开元节点向导通过选择“节点/添加元节点”
从菜单或点击按钮与元节点图标的工具栏(工作流编辑器必须是可打开的)。
CreatePre-definedMetaNode
创建一个预定义的元节点,选择一个,然后单击“完成”。
你的选择是添加到工作流。
CreateCustomizedMetaNode
如果你需要不同数量的或出港口或想有不同的端口类型你可以选择一个预先定义的元节点作为模板,然后点击“定制”来访问这个向导的下一页。
在此页面您可以添加或删除在——和出港口的模板。
一个图标在底部立即给你一个预览的节点。
当你添加一个端口的模板可以选择类型的端口:
数据,
数据库或
数据挖掘端口(PMML)。
一旦节点适合你的需要,单击“完成”以将其添加到工作流。
InsideaMetaNode
为了打开一个元节点可以双击它或者选择“打开Subworkflow编辑”从上下文菜单。
根据不同的数量的,和出港口的内部元节点类似于下图:
\
在—进或出港口是固定的,被称为workflowportbars,可以移动和调整大小。
数据连接到停港从外面出现在元节点编辑器在停港。
反之亦然:
数据连接到内部输出端出现在外面的输出端。
MetaNodesFromOutside
元节点看起来不同正常节点。
背景图标不是圆形的,有一个黑暗的灰色背景。
没有状态灯,没有进行。
StatesofMetaNodes
元节点没有像许多州作为一个节点。
一个元节点的状态同工作流的状态。
元节点可以:
idle/configured
如果至少有一个节点在元节点,既不执行也不执行。
Executing
如果至少有一个节点执行
Executed
如果所有包含节点执行
元节点的状态是由一个图标显示在元节点(从外部观察)。
Out-PortsofMetaNodes
除了元节点的状态的出港口的一元节点也有州。
一个小装饰图标显示状态的输出端。
如果一个端口未连接或连接到一个空闲节点既不规范也不数据是可用的。
这是显示一个红色图标。
如果一个端口被连接到一个配置节点,有些规格是可用的。
这是显示一个黄色的图标。
如果一个端口被连接到一个执行节点,规格和数据是可用的。
这是显示一个绿色的图标。
FAQ
WhatisKNIME,whatdoesKNIMEstandforandwhohasdevelopedKNIME?
KNIMEstandsforKoNstanzInformationMinErandispronounced:
[naim](thatis,withasilent"k",justasin"knife").ItisdevelopedbyKNIME.comAGlocatedinZurichandthegroupofMichaelBertholdattheUniversityofKonstanz,ChairforBioinformaticsandInformationMining.Whyisitcalled"KNIME"?
Well,"KonstanzInformationMiner"usedtobecalled"Hades"(asthepubsomeofitscreatorsendedupgoingtooften).Butthatraisedlotsofnotsonicequestions("sothisiswhereyourdataendsupwhenit'snotusefulanymore?
")sowelookedforanothername."KIM",theobviouschoicewas,ofcourse,alreadytaken.However,theKonstanzlicenseplatesymbolis"KN",soKNIMwasournextchoice.Addingavowelattheendwassuggestedbyanativespeakerto"rounditoff",asheputit.Anditappearsin"Miner"sowefeltokaboutit.PlusURLssuchas"knime.org","knime.de",...werestillavailableatthattime...
HowtociteKNIME?
TherecommendedwaytociteKNIMEistocitethepaper
withthefollowingBibTeX:
@INPROCEEDINGS{BCDG+07,
author={MichaelR.BertholdandNicolasCebronandFabianDillandThomasR.Gabrieland
TobiasK\"{o}tterandThorstenMeinlandPeterOhlandChristophSiebandKilianThieland
BerndWiswedel},
title={{KNIME}:
The{K}onstanz{I}nformation{M}iner},
booktitle={StudiesinClassification,DataAnalysis,andKnowledgeOrganization(GfKL2007)},
publisher={Springer},
ISBN={978-3-540-78239-1},
ISSN={1431-8814},
year={2007}
}
CanImodify,publish,transmit,transferorsell,reproduce,createderivativeworksfrom,distribute,perform,display,orinanywayexploitanyofthecontent,inwholeorinpart?
Youmaydoallthisinaccordancetothelicenseonly.KNIMEisavailableunderaduallicensingmodel.Aversionunderanopensourcelicenseisavailablefordownloadfromthiswebsite.Ifyouneedotherlicenseterms,pleasecontactus.Pleaserefertothelicenseformoreinformationaboutthetermsoftheopensourcelicense.
HowmuchdatacanIprocesswithKNIME?
Basically,therearenolimits,sincethedataisbufferedinanintelligentway.Nevertheless,somealgorithmsmayrequiretoomuchtimeandmemoryforveryhugedatasets.
I'mgettingerrorslikejava.lang.OutOfMemoryError:
PermGenSpace.Whatiswrong?
ThisisaknownbuginSun'sJava,whichoccursifalotofclassesareloaded.ThissometimesoccursinKNIME/Eclipseifyouhavealotof,orhugeplugins.Aworkaroundistopasstheoption-XX:
MaxPermSize=128mtotheJavacommand.TheKNIMEproductisalreadyusingthissettingbydefault.YoucanalsotryanotherJavaimplementation,suchasthosefromIBMorBEA.
SeealsoEclipse'sandSun's