基于SOM和引力场聚类的金融数据可视化.pdf

上传人:b****2 文档编号:3177264 上传时间:2022-11-19 格式:PDF 页数:9 大小:1.38MB
下载 相关 举报
基于SOM和引力场聚类的金融数据可视化.pdf_第1页
第1页 / 共9页
基于SOM和引力场聚类的金融数据可视化.pdf_第2页
第2页 / 共9页
基于SOM和引力场聚类的金融数据可视化.pdf_第3页
第3页 / 共9页
基于SOM和引力场聚类的金融数据可视化.pdf_第4页
第4页 / 共9页
基于SOM和引力场聚类的金融数据可视化.pdf_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

基于SOM和引力场聚类的金融数据可视化.pdf

《基于SOM和引力场聚类的金融数据可视化.pdf》由会员分享,可在线阅读,更多相关《基于SOM和引力场聚类的金融数据可视化.pdf(9页珍藏版)》请在冰豆网上搜索。

基于SOM和引力场聚类的金融数据可视化.pdf

第24卷第4期计算机辅助设计与图形学学报V0124No42012年4月JournalofComputerAidedDesignComputerGraphicsApr2012基于SoM和引力场聚类的金融数据可视化刘芳,田凯,周志光,林海(浙江大学CAD&CG国家重点实验室杭州310058)(1iufangcad巧ueducn)摘要:

平行坐标技术是信息可视化中重要的分析手段。

可以实现多维数据在二维空间上的可视化为了给用户提供一种快捷、方便的金融数据可视化及分析工具,提出一种基于引力场聚类的金融数据可视化方法首先利用自组织映射(s()M)对初始金融数据进行分类,使每类数据都含有特定的经济意义;然后进行视觉聚类,利用引力场原理对每个类中的折线进行聚拢,对类与类之间进行排斥,再通过设置不透明度以及交互操作等手段对可视化结果进行增强实验结果表明,该方法可以形成清晰的可视化聚类结果,便于发现数据的变化规律关键词:

聚类;平行坐标;金融数据;可视化分析;引力场;自组织映射中图法分类号:

TP391VisualizatiOnOfFinanciaIDataBasedonSOMandGraVitationalFieldClusteringLiuFang,TianKai,ZhouZhiguang,andLinHai(S缸把KPyk6DmfD叫o,CAD8LOGZ巧i口刀gLhiwrs缸y,H口雄g柚D越310058)Abstr舵t:

ParallelcoordinatestechniqueisanimportantanalysistoolininformationVisualizationItprovidesanintuitivewaytovisualizethemultidimensionaldataontwo-dimensionalspaceInthispaper,anapproachoffinancialdatavisualizationbasedonthegraVitationalfieIdclusteringisproposedFirstly,self-organizingmap(SOM)isusedtoclassifytherawfinancialdata;thereforeeachclassofdatacontainsspeci“ceconomicsignificanceThenthegravitationalfieldtheoryisusedtocongregatefoldlineineachclassandmeanwhiletosettheexclusionbetweentheclassesFinaUy,thevisualizationresultsareenhancedbysettingtheopacityandinteractionTheexperimentalresultshowsthattheproposedmethodformsaclearvisualclusteringresuItanddiscoversthevariationlawofdataKeywords:

clustering;paranelcoordinate;financialdata;visualanalysis;graVitationalfield;self-organizingmap当前多维数据普遍存在,特别是在经济领域中,烦琐的多维金融数据给用户的分析和理解带来了极大的困难随着金融数据的容量不断增大、复杂度不断提高,传统的可视化技术很难满足用户的需求,快捷、方便的多维信息数据可视化分析已经成为金融领域的研究热点20世纪90年代初,由Inselberg等口1提出的平行坐标技术是一种表示多维数据及对其相互关系进行分析的重要可视化技术该技术将靠维数据属性空间通过挖条等距离的平行轴映射到二维平面上,每条轴线代表一个属性维,轴线上的取值范围从对应属性的最小值到最大值均匀分布,则每一个数据项都可以根据其属性值用一条折线段在行条平行轴上表示出来,相似的对象就具有相似的折线走向收稿日期:

2011一0724;修回日期:

201110一12基金项目:

国家自然科学基金(6087312260903133)刘芳(1976一)女。

博士研究生,主要研究方向为科学计算可视化、信息可视化;田凯(1987一)。

男硕士研究生主要研究方向为科学计算可视化、信息可视化;周志光(1983一)男博士研究生主要研究方向为科学计算可视化、信息可视化、计算机图形学l林海(1965一)。

男,博士。

研究员,博士生导师。

主要研究方向为科学计算可视化,信息可视化、计算机图形学、虚拟现实等万方数据436计算机辅助设计与图形学学报第24卷趋势利用平行坐标技术可以在二维空间有效地表达多维信息数据,并且能够对初始数据的相似性进行分析然而,随着金融数据规模的不断扩大,折线重叠交错,大大妨碍了用户对数据的交互操作以及进一步的分析与认知为了有效地提高平行坐标的认知规律,减少视觉杂乱,聚类被广泛地应用于各个领域,其中大多数的聚类方法都是单一的基于数据的或基于视觉空间上的聚类基于数据的聚类是在绘制之前对数据进行预处理分类,但是由于数据集的范围很大,聚类后在平行坐标中绘制的结果可能还是很杂乱,很难识别出每个分类的数据特点和趋势基于视觉空间上的聚类方法是在平行坐标中通过分析线段间的几何关系来变换和分类的,这样就会导致聚类结果常常没有考虑到数据本身的实际意义,影响了聚类的准确性由于金融数据中数据本身所含有的特定经济含义,所以单一的基于数据的聚类方法可以有效地对数据进行分类,进而有效地辅助领域专家对初始数据的观察与分析然而,由于金融数据的规模很大,聚类后的平行坐标绘制结果依然杂乱且难以辨别,为进一步识别每个分类的特点和趋势带来了很大的挑战同时,由于单一的基于视觉空间的聚类方法单纯依赖平行坐标可视化后的结果,通过分析线段间的几何关系进行聚类,并没有集成数据本身所代表的含义,在一定程度上降低了分类的准确性,且影响平行坐标技术在金融领域的应用和推广根据上述分析,本文提出一种新的基于引力场聚类的金融数据可视化分析方法首先利用无监督的自组织映射(sel卜organizingmap,SOM)对初始金融数据进行预分类;然后在平行坐标可视化过程中引入引力场的物理模型,对平行坐标可视化的结果进行一次视觉聚类同类线段表现的是吸引力,而不同类之间的线段表现的是排斥力,利用曲线改变线段的形状可以减少视觉混淆根据金融数据分析的特殊性,用户可以调节吸引力的尺度因子,亦可以对不同属性轴设置权重值,进而获得自己感兴趣的平行坐标可视化结果;为进一步增强可视化效果,采用传输函数以及交互的可视化技术可以更好地分析初始金融数据,给予投资者一定的参考信息我们采用“2008年中国951家工业上市公司的年报信息”这一真实的金融数据案例作为研究对象来验证本文算法的有效性实验结果表明,基于引力场聚类的平行坐标技术可以快捷地对公司的财务状况进行显示与分析,进而有效地对公司进行分类和排序用户可以方便地选择出财务状况优秀和有投资价值的公司,做出投资决策1相关研究在信息可视化领域,关于多维数据的表示、分析和可视分析一直是研究热点问题,各种各样的可视化技术被应用到多维数据的显示与分析中平行坐标作为该领域中的重要可视化技术,已经广泛应用于多维数据的可视化与分析传统的平行坐标技术根据线段的显示分布对多维数据进行分析,有效地拓展了多维数据可视化的应用1然而,经典的平行坐标技术依然存在许多不足,比如针对复杂多维数据的可视化,线段的分布混淆、杂乱,难以辅助用户对初始数据做进一步的分析因此,近年来众多学者从聚类、减少杂乱和交互等方面对平行坐标进行了改进,使用户能够快速、准确地在平行坐标中发现数据的规律及发展趋势分层平行坐标采用分层显示的方法21对数据集进行多种层次的显示,克服平行坐标中数据显示杂乱的问题分层显示中利用分层聚类算法构造分层聚簇树,分层聚簇树可以从不同抽象层次上构造和表达大型数据集Novotny3提出了用多边形区域来表示每个类,先对原始数据用愚一means算法进行分类,然后用不透明度和纹理区分不同的类Zhou等41提出一种新的技术平行坐标的视觉聚类方法,通过最小化曲率和最大化相邻边缘的平行来优化曲线边缘,以便加强聚类的效果,并进一步通过叠加半透明线段来增强重要的信息5Guo等6提出了一种交互的聚类方法,用户用鼠标点击平行坐标中感兴趣的区域,使周围某个范围内的直线受到影响,以这个点为中心向其聚拢形成一类;该方法不同于其他应用于全局数据的聚类方法,而是关注于某个区域,并在该区域内进行直接的交互操作,达到聚类的效果并减少杂乱问题坐标轴重排技术7基于属性的相似性来重新排列坐标轴的顺序,减少了视觉上的杂乱除了坐标轴重排技术,Yang等建议在平行坐标中通过改变坐标轴间的距离和过滤掉坐标轴(过滤坐标轴是指当维度过多时减少一些维度,只将用户关心的属性显示出来)来减小平行坐标图的复杂度,减少杂乱以便更好地揭示多维数据集Miller等【9和Wegman等1叩在平行坐标中引入了线段密度的概念,利用密万方数据第4期刘芳,等:

基于s0M和引力场聚类的金融数据可视化度值来绘制原始数据,能更好地认识和识别数据规律Andrienko等m3通过计算数据的频率或密度信息,并根据这些结果在平行坐标中筛选用户关注的信息,从而减少视觉杂乱,强调属性问的重要关系Yuan等”3在平行坐标中集成了散点图,为了避免折线和散点在内容上的跳跃,把折线变成曲线并经过散点为了进一步方便用户对数据进行操作,人们引入了交互技术其中刷是一种突显数据子集的可视化

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 财会金融考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1