大数据可视化16章课后习题答案.docx
《大数据可视化16章课后习题答案.docx》由会员分享,可在线阅读,更多相关《大数据可视化16章课后习题答案.docx(13页珍藏版)》请在冰豆网上搜索。
大数据可视化16章课后习题答案
第一章
习题
一、填空与选择题
1.数据可视化的主要作用包括___数据记录和表达_____、___数据操作_____和____数据分析____三个方面,这也是可视化技术支持计算机辅助数据认知的三个基本阶段。
书P6页第三段
2.在医学可视化领域上要包含三方面的研究热点:
___图像分割技术_____、____实时渲染技术____和___多重数据集合_____技术。
书P17页第二段
3.据WardMO(2010)的研究,超过(B)的人脑功能用于视觉信息的处理,视觉信息处理是人脑的最主要功能之一。
书P7页第一段
A.30%B.50%C.70%D.40%
4.当前,市场上已经出现了众多的数据可视化软件和工具,下面工具不是大数据可视化工具的是(D)。
书P4页倒数第二段
A.TableauB.DatawatchC.PlatforaD.Photoshop
5.从宏观角度看,数据可视化的功能不包括(C)。
书P5页倒数第二段中间
A.信息记录B.信息的推理分析C.信息清洗D.信息传播
二、简答题
1.大数据可视化内涵是什么?
书P1页
1)数据可视化是关于数据视觉表现形式的科学技术研究。
2)数据可视化能将复杂的数据转换为更容易理解的方式传递给受众。
3)数据可视化主要是通过计算机图形图像等技术手段展现数据的基本特征和隐含规律,辅助人们更好地认识和理解数据,进而支持从庞杂混乱的数据中获取需要的领域信息和知识。
2.简述数据可视化的起源。
答:
数据可视化起源于图形学、计算机图形学、人工智能、科学可视化以及用户界面等领域的相互促进和发展,是当前计算机科学的一个重要研究方向,它利用计算机对抽象信息进行直观的表示,以利于快速检索信息和增强认知能力。
科学可视化—>信息可视化<—>数据可视化
3.总结数据可视化的意义。
答:
1)真(真实性):
指是否正确地反映了数据的本质,以及对所反映的事物和规律有无正确的感受和认识。
2)善(倾向性):
是可视化所表达的意象对于社会和生活具有什么意义和影响。
3)美(艺术完美型):
指其形式与内容是否和谐统一,是否有艺术个性,是否有创新和发展。
4.简述大数据可视化在工业4.0中的应用。
书P9页
1)生产数据可视化,防止数据丢失,可读性高,并且有只管的数据反馈。
2)产品可视化,提供高度展示感,以便对产品进行设计,评估与检验,例如流场计算应用。
5.简述城市计算的概念,如何理解城市计算的框架?
概念解释:
城市计算是一个交叉学科,是计算机科学以城市为背景,跟城市规划、交通、能源、环境、社会学和经济等学科融合的新兴领域。
更具体的说,城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)的过程。
城市计算将无处不在的感知技术、高效的数据管理和分析算法,以及新颖的可视化技术相结合,致力于提高人们的生活品质、保护环境和促进城市运转效率。
框架:
城市计算的基本框架,包括城市感知及数据捕获、数据管理、城市数据分析、服务提供四个环节。
6.城市计算可解决大城市哪些典型问题?
书P11-16页
1)实施大规模动态拼车服务。
2)路线通行时间估计。
3)基于出租车GPS轨迹的最快行车路线设计。
4)自行车租借系统使用需求预测。
7.如何理解可视化在大数据技术中的地位?
数据可视化是大数据的主要理论基础,也是大数据的关键技术,已经成为当前大数据分析的重要研究领域。
8.简述大数据可视化与其他学科的关系。
数据可视化是传统科学可视化与信息可视化的泛称。
9.解决高维数据可视化的思路是什么?
1)虚拟现实(VR)方法。
2)基于自上而下的子空间探索方法。
第二章
习题
--、填空与选择题
1.科学可视化常用方法有_____等值线法___、___颜色映射方法_____、____立体图法____、___层次分割法_____、___矢量数据场的直接法_____、____流线法____等(选写三个)。
书P27
2.科学可视化最初被称为“__科学计算__之中的可视化”。
书P24页
3.根据数据种类的划分,科学可视化可以分为___体可视化_____、___流场可视化_____、___大规模数据可视化_____等。
书P25页最后一段
4.等值线是制图对象某一数量指标值____相等____的各点连成的平滑曲线,由地图上标出的表示制图对象数量的各点,采用____内插法____找出各整数点绘制而成的。
书P28第一段
5.____信息可视化____是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对这些抽象信息的认知。
书P30页第三段
6.平行坐标系是一种____多维数据可视化____技术,使用____平行的竖直轴线____来代表维度,通过在轴上刻划多维数据的数值并用___折线_____连接某一数据项在所有轴上的坐标点,从而在二维空间内展示多维数据。
书P32最后一句
7.BenFry把数据可视化的流程分为了七步:
__获取____、____分析____、____过滤____、___挖掘_____、___表示_____、___修饰_____、___交互_____。
书P39第一段
8.可视分析流程图中的起点是____输入的数据____,终点是___提炼的知识_____。
书P40页2.2.2下面
9.Sacha的意义建构循环模型包含计算机和人两部分。
在计算机部分中,数据被绘制为____可视化图表____,同时也通过模型进行整理和挖掘。
在人的部分中,提出了___探索循环_____、____验证循环____和___知识产生循环_____三层循环。
书P41最后一段
10.平行坐标系使用(A)来代表维度,通过在轴上刻刘多维数据的数值并用折线相连某一数据项在所有轴上的坐标点,从而在二维空间内展示多维数据。
书P32
A.平行的竖直轴线B.交叉的横直轴线
C.平行的横直轴线D.交叉的坚直轴线
11.散点图矩阵通过(B)坐标系中的一组点来展示变量之间的关系。
书P33
A.一维B.二维C.三维D.多维
12.目前有多种成熟的知识可视化工具,下面(D)不属于这类可视化工具。
A.概念图B.思维导图C.认知地图D.趋势图
13.可视化模型有助于理解可视化的具体过程,常用的可视化模型不包括(C)。
A.循环模型B.分析模型C.递归模型D.顺序模型
14.极坐标图形是使用(B)来绘制的。
A.原点和半径B.相角和距离C.横纵坐标D.原点和相角
二、简答题
1.对数据可视化的三种类型进行对比分析。
书P61
三种数据类型:
1)类别型数据:
用于区分物体,可以用于区分一组对象,但是无法提供对象的定量数据。
2)有序型数据:
用于表示对象间的顺序关系,但是根据对象的顺序,并不一定能得到准确的定量比较。
3)数值型数据:
分为区间型数据(用于得到对象间的定量比较)和比值型数据(用于比较数值间的比例关系)
2.对数据可视化的三种基本模型进行对比分析。
书P39-42
1)顺序模型:
数据可视化的流程分为了七步:
获取、分析、过滤、挖掘、表示、修饰、交互。
为了使这个流程更便于理解,把这七步归纳为三大部分,即原始数据的转换(原始数据的转换包括7个阶段里的获取、分析、过滤和挖掘)、数据的视觉转换(包括7个阶段里的表示和修饰)以及界面交互(包括7个阶段里的交互)。
2)分析模型:
(1)数据表示与转换
(2)数据的可视化呈现
(3)用户交互(4)分析推理
3)循环模型:
(1)探索循环:
(2)验证循环(3)知识产生循环
顺序模型
3.列出在研究中经常使用的数据可视化工具,并进行对比分析。
ECharts、R、MATLAB、Python、SPSS、Tableau、Datawatch、Hightcharts:
Highcharts和Echarts就像是Office和WPS的关系,H国外英文,ECharts国内中文。
ECharts:
一个使用JavaScript实现的开源可视化库,提供直观,交互丰富,可高度个性化定制的数据可视化图表。
python作为一门高级编程语言,利用不同库如numpy,mat进行可视化图表展示
Matlab一个高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。
包含大量计算算法的集合。
4.研究MicrosoftOfficc中的数据可视化技术。
5.研究MySQL数据库中的数据可视化技术。
6.研究数据仓库中常用的数据可视化技术。
7.自学颜色刺激理论,并探讨其对数据可视化的意义。
书P27
视觉感知+颜色映射法
8.结合自己的专业领域,采用数据可视化方法展示该领域的典型文献数据。
第三章
习题
--、填空与选择题
1.混色特性包括___时间混色_____、____空间混色____和____双眼混色____等。
书P54中间
2.可视化是对数据的透彻理解、深入分析和综合运用,主要包括数据采集、___数据处理_____、___可视化模式_____和____可视化应用____四个环节。
书P58倒数第二段
3.彩色电影中彩色的形成属于相减混色,相减混色中采用品、黄、(C)3种颜色作为基色,它们各是绿、蓝、红的补色。
书P47最上面
A.红B.橙C.青D.紫
4.在明亮环境下,人眼对波长为555nm的(B)最为敏感。
书P47倒数第二段
A.红黄光B.黄绿光C.红蓝光D.紫绿光
5.人眼的视觉有惰性,这种惰性现象也称为视觉暂留,视觉暂留时间约为0.05~(C)。
书P50视觉惰性第二段
A.10msB.50msC.0.2sD.0.5s
6.人眼的视场是很宽的,垂直方向能超过80°,水平方向能超过(C)。
书P51第三段
A.1800B.170C.160°D.150°
7.图表类型的选择有依赖于所要处理和展现的数据类型,例如离散数据的数值可清晰计数,最适合用(B)展示。
书P57
A.曲线图B.柱状图C.饼图D.气泡图
8.雷达图适用于(D)数据,且每个维度必须可以排序。
书P63
A.一维B.二维C.三维D.多维
9.下列两色光重叠投影到(暗室)白幕上,应出现()颜色。
A.淡红和淡绿B.黄光和青光C.青光和品光D.红光和黄光。
二、简答题
1.彩色电视系统中的三基色是什么颜色,是如何选定的?
答:
三基色是红、绿、蓝;选用红绿蓝三种色光可混配出的颜色最多,使用彩色电视所能重现的色域最宽。
(书P46页)
2.何谓明视觉和暗视觉,比较在明视觉条件下对辐射功率相同的510nm绿光和610nm橙光的亮度感觉谁高谁低?
P48正数第2行至第9行
视觉有两重功能:
视网膜中央的“视锥细胞视觉”和视网膜边缘的“视杆细胞视觉”,也叫做明视觉和暗视觉。
明视觉和暗视觉(PhotopicandScotopicVision)不同波长的光刺激在两种亮度范围内作用于视觉器官而产生的视觉现象。
明视觉:
在明亮环境中的亮度感觉
暗视觉:
在黑暗环境中的亮度感觉;
比较:
在名视觉下,波长自555其,向左右两边减小,510nm绿光的亮度感觉比较高,610nm橙光的亮度感觉比较低
3.何谓视敏函数和相对视敏函数?
P47倒数第2段至倒数第一段
视敏函数:
通常用辐射功率的倒数来衡量人眼对波长“入”光的敏感程度。
把辐射功率的倒数称为视敏函数
相对视敏函数:
通常把任意波长光的视敏函数与最大视敏函数的比值称为相对视敏函数
4.何请对比度和亮度层次,它们之间存在什么关系?
书P49
对比度:
景物或重现图像最大亮度和最小亮度的比值
亮度层次:
画面最大亮度与最小亮度之间可分辨的亮度级差数
关系:
亮度层次与对比度的对数成正比
5.何谓视觉惰性,人眼视觉暂留时间是多少,电视显示25帧与视觉情性的关系是怎样的?
P50第3段,P51第2段
视觉惰性:
当一幅图像在眼睛中成像后,图像的突然消失并不会使视觉神经和视觉处理中心的信号也突然消失,而是发生一个按指数规律衰减的过程,信号完全消失需要一个相当长的过程。
也称为视觉暂留。
人眼视觉暂留时间:
0.05~0.2s
一般来说,要保持画面中物体运动的连续性,要求每秒摄取的画面数约为25幅,即帧率要求为25Hz,而临界闪烁频率则远高于这个帧率。
6.被传送的景物中,有两点的亮度分别为B1=1nit,B2=10nit,试说明B1、B2间能分辨的亮度等级(取δ=0.05)。
7.人眼彩色视觉对色调和色饱和度的分辨力怎样?
P53,倒数第7行
在380~780nm的波长范围内,人眼大体能分辨出200多种色调,人眼平均能分辨出15~20级的饱和度变化。
8.人眼彩色视觉对彩色细节的分辨力怎样,它在彩色电视中得到怎样的利用?
P54顶端
人眼的彩色分辨角一般比黑白分辨角大3~5倍,即人眼对彩色细节的分辨力只有对黑白细节分辨力的5/1~1/3。
在彩色电视系统传输彩色电视信号时,可以用较宽的带宽传送图像的亮度信息,用很窄的带宽传送图像的色度信息。
9.谈谈您是对数据可视化这门学科的认识和想法。
10.地理信息可视化是可视化应用众多领域中的一种,请列举几个属于地理信息可视化的实例。
地图、地铁线路图、飞机航行图
11.数据可视化的最终目标是什么,有哪些基本特征?
P55第2段
通过图形图像等技术来更为直观地表达数据,从而为发现数据的隐含规律和内在知识提供技术手段。
特征:
易懂性、必然性、多维性、片面性、专业性
12.举例说明数据可视化带来的好处,并讨论存在的技术难题。
P9
可视化能帮助人们提高理解与处理数据的效率,例如:
斯诺的霍乱地图,利用空间统计学寻找传染源。
13.数据可视化的三类通用目标是什么,分别举例加以说明。
P59倒数第2段
目标任务:
生成假设,验证假设,和视觉呈现。
14.以零售商销售报表可视化为例,说明数据可视化过程中的5个基本步骤。
15.使用常用的可视化工具(如Excel)对您所在班级的学生信息表进行可视化展示,并考虑如何突出展示效果。
16.在进行数据分析时,统计分析方法、探索性数据分析和数据挖掘三类方法各有什么侧重点和优势?
17.简要画出可视化流程概念图,并对其进行简要说明。
18.简要说明图3-16中数据挖掘与可视化的联系。
用户交互
映射可视化
转换
模型
数据可视化知识
模型
构建
数据
挖掘
模型
自动数据分析参数
改进
反馈循环
图3-16数据转换为知识的过程
1)数据表示与转换
2)数据的可视化呈现
3)用户交互
4)分析推理
19.谈谈您对数据可视化中美学因素的认识。
第四章
习题
一、选择题
1.基于任务分类学的数据类型定义了7个基本任务,分别是:
总览、(ABC)、关联、历史和提取。
(多选)书P73
A.缩放B.过滤C.按需细化D.删减
2.柱状图可视化的方法的特点,包括(ABC)。
(多选)书P75
A.是一种以长方形的长度为变量的表达图形的统计报告图
B.用来比较两个或以上的价值(不同时间或者不同条件)
C.利用柱子的高度,反映数据的差异
D.适用大规模的数据集
3.可视分析的运行过程可看作是(A)的循环过程。
(单选)书P83
A.“数据→知识→数据”B.“知识→知识→知识”
C.“数据→数据→数据”D.“知识→数据→数据”
4.常常用图论可视化来表述常见的关系模型,例如(ABC)。
(多选)书P81
A.“公司组织结构图”B.“人类关系网”
C.“家谱树”D.“城市人流检测”
5.方法论的角度,数据可视化可以分为三个层次,分别是(ABC)。
(多选)书P70
A.视觉编码层B.基本方法层
C.方法应用层D.界面展示层
二、设计题
1.API绘图设计。
设计一个基于API结构的Windows应用程序,并使用GDI绘制圆柱、圆锥和立方体。
三个图可以放大缩小和移动。
2.可视化方法应用:
尝试用Echarts开发一个某城市人流走势的小型可视化作品。
第五章
一、选择题
1.与大数据密切相关的技术是(B)。
A.蓝牙B.云计算C.博弈论D.Wifi
2.大数据应用需依托的新技术有(D)。
A.大规模存储与计算B.数据分析处理C.智能化D.三个选项都是
3.将原始数据进行集成、变换、维度规约、数值规约是在(C)步骤的任务。
书P104
A.频繁模式挖掘B.分类和预测C.数据预处理D.数据流挖掘
4.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的(A)问题。
书P109
A.关联规则发现B.聚类C.分类D.自然语言处理
5.当不知道数所带标签时,可以使用(B)技术位使带同类标签的数据与带其他标签的数据相分离。
书P108
A.分类B.聚类C.关联分析D.隐马尔可夫链
6.下面(A)属于映射数据到新的空间的方法。
A.傅里叶变换B.特征加权C.渐进抽样D.维归约
7.下列(B)不是专门用于可视化时间空间数据的技术。
A.等高线图B.饼图C.曲面图D.矢量场图
8.可用作数据挖掘分析中的关联规则算法有(C)。
A.决策树、对数回归、关联模式B.K均值法、SOM神经网络
C.Apriori算法、FP-Tree算法D.RBF神经网络、K均值法、决策树
9.用于分类与回归应用的主要算法有(D)。
A.Apriori算法、HotSpot算法B.RBI神经网络、K均值法、决策树
C.K均值法、SOM神经网络D.决策树、BP神经网络、贝叶斯
10.在基本K均值算法里,当邻近度函数采用(A)时,合适的质心是簇中各点的中位数。
A.曼哈顿距离B.平方欧几里得距离C.余弦距离D.Bregman散度
二、简答题
1.描述大数据3个内涵特征是什么,简述大数据内涵的数据特征。
三个内涵特征:
大数据的数据特征,大数据技术特征,大数据应用特征
大数据的数据特征,可用4v,5v,7v或11v等来描述。
其中7v特征的含义如下:
容量:
数据的大小决定所考虑的数据的价值和潜在的信息(量)
速度:
获得数据的速度,实时获取需要的信息(速)
种类:
结构化数据、半结构化数据和非结构化数据(类)
价值:
价值密度低;合理运用大数据,以低成本创造高价值(价)
真实性:
数据的质量,数据清洗,去伪存真(真)
可视化:
可视化可推动大数据的普及应用(普)
黏性:
改善用户体验,增加用户对媒体的黏性(黏)
2.简述总体大数据参考架构。
大数据参考架构总体上可以概括为“一个概念体系,两个价值链维度”。
“一个概念体系”是指它为大数据参考价值架构中使用的概念提供了一个构件层级分类体系,“两个价值链维度”分别为“IT价值链”和“信息价值链”
3.大数据核心技术有那些,对大数据参考框架,应该重点关注哪两类问题?
大数据核心技术有数据收集、数据预处理、数据存储、数据处理、数据分析、数据治理。
对大数据参考框架,应关注信息价值链(水平轴)和IT价值链(垂直轴)。
4.大数据可视化关键技术有哪些?
大数据可视化关键技术有:
数据信息的符号表达技术、数据渲染技术、数据交互技术、数据表达模型技术、可视化设计与开发模型。
5.大数据渲染包括哪些内容,大数据渲染主要技术原理有哪些?
大数据渲染研究的是如何将可视化后的图形图像更快、更准确地显示出来。
根据可视化的原理不同可以划分为基于几何的技术、面向像素技术、基于图标的技术、基于层次的技术、基于图像的技术和分布式技术等。
6.大数据渲染关键技术有哪些,大数据渲染与传统渲染相比有何特点?
主要存在3种渲染技术:
深度缓存技术、光线跟踪技术和辐射度技术
7.大数据渲染有哪些方法,举几个大数据渲染的经典案例。
大数据渲染方法主要有基于CPU的渲染和基于GPU的渲染。
大型的案例有:
70年代早期,Wamock、Watkins发明了flat着色方式和隐藏面算法;1999年NVIDIA显卡中出现了寄存离合器,2001年出现了顶点和像素着色器。
8.大数据渲染的工作流程如何?
DirectX10将顶点着色、几何着色和像素着色合并成一个渲染流程。
所以没一个统一流处理器都能处理顶点、几何和像素数据,不会有闲置问题,效率得到显著提高。
9.大数据可视化与渲染的关系如何?
作为一种媒介,可视化已经发展成为一种很好的故事讲述和展现方式,以图形化的形式呈现出来,清晰明了,当然渲染技术本身也起到了很大的作用。
第六章
习题
一、选择题
1.下列(C)不是可视化交互方法。
书P126
A.概览+细节技术B.焦点+上下文技术
C.概览+缩放技术D.平移+缩放技术
2.鱼眼视图属于(B)可视化交互方法。
书P129
A.概览+细节技术B.焦点+上下文技术
C.平移+缩放技术D.概览+缩放技术
3.多尺度导航属于(C)可视化交互方法。
书P126
A.概览+细节技术B.焦点+上下文技术
C.平移+缩放技术D.概览+缩放技术
4.下列(D)属于可视化交互设备。
书P143
A.平板电脑B.触摸屏C.立体眼镜D.以上都是
5.按照RobertSpence的交互类型分类方法,下列(B)不属于交互类型。
书P143
A.连续式交互B.主动式交互C.渐进式交互
D.混合式交互E.被动式交互
二、简答题
1.结合自己的专业知识,你认为人机交互与数据交互是一回事吗?
若不是,真正的区别是什么?
人机交互:
人机交互过程实际是一个输入和输出的过程,人通过人机界面向计算机输入指令,计算机处理后把输出结果呈现给用户。
数据交互:
人通过输入数据的方式与计算机进行交流的一种方式,是人机交互的重要内容与方式。
2.选择一个你熟悉的可视化工具,检查它支持的交互类型。
列出交互运算符和操作数,以及用户可以控制的交互参数。
3.你觉得鱼眼镜头算法可以有效地应用于可视化空间交互吗,为什么?
4.给出人口普查数据集,描述在可视化之前可以顺序执行的三种或多种方法,并说明每种方法优缺点。
5.本章介绍了几种可视化交互模型,尝试找出一种在某种性能上优于它们的模型。
6.假设你正在绘制20个不同国家的汇率。
请将国家名称列出至少三种排序的方法,并描述为什么每个方法都有用。
7.选择几个本章中介绍的可视化交互技术,对于每一种至少找出三种方法来改善他们。
8.下载、安装和测试本章描述中至少一个可视化系统,尝试自己将已有数据集导入系统。