1. 可视化分析经典案例
1854年8月到9月英国伦敦的一些地区爆发霍乱,医生约翰·斯诺(John Snow) 参与调查病源。他在绘有霍乱流行地区所有道路、房屋、饮用水机井等内容的1:6500比例尺地图上,标出了每个霍乱病死者的居住位置(图1中黑点所示),得到了霍乱病死者居住分布图。通过对这张图的分析,找到引发霍乱的那口水井。这是首次以地图为基础的空间分析,也是可视分析经典案例。
2可视化领域概括
2.1. 组成和历史发展
可视化有三个组成部分,分别是科学可视化,信息可视化和可视分析。科学可视化主要关注三维对象的可视化,数据一般来源于建筑学,气象学,物理学或生物学等领域,比如MRI扫描数据,水流大气等流场数据。信息可视化侧重于处理的抽象数据集,例如社交网络数据,文本数据,网络通信数据等。可视分析是前两个领域发展的产物。可视分析通过交互式的用户界面将信息以可视化的方式展现给人,希望发挥人的分析和推理能力从而发现数据中潜在的规律和模式,比如VisFan可以对银行的金融活动进行可视化,用于金融情报员检测和分析金融犯罪。可视分析是可视化领域中发展最迅速最新的研究内容。可视分析与前两者有个比较明显的区别,可视分析应用的最终用户是有领域知识的专业信息分析师,而科学可视化和信息可视化的终端用户可以普通用户。 下面回顾一下可视化领域发展中的一些重大事件。首届“科学计算之中的可视化”研讨会于1987年召开。1990年举办了首届IEEE可视化大会。2006年举办了第一届IEEE VAST (The IEEE Conference on Visual Analytics Science and Technology)。从给出的这三个事件中可以看出,可视化领域中最先发展起来的是科学可视化,接
着是信息可视化,最近几年可视分析才发展起来,还属于比较新的学科。 2.2.可视分析与其他学科的关系,与数据挖掘的比较
如图2,给出了可视分析与其他三个学科关系的示意图。从图2中可以看出,可视分析是其他三个学科的交叉学科。可视化基本流程中“Data mining”需要利用数据挖掘对数据进行预处理,“Encoding & Display”需要应用HCI的交互技术,“Display”过程需要应用计算机图形学的相关技术。可视分析领域的发展必将在其他三门学科发展的基础上进行,这就不难解释为什么可视分析在2006年才正式发展起来,有第一届VAST会议了。
前文给出可视分析的概念为“可视分析通过交互式的用户界面将信息以可视化的方式展现给人,希望发挥人的分析和推理能力从而发现数据中潜在的规律和模式”,可见可视分析的目标是发现数据中的规律和模式。然而众所周知,数据挖掘领域的研究目的同样是发现数据中的规律和模式。这两个领域有什么本质的区别呢?
其实这两者的区别还是很明显的,为了达到同样的目的这两个领域采用的方法是不同的。数据挖掘的出发点是充分发挥计算机的能力,通过监督学习或无监督学习的方式对数据进行聚类分析,从而发现数据中隐藏的规律和模式。可视分析则希望让计算机做计算机擅长的事情,让人做人擅长的事情,通过交互式的用户界面将信息以可视化的方式展现给人,充分发挥人的推理能力发现数据中的规律和模式。
3感受和认识
通过暑期教程,加深了对可视化领域的理解,并且产生了很大的兴趣,会有越来越多的人去研究这个。我觉得要搞好这个学科,首先得把大数据的一些处理方法要学的很流畅,还有语言和平台也要熟练,最关键的还应该利用好计算机图形学的知识把和大数据有关的知识整合起来。
因篇幅问题不能全部显示,请点此查看更多更全内容