据IDC预测 , 全球数据圈将从 2018 年的 33ZB 增至 2025 年的 175ZB 。其中,中国数据圈增速最为迅速,2018 年,中国数据圈占全球数据圈的23.4%,即 7.6ZB 。预计到 2025 年将增至 48.6ZB,占全球数据圈的 27.8%,中国将成为全球最大的数据圈 。
然而人类处理分析数据的能力却远远落后于所获取的海量数据,近年来,数据的多维度、多来源、多态等特性更加提高了数据分析的难度,依靠传统的工具已经越来越难满足这些新的挑战 。为了应对这些难题,数据可视化技术逐渐受到各行业的重视,比起表格以及简单的传统图表,图形符号以及其他基础视觉元素更容易被人理解与接受,英文中有句俗语“A picture is worth a thousand words”,即“一图胜千言”,一张与主题相关的图片有时比起详细的解释,能够更有效的描述有关主题 。受Mason Currey的著作《Daily Rituals》启发,RJ Andrews绘制出了16名创作者(作曲家,画家,作家,科学家 , 哲学家)在一天之内的生活创作轨迹,利用数据可视化方法,将一本书浓缩为一张简单的图表 。
下图是数据可视化案例中较为经典的:John Snow霍乱地图 。图中的小条形图标记出了伦敦每个家庭中死于霍乱的人数,旨在试图查明这些地区的死亡率高于其他地区的原因 。调查结果显示:霍乱感染者人数最多的家庭所使用的饮用水均来自同一口水井 。它帮助人们认识到,霍乱疾病与受污染的水井之间存在相关性,预防霍乱的办法就是建立排污系统并保护水井不受污染 。
数据可视化不仅可以真实还原复杂的数据集结构,例如将地理位置以及人数关系结合起来,甚至可以在其基础上针对数据细节做出了进一步增强,帮助用户理解系统中相关的信息 。
可视化结果本身就能够揭示问题的根本原因,还能启发人们找到解决方案 。
数据可视化的意义与全部工作不仅仅在于如何绘制出一张好看的图表,在进行可视化项目之前 , 我们需要:1)理解系统中相关的信息以及目标任务,例如本次数据可视化项目是为了怎样的目标服务 , 需要在何时何地怎样进行展示,读者基本情况以及显示硬件设备参数等也是不可或缺的关键信息 。附:设计师可能还需要进行实地设备考察,进行下一步设计 。2)与专业人员沟通并确定数据与视觉元素之间的映射关系,例如将生产数据映射为柱状图的长度(数据之间进行比较)还是饼状图的面积大?。ㄊ葜涞恼急裙叵担?。3)与设计师讨论并确定可视化的视觉特点,便于他们提供设计稿,以确认最终的屏幕呈现效果 。此外,如果该项目包含的页面较多,还需要与设计师确认各页面之间以及页面中组件的交互方式 。下图列出了可视化项目中详细的11个步骤,右侧详细列出了每个阶段用户以及交付团队需要提供的文档,便于双方的沟通 。
【什么是数据可视化的作用 什么是数据可视化】
一个优秀的统计图标需要在传达复杂信息的同时保证:清晰、准确以及高效 。
数据可视化展示图像应当:1)展示数据内容;1)Show the data
2)引导读者去思考项目主旨,而非实现方式、设计或是技术等无关细节;2)Make the viewer think about the substance (not the methods/design/technology)
3)避免扭曲数据,展示错误事实3)Avoid distorting the data
4)在较小的空间内展示大量数据4)Present many numbers in a small space
5)保证大数据集之间的相关性5)Make large datasets coherent
6)引导用户比较不同的数据6)Encourage the eye to compare different pieces of data
7)从不同层级来揭示数据结构7)Reveal data structure at different levels
8)服务于相同的明确目标:描述、探索、制表或是装饰8)Serve a clear purpose: description, exploration, tabulation, decoration
最后,将上面的标准抽象出来 , 一份优秀的可视化设计则应该满足以下3项标准:
在一个数据可视化项目实施过程中,保证及时的沟通,避免项目的多次返工是保证实施过程顺利进行的重要条件,了解自己的数据特点与项目目标也是保证最后获得理想效果的必要前提 。
资料来源:1. 人工智能之可视化,AMiner 研究报告版, 2019年 第4期2. Tufte E R , Schmieg G M . The Visual Display of Quantitative Information[J]. American Journal of Physics, 1998, 53.3.RJ Andrews,***wetrust.com/creative-routines/#more-198, 20144.数据之美:迄今 10 佳数据可视化示例, ***/zh-cn/learn/articles/best-beautiful-data-visualization-examples
数据可视化是数据科学的重要分支 。该领域关注于如何用图形符号展现各种类型的数据 。可视化领域可以分为三个分支:1)科学可视化;2)信息可视化;以及 3)可视分析 。科学可视化针对科学仪器收集来的物理数据,例如风洞试验收集到的流体数据,CT扫描时收集到的组织器官信息等 。科学可视化的对象往往是物理世界中真实存在的,是三维的 。信息可视化是对抽象数据的可视化 。抽象数据是从各种应用中抽象出来的,往往拥有多个维度 。例如 , 道路交通网络以及互联网都可以抽象为一个由点与线构成的图 。对于图的可视化可以有点线图,邻接矩阵等可视化形式 。可视分析是把可视化与数据分析相结合 。通过算法分析数据模式,并用可视化进行展现 , 以便于用户理解 。同时,用户通过交互与反馈可以实时指导分析过程 。