5 M: f; p. f! B- T9 K: [3 ]0 n, Q3 h
大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。
% j) ~0 Z; d3 |/ g' _) L! P 可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
; f0 j/ N u% z/ D$ T 工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
! T7 {% ~$ B$ s1 t- C' c
『《大西洋古抄本》是达芬奇的手稿集册中最大的一部,共 12 卷,1119 张,年代分布为 1478 年到 1519 年。每个方块代表一页手稿,上面的颜色代表涉及的主题,包括几何与代数、物理学与自然科学、工具和机器、建筑与应用艺术和人文科学。点开每一个小方块还可以看到每一页上面达芬奇写了什么,涉及了 36 个小话题,包括了马、食谱、绘画、灵魂、童话故事、笑话等很多有意思的小话题。』
& A$ O& F3 z* t

/ @$ S g* p% N( P+ N: g5 j 是这样的么?
2 X( k2 S r7 T5 l5 E+ {' }) Y; Z8 e 这样炫酷的数据可视化,小编真的不会。开个玩笑,其实工作中我们并不需要作出很炫酷的视觉呈现,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。
; ]( A- P* f; Y2 I
你不得不注意的图表制作小技巧
; M8 \ P. A% ]- f7 o
条形图的基线必须从零开始
8 F/ i4 G1 r2 q
Y轴不从零开始,可以使数据看起来具有比实际存在的更大的差距。这使得可视化会误导传输信息。条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。
$ P; p9 Z; p6 @7 [ h 
. h+ D2 w; h. O
使用简单易读的字体
- o8 r V) h0 O( V1 d. a; W
有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。字体选择可以影响文本的易读性,增强或减损预期的含义。因此,最好避免艺术字体并坚持使用更基本的常用字体。
+ p* X/ H) D& b) s* G
4 ^* w% v ?" w) |+ Q) g8 z6 d
% @7 s; j) m. d 打开凤凰新闻,查看更多高清图片
: e9 Q! a Z: Y, |% ^3 l
: F% m! W/ n1 L+ C
( E# _$ B+ h+ l8 N$ j3 J& B 条状图宽度适度
4 ]& l: s+ O' e! c 条形图之间的间隔应该是1/2栏宽度。
2 \) C( J" E4 w( x$ M7 G 
( p5 `/ S6 }% V) c; v
使用2D图形
7 @) U* F$ O# z 虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。
5 ~* s# i4 r1 Q8 O3 |' B2 U 
8 h1 S( v: Q& R: X
使用表格数字字体
* W6 V. j$ ]' j; \! b) J- s& S! i 表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。
! d8 g' p$ H$ j4 k7 [: W& ^* P 
8 a( |; @/ y4 P2 { O) `9 J
统一感
! ^6 P& v' ]; e8 A% G4 A8 r9 u7 F
统一感使我们更容易接收信息:颜色,图像,风格,来源……
& U( j: a* h3 @9 d3 D9 \! Z
连贯的设计将有效融入背景,使用户能够轻松处理信息。最佳可视化帮助观众快速得出数据所呈现的结论
; I/ J5 P' t1 h 
" K, j# S$ O' D 不要过分热衷于饼图
0 N# i% i: _. F3 @
展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
/ J) e$ X4 w' b

' ]6 g* {1 }8 ?- p( m. D& T 折线图中使用连贯的线条
, t- A- x0 x" U' s. I! D 虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。
4 p4 b# ~; ~/ B

( s, z0 Y2 a9 [- I. E6 J 尊重部分所占整体的比例
& x9 D4 v0 g; W% X
在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。
+ c( ^. {1 m- [' l4 Z9 b7 X4 o 
+ s1 t6 z+ M: `! ~; b6 B
面积、尺寸可视化
6 J3 g, \' r" ]' C/ X) `* F
对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。
" P, H6 J' J# ]6 ^; D

6 M" Y! w n: t5 E8 r% D' L
使用大小来可视化值
) a0 F8 I) T! N6 N1 y' {+ [
大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。
- v8 R2 W8 q# a J1 Q8 b. y1 e# L* i 
1 S' \' Z! o& r Q* S
使用相同细节
8 U. A1 g3 ?6 P( }# J1 w 添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。
' I" _% i& {2 `+ \ 使用基础图形
6 l: b1 r1 L. \" ?$ E& g
一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。
# ?7 E% B! ?+ @, y! w* c. x# G# e+ P 
& t2 z. b) N/ e/ R 视图数量
+ d9 f! v& ]9 ~ 将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。
3 D# O6 W4 ^ @, c" @$ m, L- t, C
关于图表配色,你可以参考的5条准则
' D) i$ w% G$ u% p' c+ I0 D- t 颜色深浅
0 ^7 r j% x9 o+ W2 l: Z 通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
+ B1 \: f( {1 `4 _

6 X- T. e/ ~( L7 ^
使用同一色系
2 l4 h/ L$ T: C* i- v% i' G% h 颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
1 E7 h7 ]2 }$ t* {3 N 
& B: g3 ]& b( m W% O/ ` h* h: i+ r
避免使用鲜艳的颜色
7 }' i: r. }9 o" w' x! l# L, K
明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。
( w- X! C( _' A! C8 j, O& H: g
( i$ ?$ v4 x6 c 标签使用不同颜色区分
% u! Q7 E9 I ?3 X0 S 在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。
& F! S+ d/ Y$ W9 i5 @0 K
/ D# W; M. Z$ T* y4 e 颜色数量
3 E# j9 Q& q" Z/ l8 c 不要在一张图上使用6种以上的颜色。
" A$ K6 E% U, f- u) Z/ A
9 O, c+ F0 B4 z1 R! m1 x$ Q7 E" ^ 建议:
6 p7 t8 h$ U }1 Q" r) D
使用具有高对比度的颜色
4 t$ {1 h& q% Q$ @ g: b/ y% c 使用带有图案或纹理的颜色来传达不同类型的信息
; E3 C! `, o3 q# H' z6 K- S8 y 使用文本或图标标记元素
3 H2 c' c& A1 W3 I; [% H S
标准的可视化图表一定有注释
+ E4 f6 S( T. O) p8 G2 D, ` 解释编码
! X2 H3 F1 ] R3 M7 H3 p/ D3 f( i2 s( p+ a 通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。
& E1 B% Y3 {# P
轴标签
& P6 x8 X1 m2 w) E% i0 q
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。
$ F5 i7 C! v* T5 t
标题
" v3 ` O1 u7 w* {% }
如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。
# z3 V' b- R$ o: R S7 G" m
# w0 d, `0 R! `1 h0 M! U# U 重点元素做注释
4 z2 c2 l1 O* ^* d9 x* j
通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。
4 Y; q; | X2 q
) X; O1 T( S6 }
重要视图位置
_1 _; ~9 O3 |- x- r( o) A 将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。
# E4 u) O, j$ ]) Z/ B" t
* ^- F |! k' Q 优秀的可视化图表,遵守的6条原则
; V/ Z! B: {3 z) d# g 数据排序有序
K$ ?/ d' _4 p' l4 S- j" z 数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。
6 E( n" i; b g, {# Y' ]7 O" K8 a. d! ]% Y# D
比较数据
9 a- J; E7 O- M1 i/ M. |! G) d
比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
* R. L! Z" I' d' O' y; B& L
8 z( V5 B5 B2 p 不可扭曲数据
4 L2 G0 K- _, Y: T& {+ |9 Q 确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
+ q4 Q9 _6 p) _. v9 z$ h( J A& w- {
6 G: |4 {( J0 y; |- t
展示数据
0 i7 \- Q6 F; t) t0 V6 Y
让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
7 G1 U! m, f7 i0 B/ u" C7 V. W 删除变量
. m. s( K3 ]+ a/ X2 E% P, I+ ^ 很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。
( C+ ]; v; F, r% L. [/ s 避免数据噪音
# W# ~: R- [ t5 ~7 y! f6 a 把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。
# G# [% l/ [* u0 v C, E
$ V1 m; v" S' w3 U( ^) e 良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。
( Q H) c. b+ v ~. w
正如Edward R. Tufte指出的那样,“设计的基本考验是它有助于理解内容,而不是它的时尚性。”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。
: n% L$ d3 V, W2 @0 N0 f3 }
各平台同名“职坐标在线”
/ `- \. I* Y' H