【看得懂比看起来漂亮重要】Amazon 畅销工具书教你真正的“资料可视化”,做一堆美图只是浪费时间

【看得懂比看起来漂亮重要】Amazon 畅销工具书教你真正的“资料可视化”,做一堆美图只是浪费时间

【为什么我们要挑选这篇文章】每日工作中,我们时常遇到需要将资料/数据整理,并提报给老板、客户,但是这么庞大的资料量,该用什么图表呈现、才能让对方快速理解、提升沟通效率?让我们来看看以 PM 为职业的  Leah 分享她的心得。(责任编辑:吕珈宁)

距离读完《Storytelling with Data: A Data Visualization Guide for Business》已经有好一段时间,工作上在构想后台图表或准备产品绩效报表时,也不时会打开它翻找参考,趁著最近内部会议分享,又仔细重看消化过一次,就当作是自己的读书笔记吧!

为什么要做资料可视化?看 Amazon 高分工具书怎么说

这本在 Amazon 评分高达 4.6/5 的工具书,作者 Cole 由浅入深解释“为什么我们需要做资料视觉化?”,她并没有开宗明义就把读者带到一个充满五花八门图表的世界,反而在书的前半段反复强调沟通的目的,之后才用很真实的情境— — 例如你必须在公司会议汇报某一季的销售数据— 说明什么类型的资料,适合用什么图表,也会透过对比(没有做资料视觉化 vs 有做资料视觉化)的形式,让读者很快可以看出差异性。

后来自己上网查了一下,发现 Cole 自己经营的网站,持续透过工作坊的方式推广资料视觉化,合作对象不乏知名网络产业,Google、Facebook、LinkedIn、Adobe…等,对她就更加钦佩了!

书的内容很丰富(非常推荐 PM 或是设计师伙伴人手一本!),很难用一篇文章浓缩,以下我会用自己消化过的语言简述心得,也会带到一些 Cole 在书里提到的范例。

做资料视觉化之前,请先问自己这三个问题:Who, what, and how

老实说,当初我买这本书的初衷,的确是想透过实例对照,能 更快把资料视觉化这个新技能应用在工作上 ;不过作者第一章就直接打枪这种想走捷径的想法,她要读者再三想清楚这 3 个问题:

  • Who:锁定你想沟通的对象。

你的目标观众是谁? 别想着你要同时跟股东或是单纯对产品有兴趣的人说话,不知道怎么做的话,可以先从“和决策者对话”限缩你的对象。
你希望观众怎么看你? 你和观众是第一次接触吗?你是这个领域的专家吗?他们对你有足够的信任感吗?在陈述之前,想清楚你跟观众之间的关系。

  • What:你想要观众知道什么,或做什么?

别做没有目的的沟通。 如果你是整理资料的人,那么你比任何人都更熟悉资料的来源跟它代表的含意。透过资料说明事情是为了“下一步”—  你可以在提出资料佐证时主动给出建议,这也帮助听众开始思考,否则听众也许看过这些漂亮的图表后只单纯发出一句:“哇,真厉害!”,那就失去你蒐集数据的意义了。

在思考跟观众的沟通目的时,可以参考以下这张图,帮助你决定报告的流程以及逻辑。

图片来源:https://gist.github.com/AdamMescher/4934fee9e8f7dda605f551f60a03d4bd

左上的 Live Presentation 场合,报告者(你)拥有最大的控制权,你能够决定整场报告的节奏,相对而言你需要跟观众讲述的内容所需细节较少;反之,右方区块的 Written Doc & Email,同样是报告者的你拥有较少的控制权,你无法预测观众会如何消化你提供的资讯,这种沟通情境,你就必须提供尽可能多的细节,帮助读者了解— — 甚者,你得在报告中解答他们预期会有的问题。

  • How:这就是我们需要资料视觉化的原因。

它帮助你清楚传达立场给你的观众 当你想在有限的时间(3 分钟)内,向听众解释一件事(Big Idea),特别是你想透过大量资料说明,如何明确、精准地沟通,显得格外重要。

除了确保自己能回答以上 3 个问题之外,你也可以试着问问自己这些问题:

  • 观众有需要必备什么背景知识吗?
  • 有其它资料可以让你的立场更有立足点吗?
  • 有什么因素可能会让你的论点陷入风险?
  • ……….. 等等。

套用在我身上的话,我自己在每场简报前,会在心中反复从头到尾练习过整个顺序(如果同事有空,也会麻烦他们帮忙听一次看看,哈),看是不是有哪里逻辑不对、是不是有把我想讲的核心重点传达出去?如果是篇幅比较短的报告,在制作的过程中就会同时练习默念,等到做完其实也回答完 Cole 的三大问题跟一些模拟问答了。

六大常用图表,在什么状况用它们比较好?

进入本书的重点之一:决定你使用资料视觉化的情境。Cole 在这本书提到的图表都是常见的类型,如柱状图,并不是设计成分较高的 Infographic(如下图)。

图片来源: https://graphicriver.net/graphics-with-annual+report-in-infographics

以下我会分别介绍书中有提到的、在实务上也经常会使用到的 6 种图表类型。(备注:书里面有提到更多,考量到文章篇幅就不一一提出说明了。另外我为了做图上方便,以下图表并非百分百是书中提到的数据。)

1. Simple Text 纯文字

乍看之下好像跟书的主题“图表”有点冲突,不过当你的资料只有 1 个或 2 个数据,且需要一段不短的文字辅助说明,图表并不是必须— 没必要为了作图而作图 !

  • 假设使用情境:你想说明一个事实“截至 2020 年,有 20% 的已婚女性在家全职照顾小孩,1970 年则有 41%。”,并想特别强调 2020 年下降至 20%。
  • 一般状况直觉会使用柱状图,如以下:

用柱状图呈现这样的数据没有不好,只是比较难让听众能一眼注意到你想强调的重点:“已婚女性全职比例 2020 年下降至 20%”,也因此,Cole 建议此种数据若改用纯文字的方式呈现,反而更能凸显重点。

2. Heatmap 热图

最近疫情的关系,Heatmap 也经常在感染严重程度的地图上呈现;不过 Cole 书中提到的 Heatmap 是偏向表格数据的进化体。当你的资料有多个单位、多个种类(常见的有销售状况、成本分摊等等),必须透过表格来呈现,适当加入视觉化可以更快抓到观众注意力。​

  • 假设使用情境:你要跟大家展示目前公司多种商品在多城市的销售状况。
  • 原始数据直接以表格呈现,如下,观众得左右交互查看,还不一定能马上知道到底哪个商品在哪个城市销售状况最好。

  • Heatmap 透过颜色深浅,让阅读的人能较快一眼辨认程度高低:

3. Slopegraph 斜率图

当你想表达横跨两个时间区间的资料,并想迅速看出高低起伏的比较,此时斜率图是很好的选择。这边的两个时间区间不一定是单一时间→单一时间,也可以运用在一段时间的头→尾(例如你捞的资料时间区段是 2017–2020,而你想讲的是起始/结束的差别),端看你想怎么呈现你从数据中的发现。

  • 假设使用情境:你想跟大家说明员工对公司的满意度问卷调查结果(2019 vs 2020),员工针对问卷里的某个问题类型回应增加/减少最多。

采用斜率图之前,需要注意的是,若你的数据项目间差距都相当大,意指各条目的幅度起起伏伏,那么就不太适合用斜率图,因为会有太多线条彼此夹杂,会让画面不太简洁,反而让读者更容易迷失在图形里。

4. Bar Chart 柱状图

这可说是最常见的一种图表类型,许多人在思考使用报表时经常避免使用柱状图,因为好像显得太普遍(包括我自己之前也会这样想)。Cole 提及,正因为柱状图最常见,对于一般大众几乎是零学习成本,反而在大众媒体上很适合使用。

不过,也正因为柱状图非常直觉、容易理解,也可能会借此特性做一些误导性的资讯传播。例如美国大众电视台曾经在新闻播放中使用柱状图,解释布什解税案到期后,对于税率的影响:

图片来源: https://flowingdata.com/2012/08/06/fox-news-continues-charting-excellence/

乍看之下好像没什么问题—  有现在的税率(35%),也有法案到期后的税率(39.6%)。但是这张图表给你的感觉是什么?“哇!如果法案不延期的话,我好像变得要缴超多的税!”

实际上真是如此吗?

大众在绘制柱状图时,犯了一个错误:起始点(Baseline)并非从 0 计算。正确使用柱状图来看税率变化应该是这样的:

这样一看,税案到期与否,对于税率的差距是不是就没有一开始看到那么大了呢?

5. Stacked Horizontal Bar Chart 水平百分比堆叠图

堆叠图是柱状图的延伸图种,因同时要做主/子分类的比较呈现,使用限制较多,如果子分类的基准点各自差距太多,堆叠起来反倒让人更雾里看花;也因此这种图表相当适合用在问卷调查结果的呈现(反对/同意),因为这两者的基准点是一致的,并没有谁的基准点较高或较低的问题。

  • 假设使用情境:你想展示问卷结果中最多人强烈同意/最多人强烈不同意的项目,就能以百分比堆叠图的方式呈现:

实务上我自己在 Instagram 上追踪的 The Economist,也看到他们使用这种图表类型展示市调:

6. Pie Chart 圆饼图

这是我自己觉得很有趣的章节!首先 Cole 很直白表达她对圆饼图的抗拒:They are evil. 再来她透过圆饼图带到图表的制作铁则— 千万不要使用 3D,你只会让读者更困惑。

我们看个书中提到的例子:

哇,这张图融合了圆饼图+3D,套用 Cole 的观念,这张图表简直是一场灾难,不如不要画图!

为什么呢?Cole 解释道,使用 3D 会让视觉跟数字无法匹配,以上图为例,31% 的面积占比反而看起来比 34% 更多,已经让观众产生矛盾,再来是圆饼图本身在视觉上就不是能够直觉消化资讯的图形,你得比较面积、数字,才能有大小的概念。假设我们同样要表示供应商的销售占比,Cole 提到使用长条图一样可以达到这样的效果,甚至把资料都排序好了,读起来更直觉:

既然有其他更简单易懂的图表能够替代圆饼图,为什么要使用圆饼图呢?Cole 再三提到这个概念,不是不能用,只是在每次使用圆饼图之前,想想是否有其他更好、更简单的选择呢?如果答案是肯定的,那么圆饼图绝对不会是推荐第一使用的图表。

最后,把自己当作设计师一样思考

资料视觉化会需要一些基本的设计概念,不是说你得要拥有设计师的专业,而是你得思考“这样的图表,别人看得懂吗?容易懂吗?”要怎么做,书中有给出几个提示:

  • Highlight 重要的资讯:使用粗体、字号、颜色对比… 等,让重点资讯能够被一眼办认出来。
  • 资讯有重要顺序之分:不是每个数据都一样重要。你的每张图表都有一个想传达的核心重点,即便中间蒐集的资讯也有其参考价值,但是你得移掉会让观众分心的部分。

以一个例子说明:你手中拥有 2017 年到 2020 年各个学历层的新婚率,而你观察到新婚率几乎是逐年下降,其中硕士学历下降得最多。你当然可以用柱状图呈现所有的资料,如下图。

但是这对读者在第一眼印象要看的东西太多了,要关注学历的类型、各个学历下降的数字比例……好了,读者可以看出新婚率逐年下降了,但是你想说的“硕士学历下降最多”的重点呢?读者要多久才能看出来,或者他们得等你口头说明才能知道呢?

假设改用 Slopegraph,同样的资讯会呈现如下:

 

再透过颜色、字型加粗等重点提示,观众能更快一眼看到你想表达的论点。

结语

上面的书摘内容我提了不到一半吧,只挑了我觉得比较好入门的地方写读后心得。关于怎么 Eliminate distractions 以及 Case Study,书中花蛮多篇幅对比、引导思考,我自己第一次看是从头看到尾,针对有趣或是觉得日后可能会用到的地方用书签记号,后面几次再看就是翻阅有需要的章节,当工具书使用了。(而且真的很实用!)

最后用一句 Cole 的话做为文章总结:

“We aren’t naturally good at storytelling with data.”

没有人天生就超会做图表,资料视觉化是需要长期练习的。也因为自己工作性质是产品经理,会需要定期做内部的产品绩效报告,藉这种机会训练自己在每次准备时,都有做到 Cole 的 Who, what, and how,报告内使用的图表也会一再调整让它更好被读懂。

(本文经 Leah 授权转载,并同意 TechOrange 编写导读与修订标题,原文标题为 〈Storytelling with Data— — 为什么我们需要资料视觉化?〉。)

你可能有兴趣

转行数据分析该注意什么?腾讯工程师狂推的报表神器:FineReport
【数据科学 ≠ 数据分析】都是以数据解决问题,程式语言使用却大大不同
隔离在家可以做什么?数据科学家推出“14 天数据分析挑战”,让你每天练 coding


想在手机阅读更多Google资讯?下载【香港硅谷】Android应用
分享到Facebook
技术平台: Nasthon Systems