鉴于企业收集数据的速度和体量在不断增加,管理者需要通过一些方法来理解大型数据集,使之为决策提供信息,同时协助交流结果。数据可视化是一种非常有效的工具,可用于推动和影响决策。数据可视化之所以具备这样的能力,是因为其能够识别那些未被发现的信息——不仅可以帮助我们理解大型数据集,还可以帮助我们揭示那些尚未被发现的模式或趋势。
管理会计使用的数据可视化分为两种类型:
1.探索性可视化有助于深入了解企业绩效。
2.解释性可视化有助于管理者传递其分析结果,进而影响企业变革和改进。
如果想要或需要探索数据、挖掘深层次信息,可以使用探索性数据可视化。这类型的可视化能帮助我们更好地理解底层数据。解释性可视化则用于传递分析结果。精心设计的解释性可视化能够清晰、简洁地展示分析结果,进而激发后续行动。本文改编自IMA《管理会计公告》之《数据可视化》(bit.ly/3rrrC5s),我们将在文中详细介绍制作解释性数据可视化的过程与内容(见图1)。
准备阶段
解释性数据可视化的准备阶段包含三个步骤。在这一阶段,你需要确保拥有正确的数据且其符合分析标准,此外,还需考虑分析的目的以及分析的受众。
第一步:验证数据。这项工作的重要性怎么强调都不为过。我们常说的“垃圾进,垃圾出”这句话适用于所有数据分析,自然也包括数据可视化。如果用于可视化的数据不正确或不完整,那么,可视化就不可能是正确的,甚至还会产生误导。数据应该符合以下标准:
1.准确性:数据是否准确无误?
2.完整性:是否收集了所有相关数据?
3.一致性:数据格式是否一致?
4.时新性:数据是否为最新可用数据?
5.及时性:所需要的数据是否可以访问和使用?
数据的准确性是指数据不存在任何错误,可靠,并且代表了那些你将在可视化中呈现的现象;数据的完整性是指你拥有需要的所有数据,没有遗漏任何数据;数据的一致性是指没有数据格式不统一的情况,如不同时期的日期格式一致、数值以相同的币种列示;数据的时新性是指在可视化中使用的数据是最新的;数据的及时性是指需要时,你可以访问和使用可视化所需的数据。
第二步:明确目的。在制作解释性数据可视化之前,要确保明确界定了分析目的。在分析的探索阶段,你可能已经确定了总体目标,并且在探索过程中还准备了许多可视化内容。你可能很希望用上在这一阶段制作的每一个可视化成果,但要避免落入这一陷阱。要知道,探索的目标是挖掘深层次信息,可视化的目标是与受众分享这些信息,而不是谈论可视化的整个实现过程。
Stephen Few在其著作“Show Me the Numbers”(Analytics Press于2004年出版)中指出,定量业务信息使用图表有四个目的:
1.分析
2.交流
3.监测
4.规划
先思考一下你的目的是什么,而后只选择那些与目的一致的可视化内容。此外,还应该考虑数据可视化的受众,例如,你的目标是和受众分享信息还是说服受众?
第三步:考虑目标受众。在可视化准备阶段,要始终记得将要观看可视化的受众:谁将使用这些信息?在这个主题上,他们具备多少背景知识?他们会成为决策者吗?
回答上述这些问题有助于你专注于可视化内容,从而使之取得最好的成效。例如,如果你准备了一份分析报告,打算在企业内部与熟悉相关背景信息的同事分享,就无需过多介绍这些背景;但如果分析报告的受众并不熟悉分析主题,那么,你可能需要更详细地介绍背景信息,帮助他们理解分析内容。简言之,如果要提供一份让受众理解的分析报告,你需要确保选择了有效的可视化方式。
制作阶段
如果你对数据有信心、已经明确界定了分析目的且了解目标受众,就可以着手制作传递分析结果的可视化视图了。在这一阶段,你需要选择有效的视觉展示方式、遵循最佳实践,并通过讲故事的方式来有效传达分析结果。
第四步:选择有效的可视化方式。这说起来容易做起来难。大多数人从未接受过数据可视化方面的培训,对于哪种类型的可视化方式最有效知之甚少。将这一步拆分为以下五个小步骤会对你有所帮助:
■考虑分析的目的。
■确定能达到这一目的的可视化方式。
■了解制作你想达到的视觉效果所需的数据。
■将目的和数据与适当的可视化方式搭配。
■确保遵循与所选可视化方式相关的最佳实践。
明确分析目的至关重要,这样你才能选出有效的可视化方式。数据分析可能有多个目的,图2是一棵决策树,可以帮助你根据具体的分析目的(如展示构成情况、关系或分布情况)来选定适合的可视化方式,图3则提供了适合展示趋势或进行比较的可视化方式的选择指南。
明确分析目的后,就可以不断缩小选择范围,直至找到合适的可视化方式。此时,你需要确保自己已经了解了可视化所需的数据类型。最理想的可视化方式是与分析目的相匹配,并适用于需要进行可视化的数据的方式。最后,还应针对所选的可视化方式,遵循相关最佳实践。表1阐述了每种可视化方式,包括如何使用、所需数据类型与最佳实践。
但选择可视化方式后,也还有很多工作要做。数据可视化领域的先驱Edward Tufte认为,“统计图表的优秀之处在于能以清晰、精确和高效的方式传达复杂想法”。(见“The Visual Display of Quantitative Information”一书第二版,Graphics Press出版社于2001年出版)他进一步指出,精心设计的数据可视化应该能“在最短时间内,使用最小的空间和最少的笔墨,给受众提供尽可能多的信息”。
第五步:遵循最佳实践。本文针对每一种可视化方式给出了相关最佳实践,同时,也提示了还需考虑的其他重要实践。
第一点是要避免罗列非必要信息。杂乱是数据可视化的敌人。Tufte给出的另一条建议是最大化“数据墨水比”,也就是说你应该删除任何与数据无关的墨水以及任何冗余墨水(如不必要的背景或装饰元素,编者注)。基本上涉及可视化中的墨水时,原则是“少即是多”。
第二点是帮助受众将注意力集中到最重要的可视化内容上。在制作解释性数据可视化内容时,一定要牢记“前意识属性”(Pre-attentive)。这是指那些我们注意到了但本身却没有察觉到自己在留意的视觉属性,如大小、颜色及位置等,我们可以利用这类属性将受众的注意力引导到我们希望他们关注的内容上。研究表明,受众只需3~8秒就能决定是否继续观看某个图表,还是将注意力转向其他方面(见Cole Nussbaumer Knaflic所写的“Storytelling with Data”一书,约翰·威利父子出版公司于2015年出版)。
图表的大小表明了重要性的高低,无论是单个图表还是仪表板都是如此,这也是在制作可视化视图时要记住的一点。如果仪表板的某个部分比其他部分大,使用者将关注较大的部分。例如,假设一个仪表板展示日销量、按型号的销量以及各品牌平均净收入的比较,如果日销量的图表在仪表板中最大,使用者首先就会被这部分图表吸引。相较于仪表板中其他两个图表的大小,日销量图表看起来似乎是最重要的。(注意,不仅图表的大小能表示重要性的高低,图表中文字的大小也是重要性的一个标志)
使用颜色时应谨慎,且前后要一致。一个很好的规则是:如果添加颜色不能提高受众对图像的理解,那可能就不需要添加颜色。还要记住的是,颜色能唤起情感,所以需要考虑颜色的色调所传递的情感,如红色会引发紧迫感。一般而言,要避免在图表中同时使用太多种颜色,因为这会让受众更难辨别你想要传递的信息。此外,在制作可视化视图时要留意有色盲症的受众,他们可能难以辨别某些颜色,因此,需要避免使用一些颜色组合,如红色和绿色、蓝色和紫色、绿色和蓝色。
可视化视图和仪表板上内容放置的位置也很重要。大多数受众的观看习惯是从画面左上角开始,然后眼睛以“之字形”路线移动,扫描画面内容。要确保将最重要的信息放在视图左上角。
遵循这些最佳实践将帮助你制作可达到预期效果的数据可视化。但数据可视化真正的力量不止于此——当我们运用精心制作的数据可视化讲述故事时,受众不仅记住了这个故事,还会采取行动,此时,数据可视化的力量才真正发挥出来。
第六步:讲述故事。解释性数据可视化的最后一步是讲述故事,而用数据讲述故事是财务人员的一项基本技能。(见Fatema El-Wakeel、Loreal Jiles和Raef Lawson所写的《数据可视化能讲的故事》,刊发于《战略财务》中文刊2021年第1期,英文刊链接bit.ly/3kR1Tyt)
认知心理学家Jerome Bruner发现,当以故事形式来讲述事实时,人们记住这些事实的可能性会提高22倍(见Vanessa Boris所写的“What Makes Storytelling So Effective for Learning?”一文,哈佛商业出版社网站,s.hbr.org/3h2oMhs)。其原因在于故事往往令人难忘,有助于我们更快地理解某个想法。
当我们听到或读到某个故事时,我们大脑会在多个层面激活。大脑的情感部分释放出化学物质,激发联系、奖励和认可等感受(见Pamela Rutledge所写的“The Psychological Power of Storytelling”一文,Psychology Today网站,bit.ly/2WMAtlw)。而在Kate Harrison看来,将数据有效融入引人入胜的故事之中,有助于激发受众采取行动(见“A Good Presentation Is about Data and Story”一文,福布斯网站,bit.ly/3zKJBVJ)。
用数据讲故事有三个要素:数据、叙述和视觉材料(图表等)。在“Effective Data Storytelling”(约翰·威利父子出版公司于2020年出版)一书中,Brent Dykes阐述了这些要素是如何做出解释、启发和吸引受众的。这三个要素的结合能推动变革,图4展示了它们之间的联系。
数据和叙述相互穿插使用,能讲述数据背后的故事,为受众理解分析结果提供相关背景和注释。而数据和视觉材料的穿插能启发受众理解相关观点,如果没有采用可视化,他们可能无法做到这一点。
同时,叙述与视觉材料的结合能让受众参与到故事中来。在我们一生中,大部分学习都基于叙述与视觉材料的结合使用。一个好的故事可以吸引读者的注意力,提高其采取行动的几率。
好的数据故事需要包括上述三个元素,并以之有效构建整个故事。你希望自己创作出令人难忘的数据故事,并最终引导受众付诸行动,就可以遵循最佳实践,其第一步是针对拟创作和使用的内容,列出视觉呈现方面的大纲。
在纸上或白板上列出大纲,而不是从制作幻灯片开始,这可以让你避免陷入在没有方向的情况下制作一张又一张的幻灯片或拼凑视觉材料。你也许认为自己制作的每一个视觉内容和采取的每一个步骤都非常重要,但是,数据故事只应该包含关键的分析和视觉材料。
在讲述故事时,一个常常采用的结构是“弗赖塔格(Freytag)金字塔”结构,有时也称为“叙事弧”,是德国剧作家兼小说家Gustav Freytag在1863年提出来的。
这个基本结构从介绍部分开始,介绍人物并为故事设置场景。接下来是上升部分,通过一系列事件不断推动情节发展,直至故事的高潮或最重要的节点,也就是金字塔顶端。高潮过后,你会看到主要冲突发生后的其他事件一一展开。最后在结局部分,所有冲突都得到了解决。
我们如何将这一结构应用于数据故事?以虚构的汽车制造公司Huskie Motor Corporation(HMC)为例(见表2),假设你需要对Tatra品牌下各车型的绩效进行分析。Tatra是HMC旗下平均净收入最低的品牌,你要查明原因并提出改进建议。
运用弗赖塔格金字塔这类结构,可以让数据故事的结构更清晰。构建结构之后,再运用故事三元素(数据、叙述和视觉资料),让故事生动起来。
不要误导受众
在制作数据可视化的过程中,很重要的一点是确保其不产生误导。无意的误导性数据可视化通常是因为没有遵循相关最佳实践,或者没有为可视化内容提供相关背景信息;而有意为之的数据误导性可视化通常用来推销某种观点,而不是公正全面地展示实际情况。知道如何解读可视化内容以及发现潜在的误导性数据可视化,将会成为越来越重要的技能。
以下这些行为可能误导受众:
■省略图表中的基线:图表的y轴如果不是从0开始,可能导致图表显示的结果看起来比实际结果更为突出。例如,在一个条形图中,y轴从1,000开始的,那么表示1,400的长条看起来是表示1,200的长条的两倍。相反,如果y轴从0开始,那么这两个长条的大小差异会更合适。
■操纵y轴:y轴还可以通过其他方式进行操纵,从而让数据变化看起来更明显或更不明显。y轴的刻度应该与数据保持一定的比例,而如果使用更大的刻度,可以让图表结果显得平滑,降低其波动幅度。
■有选择地使用数据:不要只选取那些契合你所讲故事的数据点。例如,当认为月度或季度数据可以更清楚地展示数据的波动情况时,不按照年份展示数据。
■使用错误的图表类型:如前所述,要比较的话最好采用条形图或柱状图展示。如果采用错误的图表类型显示比较情况,受众将难以比较数据。
■违反常规:在制作数据可视化时,需要始终注意标准和惯例。例如在财会行业中,红色与损失相关。你不会希望在可视化中使用红色标示收益,因为受众会认为红色意味着损失。
必备技能
无论是探索数据以获取深层次信息,还是向其他人传递这些信息,数据可视化都是一个强大的工具。可用于分析的数据量还将持续增长,运用这些数据的能力也将成为企业或个人走向成功不可或缺的条件。
数据分析流程的最后一步是传递数据分析的结果及其含义。只有在受众理解了你的数据故事后,分析才能发挥效用。遵循制作数据可视化的最佳实践,然后使用这些可视化讲述数据故事,会帮助企业推动变革,为利益相关者创造价值。现在就投入时间和精力来提高你的的数据可视化技能吧,这将推动你的职业更长远地发展。
Ann C. Dzuranin,博士、CPA,北伊利诺伊大学毕马威名誉会计教授。联系方式:(815)753-6212或adzuranin@niu.edu。
张翔 译,郭强 校