9.1 撰写出彩的数据分析报告的5个建议
数据分析报告几乎是每个数据分析师的必备技能,撰写一份数据报告看似简单,但是如何出彩却非常难。本节将介绍一些常用技巧来帮助读者撰写出彩报告。
9.1.1 完整的报告结构
完整的报告结构是一份规范报告的基础。它能帮助读者在有限时间内迅速掌握报告要表达的内容,并正确理解报告结论。
标准的数据分析报告的结构通常包括以下几个部分:
封皮和封底。每个公司都有自己的封皮和封底模板,尤其是在大公司中使用公司统一封皮和封底页非常重要。
摘要页。摘要页是对报告中内容的概述,方便领导层通过阅读摘要直接了解报告内容而无需阅读整个报告。事实上,大多数领导由于时间和精力限制都只看摘要信息,如果有感兴趣的内容则查看对应报告主体或直接询问分析师。
目录页。如果报告内容过多,则需要通过目录告诉阅读者包括哪些内容。由于一般的报告内容不会太多,在3~20页之内的报告是比较好的。内容过多会使读者丧失耐心、内容过少又往往无法完整表达内容。对于目录页来讲,需要包含标题和页面两个信息,标题一般出现1级标题即可。
说明页。说明页是关于报告中数据时间、数据粒度、数据维度、数据定义、数据计算方法和相关模型等内容的特殊说明,目的是增强报告的可理解性,尤其是读者关注的采用什么数据、使用什么方法这些关键信息要讲清楚。
正文页。正文页是报告的核心,通常使用总-分-总的思路撰写报告,在撰写报告之前一般需要先使用MindManager等思维导图工具画出撰写思路。作为日常报告,除了数据陈列外,一定要有数据结论;而对于数据分析和挖掘类报告,必须要仅仅围绕主题撰写,不可面面俱到。
附录。如果报告存在外部数据引用、原始数据、数据模型解释等,建议作为附录增放在报告最后,而不要都加入到报告正文内容中,因为大多数人对于数据细节不太关注。
9.1.2 精致的页面版式
要想做出出彩的报告,只使用默认的Excel、Word或PPT模板可不行。精致的页面版式包括以下元素:
(1)配色
配色是一门学问,这关乎到审美,而审美是因人而异的。配色的意义主要体现在以下几个方面:
协调:让版面看起来更赏心悦目。
对比:更加明显的突出关键信息。
划分:区隔不同的内容主体,使内容块更容易被理解。
归属:不同的行业和领域有专门用色,使用特定的颜色更能彰显报告与对象之间的归属关系。
在配色中,尤其需要注意以下几种用法:
主色:主色是整个报告中的主要色调,一般主色的选择跟报告内容和行业归属有关。
相近色:相近色是跟主色“相似”的颜色,但是作用是辅助主色做信息表达,相近色不能“抢”主色的焦点。
互补色:互补色是跟主色“互补”的颜色,它能起到强调、突出以及拉开距离的作用,例如红与绿、橙与蓝、黄与紫就是互为补色的关系。但互补色不宜使用过多。
无色色系:所谓无色色系指的是没有特定颜色的颜色,这类颜色在色环中是没有的。无色色系包括黑、白、灰三类,这类颜色通常起到辅助设计、颜色修饰或者页面背景色的作用。
(2)留白
留白是中国艺术作品创作中常用的一种手法,极具中国美学特征。留白一词原指书画艺术创作中为使整个作品画面、章法更为协调精美而有意留下相应的空白,留有想象的空间。在数据分析报告中,留白的意义是使得报告更加美观、特定内容更容易获得焦点。
留白应用到数据分析报告中时,一般在页面的四周以及不同内容块之间产生,使用留白时需要注意以下几点:
不要大面积的留白,那样会更感觉报告缺乏内容。
留白是相当的,例如行间、段落间自然就有间隙留白,真正的留白要与这些自然间隙相区别。
留白不能在所有内容上都使用,要能突出重点信息。
(3)对称
对称是设计的基本法则,该法则体现在所有页面元素的设计当中。基本的对称报告垂直和水平两种,对称的使用有以下重要信息点:
如果元素过多,那么相同对称格式一般用于具有相同属性特征的对象上,这样能起到区分的作用。
水平对称是大家最常关注的部分,但不要忽视垂直对称。
对称设计不要靠“眼力”,使用工具中的对称样式设计,因为人眼对于距离的把握是不准确的,例如依靠人眼无法对1像素的差异做准确调整。
对称可以隔元素体现的,例如四角对称、斜角对称等,这些对称对象之间往往有其他元素。
(4)字体
一般情况下报告默认字体是宋体,但在报告设计过程中要善于利用多种字体表达不同的信息。但汉字(也包含其他语言)都有非常多的字体可供使用,不同的字体具有以下特点,如表9-1所示。
表9-1 常用字体适用场景
除了选择合适的字体外,还有很多内容需要读者注意:
一份报告内尽量不要使用超过3种以上的字体。
字体的大小要根据报告的应用场景而定,一般情况下以投影PPT为主的字号要在18以上,普通阅读的正文建议在14~16左右。
行间距的设计跟排版有关,一般情况下笔者会使用1.3~1.5倍行间距。
不要使用过于花哨的字体,虽然看起来很有意思,但是会增加阅读成本。
截图与正文的字体一般都是内容的一部分,不要忽视截图中的字体。
如果有英文,不要全部使用大写。
不同字号的文字做对比更能有突出和对比作用,尤其是字号差异明显时。
文字的信息是否醒目也受背景色影响,注意文字颜色和背景色要使用互补色。
9.1.3 漂亮的可视化图形
可视化图形是每份报告的必备元素,就笔者的倾向而言,更喜欢简单、平面的图形。
在可视化图像应用中,首先是多种可视化的图形方式,除了传统饼图、线图、柱形图、雷达图、散点图、地图外,还有很多可以表示复杂关系的图形,例如:
树形图:本书多次用到,用来表示分割关系或递进关系的不同主体,如图9-1中的①。
桑基图:用来表示不同对象在不同流程或环节之间的相互变化和演变趋势,如图9-1中的②。
关系图:尤其是对多个元素具有相互关系的表示,例如关联关系,如图9-1中的③。
象形图:根据不同的数据表达需求,使用图形的方式将其数量表示出来,以达到贴近业务形态的目的和直观效果,如图9-1中的④。
动态图:此类图形一般以实时数据展示为主,动态展示数据变化;某些数据虽然不是实时计算,但是展示过程中会以动态的形式突出数据的发展过程。如图9-1中的⑤。
子弹图:通过多个条形图或柱形图的叠加以及颜色对比,突出颜色块的差异性,主要用于完成率、进度相关的表示场景,如图9-1中的⑥。
热力图:通过在特定图像上叠加不同颜色的半透明区块,实现基于位置的信息标注和可视化的颜色差异对比,常用于页面点击分布、地理位置集中度等,如图9-1中的⑦。
字符云:通过字符的大小、颜色、位置、偏移等方式,突出不同字符的数量和对比,主要用于关键字或短文字相关的信息展示,如图9-1中的⑧。
日历图:通过将特定数据与日历相结合,可基于时间做数据对比和分部差异分析,如图9-1中的⑨。
这里不建议读者使用一些看起来很漂亮,但需要询问看法等理解困难的图形,例如:
玫瑰图:极坐标图围绕极坐标中心点展开,但是信息的展示成圆形,坐标却是垂直或水平形式,会增加读者的阅读成本。如图9-2中的①。
图9-1 建议的可视化图形
极坐标图:极坐标图具有特定的应用范围,不适合大多数场景下跟圆周没有关系的信息展示。如图9-2中的②。
有了可视化图形后,很多读者会使用“特效”来增加强调图形,例如增加阴影、立体、透视、边框等。对于此类应用,笔者的建议是根据场合而定:
如果公司内的工作文化就是需要这些图形形式(例如某些传统行业和单位),那么应该“入乡随俗”。
图9-2 不建议的可视化图形
如果工作环境中没有此类特殊要求,一般情况下不建议使用。图形样式会增加图形信息的表达量,过多使用会增加报告阅读者对图形的关注度。但图形的作用一般是辅助于信息表达,过多吸引注意力是不恰当的。
9.1.4 突出报告的关键信息
很多人在做报告时,恨不能把所有与报告有关的内容都放到报告里,试图“事无巨细”而不让任何一个信息点被遗忘,但实际上这种做法并不恰当。每份报告都有自己的主题,主题就是这份报告有解决的问题,一份报告通常只解决一个问题就好,不要试图解决所有问题。
常见的报告关键信息不明确的表现是:
通篇报告只有陈述,没有总结。
报告内容过多,让报告对象无法知晓到底哪些内容更重要。
报告总结的内容过多,每个都有“划重点”,让报告对象找不到重点。
关键信息过多与报告没有关键信息是一样的,都会让报告对象找不到重点。
(1)哪些是报告中的关键信息?
是否关键取决于具体场景,以下信息在大多数情况下都是关键信息:
成本支出最多的元素,例如部门、广告渠道、促销活动等。
收入(尤其是利润)贡献信息,所有对此构成贡献的信息都内关键信息范围之内。
异常波动信息,在报告中呈现异常的状态、趋势、成分变化的信息。
跟总体趋势相反的信息,这是潜藏在总体数据规律之下不容易被发现的信息,但往往可能会成为未来发展的起点。
新业务或尝试性业务信息,很多公司都有探索性业务,对于这些业务的信息反馈一般要重点表达,因为新业务往往是公司探索和试错的过程,是大方向性的战略活动。
(2)通过哪些方式突出报告关键信息?
在本节之前我们提到了很多关于页面板式和可视化图形可用于突出报告关键信息:
使用不一样的字体对比突出关键信息。
使用强烈的字号对比(通常是更大号字)突出关键信息。
使用与正文不同的颜色(包括背景色、字体颜色等)突出关键信息。
关键信息周围留白。
使用特殊的图形表示关键信息的结论。
关键信息的排版“故意”跟整体排版格格不入,往往能强化这种认知。
一般而言,每页报告内容都有自己的关键信息结论,这称之为小结论,每份报告综合各个小结论形成大结论。
9.1.5 用报告对象习惯的方式撰写报告
在撰写报告时,应该从报告对象的角度出发,而非分析师(撰写报告的人)的角度出发来撰写报告。
(1)报告对象是谁?
报告对象是要看数据分析报告的人或人群。确定报告对象是策划分析报告的基础,不同的对象有不同的数据工作方式:
老板或较高级别的领导侧重于结论,而忽视推导过程。因此言简意赅地说明问题非常重要,不要期望这些领导们能完整地听完报告,很多时候他们会不断发散思维提出很多问题甚至直接终止报告汇报。
经理等中层管理级别的对象,往往具有丰富的业务工作经验,同时对于数据有一定的理解,因此对于报告的期望侧重于思维清晰、报告完整、可落地应用。
基层报告对象由于刚进入公司不久或工作经验较少,对于报告内容的需求侧重于可理解、可解释和可应用,而对于其中复杂的推导、完整的结构等方面不太在意。
(2)哪些是报告对象习惯的方式?
报告对象习惯的方式和内容包括:
报告对象关注哪些内容?——这往往影响报告的书写侧重点。
报告对象的数据意识如何?——这决定了组织语言时如何表达特定数据关系、结论及来龙去脉,尤其是对于数据规律的解答。
报告对象有哪些看或读报告的习惯?——这方面的影响包括文字、图形的使用技巧,特殊语言的规范,报告结构,组织顺序等。
报告对象最多能一次性接受多少信息?——这决定了报告的内容长度及深度。
报告对象对于数据的信任度如何?——虽然数据工作是相对公正的,但很可能报告对象本身对数据的认知态度不同,这会导致报告汇报期间产生各种问题。例如,如何说明数据取样、如何解释算法逻辑、如何解释数据的正确性、如何将数据结论落地等。
(3)有哪些通用技巧能使数据分析报告更好的匹配报告对象的工作方式?
由于报告对象的差异新很大,在此提出一些通用技巧供读者参考:
说行话。行话是一个行业和领域内沟通的“共同语言”,行话要求分析师对于行业的认知较深,需要时间和经历积累。
使用习惯用语。资历越深的报告对象对特定事务的认知越“固化”,要尽量使用他们已经固化认知的语言来表达。例如对于页面浏览量有的人称之为PV、页面曝光量等。
尽量少使用专有名词。在数据工作中,有很多专有名词,尤其涉及算法时更多。对报告对象而言,大多数人都不太了解算法及其他数据行业专属名词,很多时候也无暇仔细听取解释。
举例子打比方。对于数据工作方法和工作结论的说明,使用举例子和打比方的方式非常有效,尤其是以企业内的事物举例更加恰当。因为大家对于企业的认知有共同基础。
往报告对象的以往工作经历上靠。假如分析师了解一些报告对象的过往工作经历,那么可以基于其过往经历做陈述和表达,这往往更能产生共鸣效应。很多报告对象可能有90%的内容听不懂,但就是那10%跟自己的过往经历相关,所以更容易理解。
使用浅显易懂的数据工作方法和模型。有关数据方法和模型的问题本书已经多次介绍过,尽量使用大家都容易理解的方法来工作,涉及算法解释时,决策树、线性回归、相关分析、聚类等要比神经网络、主成分分析、SVM等更容易被理解。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论