我们的数据分析中有一句话叫“一图胜千言”。图表是数据展示的重要形式。选择合适的图表可以帮助我们更快更直观地传达数据信息。
但是图表的种类很多,应用场景也不一样,所以很多新手在可视化数据的时候,往往不知道什么样的图表才是最合适的展示自己数据的方式。今天给大家分享一下正确的选图流程和方法,帮助大家选对图。
图表难点
什么是好的图表?
在说方法之前,我们先了解一下什么是好的图表。
一个好的图表应该满足“四好”:易懂、好看、易做、易用。
好懂:简单使用、清晰准确表达数据好看:配色得体、风格统一好做:方便制作,容易套用好用:开口说话,表达观点
无论我们使用哪种类型的图表,我们都需要牢记以下三个原则:
明确目标受众:他们对该问题有何了解?确定要传递的信息:数据说明了什么?需要传达多个信息吗?确定信息的特点:是要进行项目比较、显示时间趋势,还是分析数据关系?
如何选择有效的图表
让我们言归正传。应该如何选择有效的图表?我画了一张图表制作流程图:
首先获取数据,确定数据呈现的主题,也就是利用图表想要从数据中获得什么信息,然后根据数据之间的对比来选择图表类型。在这个过程中,你也可能通过图表分析新的问题,或者尝试从多个维度分析数据。
1。确定表达主题
同一组数据从不同的角度看,有不同的主题,比如下面这组数据:
如果你关注1-5月的销售趋势以及售价如何随时间变化。你的图表的主题应该是“自一月份以来销售稳步增长”
或者你可能想关注某个点,比如5月份的数据,你可能会记录产品A、B、C的销售排名,那样的话,图表的主题应该是“5月份,产品A的销量大大超过了B、C”
从另一个角度来看,同样是5月份的数据,你可能也会关注每种产品在销售额中所占的百分比。你的图表主题应该是“5月份,产品A在公司产品总销量中排名第一”。
选择合适的图表的关键也是第一个也是最重要的,就是确定你要表达的具体主题。正确的图表形式的选择完全取决于主题是否明确。一个图表只是展示了数据的组织形式,最终强调的是一个主题,实际上可以作为图表的标题。
2。确定对比度关系
给你举几个简单的例子:
“预计未来10年销量将会增加”对应于时间趋势
“雇员的最高工资在30,000美元和35,000美元之间”对应于频率分布
“汽油并不代表品牌越响亮,价格越高,性能越好。”对应关系是相关性
“9月份六个地区成交额大致相当”对应排名对比
“销售经理只花15%的时间在他的领域”对应于占
“奖金的多少与工龄无关”对应的是相关性
“去年,员工流动主要发生在30-35岁的年龄组”对应着的频率分布
“C区产品生产率排名垫底”对应关系为排名对比
“我们公司的平均收入份额正在下降”对应于时间趋势
“制造业持有资本最大份额”对应关系为比例
3。选择图表格式
现在我们准备进入最后一步:从相对关系到最适合你的信息的图表形式。
数据可视化图表种类繁多,但只掌握其中的一小部分就能满足绝大多数需求。其中,常用的只有十几种。
1。比例
在构成对比关系中,我们主要感兴趣的是各部分的大小占总的百分比,如:
公司某款产品的销售额占总销售额的超过30%2018年,我司的市场份额少于5%公司的业务招待费占所有管理费用的超过25%5月份,A产品的销售量占公司总销售量的首位。2001年客户市场份额少于整个行业的10%占据公司资金的半数的两个渠道
只要你的题目包含了以下几个词比如:份额、比例、总百分比、百分比,就可以确定你在做一个对比图。
有几种常用的图表构成了比较关系:
饼状图:饼状图是一种圆形的统计图,分为若干个扇区,通常用于显示数据的分类和比例。比如你想突出某个部分在整体中的比重,尤其是当这个部分的比重达到整体的25%或者50%的时候。
环比图:显示数据的分类和比例。相比饼状图,环形图可读性更强,可以把重要数据放在中间。
百分比堆积条形图:对比同一分组数据中不同类别所占的比例,分组很多。
百分比堆积柱形图:相比同一分组数据中不同类别所占的比例,分组较少。
矩形树形图:清晰地显示了层次结构,通过矩形面积和排列的不同,显示层次结构内部的比例关系。
2。项目比较(比较)
在比较物品时,我们需要比较类别之间的大小和高度。例如:
客户的销售收益率位居第四;6个部门的周转率大致相同我司今年的销量处于全市场的第3位;
我们可以从大于、小于或等于等词中找到范畴比较的线索。
的常见图表类型如下:
柱形图
条形图
堆积条形图:显示多个类别中组件的对比,表示整体的构成。
气旋图:比较分类数据的数值,以显示两种不同成分的特征,如进口百分比和出口百分比。
范围条形图:表示多个类别之间从低到高的数值范围,而不是单个数值,适用于比较多个类别之间的数值范围。
文字:展示文字信息,视觉上高频突出“关键词”。
雷达图:将多个分类的数据体映射到坐标轴上,比较一个项目不同属性的特征。了解同一类别不同属性的综合,比较不同类别相同属性的差异。
3。时间序列的对比关系
这个对比关系是我们最常见的对比关系,表示随时间变化。
我们对每个部分在总数中的比例或大小不感兴趣,但我们感兴趣的是它们随时间的变化,例如:
销售量自1月份以来呈现逐步下滑态势;过去5年我司的盈利状况每况愈下;过去10年的薪资水平均处于一个小幅增长的态势
时间序列对比的触发词有:变化、增长、下降、减少、波动等。
的常见图表类型如下:
折线图:显示连续值(如时间)或有序类别的趋势。
面积图:用面积来表示数值。显示数量随时间变化的趋势。
垂直瀑布图:一般适用于报表数量的增减,比如一年中各月的销售额和用户数的变化。
4。频率分布的对比关系
这种对比关系表明有多少项目或类别符合一个数字发展的范围。
比如我们用一个频数分布对比关系来表示我们公司有多少员工月收入在5万元以上,有多少员工月收入在3-5万元之间,有多少员工月收入在1-3万元之间等等。,或者说25岁以下的员工有多少,25-30岁的员工有多少,30岁以上的员工有多少。
这个对比关系的关键词包括:x到y的范围,密度,频率,分布等。
常见的图表类型如下:
人口金字塔图(类似于上面的气旋图)
直方图:表示数量在连续区间的分布。
分布曲线
方框图
5。相关性和对比
相关关系是指两个变量之间的关系可能是也可能不是你所证明的模式。比如你可以证明利润随着销售额的增加而增加,你也可以证明销售额随着折扣的增加而增加。
5月份的销售情况表明,销售额与推销员的经验无关。 董事长的薪水并随着公司规模大小需变化 保险单的大小与保险客户的收入成正比。
当你的话题包括与什么相关,随什么增加,随什么减少,随什么变化,或者或不随增加等等。,那么就可以断定是一种相关和对比的关系。
相关性是两个变量之间的关系。两个轴都是数值轴,不同于柱形图、条形图、折线图等其他常见图表类型的一个类别轴(或时间轴)和一个数值轴。
以下图表类型通常用于表示相关性:
散点图:散点图通常用于显示和比较数值。它不仅可以显示趋势,还可以显示数据簇的形状以及数据云中数据点之间的关系。
波士顿矩阵图
气泡图
6。按位置分布的类别比较
空之间的图表可以显示数据中的确切位置和地理模式。例如,显示全国客流量最大的航站楼或所有销售。
空之间的地图包括填充地图、点分布地图、符号地图和密度地图。常用的类型如下:
区域地图:区域地图是通过对其区域进行着色来显示不同区域划分的视觉类型。
点地图:点地图是根据位置信息在地图上标注一系列离散的数据点。适用于需要在地图上同时显示大量相同属性的地址信息的业务场景。比如连锁店、加油站、银行网点等的分布。
热图:热图是通过指定的半径范围进行数据叠加计算,然后用渐变颜色进行贴图。不同的颜色深度代表不同的数据密度。通常适用于某个地理区域内数据量大且相对密集的业务场景。
比如展示一个商圈的人流量分布,一个景区的人流量分布,某个区域的交通流量分布。
流向图:迁移图是在两点之间画一条弧线将它们连接起来的图像,并配以动画呈现移动的效果。主要用于显示人、货、车等的流向。不同地方之间。
本文来自离开我后记得微笑投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/547112.html