如何成为数据分析师系列(一):可视化图表初
简述
可思数据sykv.com,sykv.cn
数据可视化-通过图表形式展现数据,帮助用户快速、准确理解信息。准确、快速是可视化的关键,好的可视化会“讲故事”,能向我们揭示数据背后的规律。对于可视化,有一个常见误区:分析师追求过于复杂的图表,反而使得业务人员难以理解。其实越简单的图表,越容易被理解,而快速易懂地理解数据,正是可视化最重要的目标。
大多数人对于基础的数据图表都有一定的认知,但却未必清楚,在哪一种场景使用何种图表,本文主要给大家介绍基础图表的特性,让大家知道在何种场景使用该类型图表。 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
图表的基本组成元素 可思数据sykv.com,sykv.cn
一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色表达特定的信息。当然这些元素并不是必须具备的,当信息足够清晰时,你可以精简部分元素,使得图表更加简洁。 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
? 可思数据sykv.com

? 可思数据sykv.com
正确理解维度与指标 本文来自可思数据(sykv.com),转载请联系本站及注明出处
维度(Dimension)
? 类别型字段、一般是离散的、不可进行四则运算
? 常常是观察数据的角度,往往是横坐标 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据
度量/指标(Measure) 可思数据sykv.com,sykv.cn
? 数值型字段、一般是连续的、可进行四则运算
? 一般都是数据的数值化衡量,往往是纵坐标 可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
下面是4种常见、常用基础图表 内容来自可思数据sykv.com
1. 折线图“家族”
可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据
折线图的核心思想是 趋势变化。 可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据
作为信息最明了的图表,是各种图表中最容易解读的图表,以下是它的几种变种:
可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
基础折线图 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
技巧1:添加关键运营事件标记
技巧2:添加趋势线,当R2>0.6时可采纳该趋势线,R2越接近1,趋势越可靠 本文来自可思数据(sykv.com),转载请联系本站及注明出处
?

?
堆积面积图
可思数据-www.sykv.cn,sykv.com
面积大小对应该类别数值大小,反映不同类别占比关系及其时间趋势变化。以下图为例,你可看出AppStore和360下载量Top1、2的渠道。
缺点:由色块面积来表示数值大小有时候不直观。以下图为例,需仔细看图才能知道AppStore和360手机助手是有做过投放的 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
? 可思数据sykv.com,sykv.cn

?
本文来自可思数据(sykv.com),转载请联系本站及注明出处
折线图小结 可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
? 折线图是点、线连在一起的图表,可反映事物的发展趋势和分布情况;
? 适合在单个数据点不那么重要的情况下表现变化趋势、增长幅度。
可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
2. 柱形图“家族”
可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
柱形图的核心思想是 对比
累加柱形图
可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
适合少量类别的对比,且对比信息特别清晰 可思数据sykv.com,sykv.cn
与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
?

?
可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
多指标柱形图
内容来自可思数据sykv.com
主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
技巧:当各对比指标大小相差10倍甚至更大时,可采用标准化,如:对数值取自然对数,既能有效缩小指标量度差距,也能保留同指标的大小关系
? 本文来自可思数据(sykv.com),转载请联系本站及注明出处

? 可思数据sykv.com
条形图 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度
可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
条形图,必须按照数值大小降序排列,这是提升条形图阅读体验的重要手段 可思数据sykv.com
?

?
可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据
瀑布图 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
核心是按维度/指标下钻分解,如:公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解; 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
对比饼图的优势在于,拆解项较多时,瀑布图通过数字的标记仍可清洗辨别,而饼图在分解项>5时就不易辨别。 可思数据-www.sykv.cn,sykv.com
?

?
柱形图结合折线图 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
对比多个指标,尤其是对比指标与指标的增长率上非常适用,使得一个图表可以表现两个层次的信息。(当然要尽可能避免信息的重复。如下图,折线图含义如果换成团队签约数占公司总签约数比例,则意义不大) 本文来自可思数据(sykv.com),转载请联系本站及注明出处
使用双坐标轴,要表明清晰 可思数据sykv.com,sykv.cn
? 可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
直方图 内容来自可思数据sykv.com
当横坐标变成连续的分组,就可以制作直方图(与柱形图主要差别在于,直方图一般不同数据系列没有间距)
当组别划分无限细化,我们就可以绘制概率分布曲线或者称为密度曲线,最常见的就是正态分布,这里不举例。 可思数据sykv.com,sykv.cn
? 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

?
柱形图小结 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
? 核心是对比,柱形图的目的是将对比信息放大,直观呈现出来;
? 由于直观,柱形图适合做结论的表达;
? 柱形图一般不用在时间维度的变化;
? 柱形图的数据系列和点不宜过多,否则建议改变图表形式;
? 柱形之间的宽度尽量小于柱形本身的宽度。
3. 散点图“家族”
散点图的核心思想是 研究 可思数据-www.sykv.cn,sykv.com
研究型图表,适合用于发现变量间的关系与规律,不适合用于清晰表达信息的场景
可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
基础散点图 内容来自可思数据sykv.com
基础散点图观察两个指标的关系 可思数据-www.sykv.cn,sykv.com
? 可思数据sykv.com,sykv.cn
气泡图
在基础散点图上添加一个维度:用气泡大小表示新的一个维度 可思数据sykv.com,sykv.cn
下图中,气泡大小表示配送费用
?
可思数据sykv.com
基于散点图的分类矩阵 可思数据sykv.com
分类运营,精准运营是现代化运营的一个重要课题,通过分类矩阵进行分类是一个有效手段 可思数据-幸运飞艇七码倍投公式资讯平台sykv.com
难点1: 构建指标可用于分类的横纵坐标轴指标,这需要很强的业务认识
难点2: 确定指标的分界点,同样需要足够的业务判断能力
本文来自可思数据(sykv.com),转载请联系本站及注明出处
? 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

?
本文来自可思数据(sykv.com),转载请联系本站及注明出处
散点图小结
? 散点图作为研究型图表,经常在数据分析前期被使用,在报告中很少见;
? 散点图不够直观,大多时候不能直接表达结论;
? 散点图对于业务敏感度和数据意识要求较高;
? 散点图只是入门的钥匙,发现规律只是分析的切入口。
4. 饼图“家族” 可思数据sykv.com,sykv.cn
饼图的核心思想是 分解 可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
基础饼图 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
技巧:将需要突出显示的部分,置于左上角,顺时针方向 可思数据sykv.com
? 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络

? 本文来自可思数据(sykv.com),转载请联系本站及注明出处
旭日图 本文来自可思数据(sykv.com),转载请联系本站及注明出处
旭日图在基础饼图上可表达更多层次的分解关系,如下图:有季度分解、月度分解、再到每周,且每个维度之间可兼容包含 可思数据sykv.com,sykv.cn
?

?
可思数据-www.sykv.cn,sykv.com
饼图小结
可思数据sykv.com
? 一般来说,数值最大的部分排在最前面,也就是12点钟方向顺时针;
? 饼图的细分项不宜过多,一般不超过8项; 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络
? 不要制作三维的饼图,不直观; 可思数据sykv.com
? 切忌将饼图拉得过开,若要突出某一块,可单独将其拉开。
其实,个人觉得饼图在实际场景中应当尽可能少的使用(因人眼对面积大小不敏感),而且对指标的分解柱形图同样能胜任,且远远清晰于饼图。 可思数据sykv.com,sykv.cn
当且仅当,用于反应单个模块占整体比重时,适合用饼图,如下图:
? 可思数据-AI,sykv.com幸运飞艇七码倍投公式,深度学习,机器学习,神经网络

?
可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com
作者:月下柳人松 来源:知乎
转发量:
相关文章:
相关推荐:
网友评论: