作者:jiazi--- | 来源:互联网 | 2023-08-26 08:16
能制作可视化报告的方式有千千万。Excel控若能轻车熟路驾驭VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众炙热的长颈鹿选手。会编程的,Echarts几十行代码,分分钟出
有千万种方法可以制作可视化报告。
Excel控件如果能用小型汽车驾驭VBA,就可以享受各种各样的花,即使借助显卡外挂的外援,也能秒杀炙手可热的长颈鹿选手。
会编程,Echarts几十行代码,分分钟秀的r语言掌握数据挖掘,可视化自不必说; Python登上数据高手,手握matplotlib包揽天下。
这么多工具,从哪一个入手好呢? 这也让很多人很困扰。
其实,数据分析不需要大家垂涎。 对大多数我们来说,需求就是从万千数据中统计一些规律,或者一些业务问题用分析数据的方法来求证。
分析工具更多的价值在于辅助分析中的数据处理,可以用可视化结论的方法直观地展开,最终解决问题。 功能上不写公式,而是写代码,如果使用方便就更好了
笔者一直在BI分析,是数据分析师,主张节约时间提高效率。 在入门中,BI也是最简单、最易用的可视化分析工具。
以前共享了《这可能是今年最值得推荐的数据分析工具》,对FineBI的主要功能、特征、基本的使用方法进行了说明。
今天我想把重点放在数据分析的过程上,用FineBI做数据分析师的Dashboard报告。
为了更好地帮助大家的尝试和实践,在文末公开了数据源和报告的展示地点,供大家学习和练习。
一、数据分析的操作思路的数据分析通常是这样切入的。 例如,如果业务发生变化,流量减少20%,则需要更多数据来分析可能的原因和验证假设。 或者拿到数据,思考可以分析的规律点。 无论如何,完整的数据分析需要数据获取、数据预处理、数据分析和建模、可视化分析和报告过程。
FineBI的功能模块也根据这样的分析过程进行划分,分为数据连接、数据准备、可视化分析、仪表板驾驶舱、共享仪表板等。
二、认识这个工具——FineBI的工作区。
在官网上安装合适的版本,激活成功,设置初始账户密码后,跳转到该网页。
左侧是导航栏,类似于菜单栏。 目录(如主页)将显示已完成的分析报告。 这里默认显示公式的内置demo。
数据准备是连接数据、准备数据、重新加工数据的地方,可以管理业务包、数据表、关联、多路径、数据更新、自助数据集等。
在操控板上创建可视化分析。 管理系统是管理整个数据决策系统的地方,包括目录设置、外观设置、数据、报告、共享权限等管理结构。
创建是用户可以快速创建数据连接、添加数据库表、添加SQL数据集、添加EXCEL数据集、添加自助数据集或创建新面板的地方。
要生成三、连接/导入数据数据报告,必须首先导入数据。 FineBI有各种各样的数据,包括Excel、CSV、XML、各种数据库(SQL服务器、Oracle、My SQL等)、两个主要的开源平台(Hadoop、Spark )等这两种方式都是最常用的,所以在这里示范操作。
1、数据库连接示例:连接到mysql
2、导入excel数据
用一个excel导入相同的数据。
步骤1 :数据准备-添加业务包以统一组织数据表。 在这里创建台风包。 单击“添加表”以创建新的excel数据集。
得到以下数据的详细内容。 在这里,可以自动识别数据的字段类型,也可以更改字段类型。 (例如:您可能需要将时间识别为文本类型,然后手动切换到时间类型。 否则,将影响后续操作)
现在,数据导入成功了。
四、数据塑性—自助数据集自数据集实际上是数据加工的一环。 一般来说,我们得到的数据有空值,经常有重复。 肮脏的数据是指肮脏的数据需要清理干净。 关于数据清洗的处理可以写5000字篇,但在这里不多谈。 更一般地说,需要在分析中创建源数据中没有的新字段。 此时,根据需要可以对原始数据进行再加工处理,重新制作用于分析的数据集。 重新处理操作包括选择字段、筛选、聚合组、添加列、设置字段、排序、左右合并、上下合并和挖掘。
com/origin/pgc-image/df76a768e0e240a1b3e4b40434de21ae?from=pc">
这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作,且一些过滤操作可以放到后面创建分析图表的过程中去做。
其实,在自助数据集之前,有个功能没讲到。FineBI有个管理员的说法,这在企业部署中会涉及。管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用,比如本文所要介绍的分析,BI系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文的分析暂时不需要用到权限功能,这里只做简单介绍。
五、可视化分析
到这里数据准备好了,接下来开始正式分析。
先来观察这份数据,这份数据是我从网上当下来的,展示了1945年——2015年登陆我国的台风信息,包括时间、登陆省市以及台风强度。
那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发日,以及台风强度分布。
1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。
2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是finebi仪表板的组成元素。)
分析1:各年度登陆我国的台风数量
添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时间——这里只展示年份这个维度)
这里要注意,源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记录数要依赖CMA编号统计(记录数右侧小三角下拉),以免重复。
其次,这里又添加了一个统计每年台风平均数的指标。
最后再对次图表稍加美化,通常在图形属性和组件样式中:
① 修改线条颜色:图形属性—颜色
② 修改连线为平滑曲线,并且可调整有无标记点
③ 修改该组件标题:组件样式—标题,可调整字体样式
最终得到如下成图:
能明显感觉到登陆我国的台风呈现一个2~4年的波动变化,且2000年以来,直击我国的台风整体数量有略微下降。
分析2:台风登陆各省沿海城市分布—数据地图
这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。
必须将维度创建成地图角色,生成经纬度。
匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇到把辽宁省匹配成宁夏的bug,匹配有问题可以随时调整。
然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等,这里就用填充地图举例。
填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数量。
在组件样式——背景中,可以修改GIS地图样式,如下:
注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。
六、可视化报告
其他分析大同小异,篇幅有限,以上只举了两个例子。
图表分析组件完成之后,就是构建可视化报告(dashboard)了。
仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后面调整了每个图表的样式和配色。好不好看全看个人审美了。
小结
总的来说,使用FineBI制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起来才能得心应手。由于数据之前在excel里已经做了一些处理,所以拿到的数据基本可以直接上手分析。
在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI内置了很多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可视化制作中所有内置图形的绘制方法,以及样式调整。
最后,附学习资料
1、Mysql数据源
URL:jdbc:mysql://192.168.0.108/a用户名:root密码:123456
2、Excel资料可私心回复“可视化报告”获得!
3、FineBI 下载学习,点↓↓↓“了解更多”