前言

数据可视化工具多种多样,五花八门,说是争奇斗艳也不过分。 这是好事,但也存在一个问题:可用工具实在太多了,该如何选择?

个人愚见,仅供参考。

1.首先弄清需求究竟是什么,也就是说为什么需要数据可视化。

情况一,你在使用python进行数据分析,如果数据可视化仅仅是作为你分析过程中的一部分,而不是作为最终展示的一部分。这时就可以用python的任意数据可视化包,而不必使用BI。通俗地说,这时的可视化是给你自己看的,便利顺手即可,无需过于追求精致美观。 情况二,数据已经处理完毕,你需要最终汇报时将数据以可视化方式呈现。这时就需要使用BI工具精心制作。

此外,有些需求比较特殊,比如地理信息数据,词云图。这些最好选择专门的工具。

2.学习或工作是否有指定要求。

比如有的公司会购买商用BI工具,统一使用,这时就需要遵循公司安排。如果你在某个课题组,大家用的都是一种工具,那最好也和大家保持一致。如果某项研究之前使用的都是一种工具,那接下来最好也沿用。

3.关注工具的生态与历史。

数据可视化工具简直爆炸式增长,但很多都是近些年才发展起来的。我认为,这些新发展的创新的工具必有其存在的价值,但是已经存在并更新发展多年的,有良好的社区生态的工具是值得信赖的,比如plotly。换句话说,就是这个工具,别今天用了,第二天发现用不了了。

python中有一个经典的数据可视化包叫 matplotlib 。我是不喜欢用这个的,因为觉得它做的图不是很美观,还需要加各种参数。我喜欢用一个叫 cufflinks 的包,方便美观。但是当我学习一些python相关教程时发现,可视化基本上用的都是 matplotlib ,比如sklearn的官方文档的示例。这时我才意识到, matplotlib 的生态很强大,换句话说,就是它经典,大家都需要用,代码移植也方便。

4.关注工具是否需要编程。

需要编程灵活自由,无需编程的简单方便。目前数据可视化发展很完备了,一般的BI通过拖拽就可以做出很漂亮的图,无需编程。但是如果想在图中添加特定元素或有更复杂的需求,最好选择需要编程的工具。

5.关注工具是否有中文版

不可否认的是,国外在这方便领先我们数年,但是英文工具可能确实会对我们使用带来一些困难。这时如果此工具有中文版的操作界面,说明文档以及社区,对我们使用就非常有帮助。当然如果英文好,这条可以忽略。

以下是工具的汇总,这里没有放上各种编程语言的包,太多了。这里基本上都是无需编程的。个人觉得,“在线可视化“不错,方便简单。此外,易分享性很重要。比如 海致BDP,可以直接以网页链接形式将成果分享给他人进行展示,对方无需下载任何软件。而 帆软BI,则需要对方必须下载软件才能浏览。

🍄目录

在线工具

软件

函数库

特定用途

地图

资料