使用简单易学的软件包创建复杂可视化
数据科学家往往忽视了可视化数据这一步骤。通过将数据分析和整理成易于理解的形式,可视化数据帮助我们讲述故事。通过去除所有的技术细节和噪音,突出关键信息,数据科学家可以向非技术经理和高管解释他们工作的重要性。
有许多工具可以帮助可视化数据。多年来,微软的Excel主导了静态可视化市场。随着时间的推移,我们转向了动态可视化和在更简洁的方式下展示更多数据的灵活性。有两种类型的工具用于创建动态可视化。
- 商业智能和分析软件:Tableau、PowerBI
- 开源编程库:D3.js、Plotly Dash
Tableau和PowerBI这样的第三方软件工具适用于非技术人员。拖放界面和抽象化允许分析师轻松创建动态仪表板。不足之处有:
- 软件工具价格昂贵
- 需要一定学习曲线来学习使用这些工具
- 可视化设计受限;软件可能不允许某些组件
对于技术人员来说,开源编程库非常出色。熟悉软件工程的人可以按照文档创建灵活的动态可视化。此外,这些软件包是免费使用的(Plotly为其企业级Dash组件提供付费版本)。
D3.js和Plotly之间的区别如下:
- D3.js是使用JavaScript设计的,而Plotly是使用Python设计的
- D3.js比Plotly存在时间更长,因此拥有更好的社区支持和更成熟的生态系统(包括广泛的示例和教程)
- 为了有效使用D3.js,工程师需要了解Web开发的低级细节(HTML、CSS、JavaScript)。而Plotly通过简单易用的Python类抽象了这些细节
- D3.js由于其JavaScript的特性而具有陡峭的学习曲线…