![](https://mmssai-1331437701.cos.ap-shanghai.myqcloud.com/images/2025-02/l2VB7h1M5NbF6KiaNDXF1e3SCicibdDf6kMiacMzqApDhKPmQ7o1QWia15PCxQoMSX0xgBibdZ1rCvAUognic7eVnqZ8A.png)
之前的数据可视化工具缺乏精确性和直观性,用户难以清晰描述复杂设计意图,导致 AI 模型可能误解需求,生成不符合预期的图表。
而且大多仅支持单轮或线性交互,无法适应迭代创作中的分支和回溯需求,用户每次更新设计时需重新描述意图,不仅耗时,准确率还非常低。
今天给大家推荐的是微软开源的Data Formulator,解决了这些问题。
项目简介
Data Formulator 是由微软开源的AI可视化创作工具,帮助用户高效地创建复杂的数据可视化作品。它通过结合图形用户界面和自然语言输入,让用户能够以更直观、更灵活的方式表达自己的可视化需求,同时将数据处理和转换的任务交给 AI 模型完成,极大地降低了数据可视化的门槛。
它通过“概念编码架”让用户可以通过拖拽字段和输入自然语言指令的方式快速定义图表设计。“数据线程”功能让用户轻松管理创作过程中的不同版本和分支,方便用户在不同设计之间进行切换、复用和迭代,避免了从头开始的繁琐过程。
DEMO
- 提供 OpenAI 密钥,选择一个模型并挑选一个数据集。
- 选择一种图表类型,然后将数据字段拖放到图表属性(x 轴、y 轴、颜色等)上,以指定可视化编码。
创建基于初始数据集之外的可视化内容
技术特点
1.多模态交互设计
- 结合 GUI 和自然语言输入:用户可以通过拖拽字段和输入自然语言指令的方式,精准且灵活地表达可视化需求。这种混合交互模式既利用了 GUI 的直观性,又发挥了自然语言的灵活性。
- 概念编码架:用户可以将现有字段拖拽到视觉通道,也可以输入新字段名称,并通过自然语言进一步解释这些字段,让 AI 完成数据转换。
2. 强大的迭代支持
- 数据线程:以树状结构记录用户的迭代历史,将数据作为核心对象,可视化图表附属于数据版本。用户可以轻松导航到之前的版本,创建新分支,复用之前的上下文进行新的设计,避免重复劳动。
- 本地数据线程:在主面板中提供快速迭代支持,用户可以快速重新运行之前的指令、提供后续指令或修改指令并重新运行。
3. 智能数据处理
- AI 驱动的数据转换:通过与大型语言模型的交互,Data Formulator 2 能够根据用户的自然语言指令生成 Python 代码,完成复杂的数据转换任务,如数据重塑、过滤、聚合、窗口函数等。
- 自动错误修复:当生成的代码出现运行错误时,系统会尝试自动修复错误,而不是直接让用户重新输入指令。
4. 高效任务管理
- 任务分解与代码生成:系统将用户的自然语言指令分解为详细的目标和代码生成任务,通过“目标细化”步骤确保 AI 模型理解用户的意图,并生成符合需求的代码。
- 代码解释模块:为用户提供代码的逐步解释,帮助用户理解 AI 生成的代码逻辑,增强用户对系统的信任。
5. 丰富的可视化支持
- 支持多种可视化类型:基于 Vega-Lite 的可视化语法,支持散点图、折线图、柱状图、统计图等多种图表类型,满足不同场景下的可视化需求。
- 灵活的样式调整:用户可以在不涉及数据转换的情况下,直接通过 GUI 调整图表的样式(如颜色、排序等),并即时看到视觉反馈。
6. 用户友好的设计
- 直观的界面操作:继承了传统可视化工具的拖拽式操作,用户可以快速上手,无需学习复杂的编程语言。
- 丰富的反馈机制:系统提供生成的数据、图表、代码和代码解释,用户可以从多个角度验证 AI 的输出结果,确保可视化任务的正确性。
项目链接
https://github.com/microsoft/data-formulator
关注「开源AI项目落地」公众号
(文:开源AI项目落地)