Chat2VIS: Generating Data Visualizations via Natural Language

🕗 发布于 2024-09-21 09:27 信息可视化 chatgpt 人工智能 论文阅读

在这里插入图片描述
Chat2VIS:通过使用ChatGPT, Codex和GPT-3大型语言模型的自然语言生成数据可视化
梅西大学数学与计算科学学院，新西兰奥克兰
IEEE Access

1 Abstract

数据可视化领域一直致力于设计直接从自然语言文本生成可视化的解决方案。自然语言接口 (NLI) 的研究为这些技术的发展做出了贡献。然而，由于自然语言固有的模糊性，以及不明确和编写不良的用户查询，使得现有语言模型在识别用户意图方面存在问题，因此实现可行的 NLI 一直具有挑战性。

本研究并没有遵循开发语言模型新迭代的常规路径，而是独特地提出利用预训练大型语言模型(LLM)的进步，如 ChatGPT 和 GPT-3，将自由形式的自然语言直接转换为代码，以实现适当的可视化。本文提出了一个新的系统，Chat2VIS，它利用了 LLM 的能力，并展示了如何通过有效的快速工程，更有效地解决复杂的语言理解问题，从而产生比以前的方法更简单、更准确的端到端解决方案。Chat2VIS表明，LLM 和提示 (Prompt) 结合提供了一种可靠的方法来呈现自然语言查询的可视化，即使查询是高度错误指定和指定不足的。本研究还介绍了LLM提示如何以一种保留数据安全和隐私的方式构建，同时可推广到不同的数据集。本工作通过几个案例研究比较了GPT-3、Codex和ChatGPT的性能，并将性能与先前的研究进行了对比。

2 Introduction

基于自然语言(NL)文本生成可视化的能力一直是数据可视化领域的理想目标。对用于可视化的自然语言接口 (NLI) 的研究已经成为最近引领该领域进步的主要领域。这些接口允许用户根据自然语言查询或提示生成可视化，而不需要编程和技术结构，从而提供了一种灵活直观的与数据交互的方式。最终目标是设计出能够让用户表达诸如“Show me the sales trend ? ”，通过自动识别正确的图表类型来正确理解和描绘。

将自然语言输入转换为可视化(NL2VIS)的过程涉及几个重要的任务。通常，首先对输入查询进行解析和建模，然后识别所需的数据属性，并识别查询中表示的低级分析任务。这些低级别的任务，比如过滤、关联和趋势分析，必须被转换成代码来执行。最后，分析输入查询并将其与最合适的可视化相匹配，然后调用代码来呈现数据。

NL2VIS的实现是一项特别具有挑战性的任务，因为NL的固有特征，如提示中的歧义和需求不规范，以及不可避免的排版错误。自然语言的这些特点使得现有的技术和方法很难准确地解释用户的意图并产生适当的可视化。尽管存在这些挑战，受数据分析需求和对灵活直观的数据交互方式日益增长的需求的驱动，nli在数据可视化方面的受欢迎程度仍在继续增长。

LLMs 彻底改变了自然语言的理解和生成领域。这些模型基于transformer架构，该架构在情感分析、问答和语言生成等任务中取得了显著的成功，这既是由于该架构的有效性，也是由于它们在大量数据上进行了训练。

本研究提出了以下研究问题:

(RQ1) 当前的 LLM 是否支持从 NL 准确地端到端生成可视化?
(RQ2) 如何有效地利用 LLMs 来生成正确且适当渲染的图表?
(RQ3) 哪些 LLM 倾向于对 NL 提示执行更稳健？它们与其他最先进的方法相比表现如何?
(RQ4) 在 NL2VIS 中使用 LLM 的局限性是什么？未来的研究方向是什么?

3 Method

在这里插入图片描述
如图描述了开发的 Chat2VIS 系统的概述。用户通过 Streamlit NLI 应用程序输入一个NL查询，这是一个基于 web 的开源 Python 框架。该查询与提示脚本相结合，该脚本为选定的数据集设计合适的提示。提示被转发到选定的 LLM, LLM 返回一个 Python 脚本，该脚本随后在 Streamlit NLI 中呈现。

在这里插入图片描述
本研究中使用的Chat2VIS软件工件的界面如图3所示。该界面使用户能够选择一个数据集并输入描述其数据可视化意图的自由格式文本。侧边工具栏提供了导入其他CSV文件和SQLite数据库的功能，并提供了选择所需llm的选项。
访问模型需要OpenAI Access Key，必须在查询之前输入。提供了一个输入框，用于输入NL自由格式文本。为每个选定的模型呈现可视化，并向用户显示实际的数据集。

从 LLM 获得所需输出的最有效方法是使用“show-and-tell”技术，即在提示中提供示例和说明。本系统生成由两部分组成的 LLM 提示: (1) 由 Python 文档字符串构建的描述提示，并在定义的开头和结尾使用三重双引号“”声明，(2) 由 Python 代码语句组成的代码提示，该代码语句为脚本提供指导和起点。
在这里插入图片描述

粗体类型突出显示了替换值，这些替换值是可变的，依赖于所选的数据集。这些文件向LLM提供了DataFrame(一个表格数据对象)的概述，列出了列名、它们的数据类型和分类值，这有助于LLM理解上下文，提示的每个组成部分描述如下:

描述提示符由Python文档字符串启动图(a)
在图4(b)中，LLM被明确告知使用名称为df的DataFrame，这使得可以通过特定名称对该DataFrame进行引用，从而避免了LLM为DataFrame分配不同名称时可能出现的任何混淆。
图4©中的描述提示符由每列一个条目组成，表明其数据类型。如果具有对象数据类型的列具有少于20个不同的值，则将其视为分类类型，并在提示符中枚举其值。
4）在图4(d)中，要求LLM决定x轴和y轴的适当命名以及绘图标题。

一旦制定，这两个提示元素将合并在一起，结果字符串通过文本完成端点API提交给llm

4 Results

在这里插入图片描述

5 Discussion

RQ1：本文六个案例研究的实验结果证实了在设计良好的提示符支持下，LLM 可以有效地支持端到端从 NL 生成可视化。
RQ2：LLM 可以有效地启动所提出的提示，并且提示工程有助于在伴随 NL 请求时引出正确的图表选择和适当呈现的图表。LLMs 自主选择正确绘图类型的论证超出了以往研究的能力。
RQ3：在性能方面，初步结果表明，ChatGPT、GPT-3 和 Codex LLMs 之间的性能倾向于不表现出大的偏差。可以说，ChatGPT展示了一些增强的性能。很大程度上的可比性可能归因于这三个 LLM 是在相似的数据集上训练的。
RQ4：虽然结果显示了 LLM 用于NL2VIS的潜力，但该技术仍然存在一些挑战，这些挑战大多是次要的，主要围绕图形的美学特征和可视化结果的变化。

6 Future Work

未来的工作将探索将 nvBench 基准数据集整合到 Chat2VIS 功能的改进中，并利用该数据集在更广泛的查询中对其功能进行更全面的定量分析，从而能够与先前的研究结果进行更稳健的比较。此外，一个有价值的未来研究方向是研究该领域 LLM 提示中扰动的影响，量化输出质量变化的敏感性。比较更广泛的 LLM (包括YoloPandas) 解决 NL2VIS 问题的能力也是一项有价值的工作；然而，支持自动比较的方法和基准数据集需要在这一领域进一步发展，以促进进展。

原文地址：https://blog.csdn.net/Luo_LA/article/details/142376482

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：揭开数据能力的神秘面纱
下一篇：Linux中Hadoop常用命令

Java常用类之包装类
在Java中，包装类是一种将基本数据类型包装成对象的类。Java提供了8个包装类，分别对应8种基本数据类型。这些包装类提供了许多方法，可以方便地操作基本数据类型。包装类的主要作用是在需要使用对象的地方
阅读更多2024-11-14
机器学习基础03
K-Fold交叉验证技术中，整个数据集被划分为K个大小相同的部分。一个Fold被用作验证集，其余的K-1个Fold被用作训练集。K-近邻算法（K-Nearest Neighbors，简称KNN）,根据
阅读更多2024-11-14
使用Python抓取数据的实战指南
通过以上步骤，你已经掌握了使用Python进行基本数据抓取的方法。随着技术的深入，你还可以学习如何使用多线程、异步请求等技术来提高抓取效率，以及如何利用正则表达式、XPath等工具来更精确地提取数据。
阅读更多2024-11-14
安全升级，从漏洞扫描开始：专业级网络安全服务
为了有效应对这些挑战，漏洞扫描服务应运而生，它旨在通过全面、深入的扫描，识别并报告可能使企业面临风险的安全漏洞。本文将详细介绍一款高性价比的漏洞扫描服务，该服务不仅提供现场或远程扫描内网及外网IT资产
阅读更多2024-11-14
将python下载的依赖包传到没网的服务器
然而，有时我们需要在没有网络连接的机器上部署我们的代码，这就涉及到如何将Python下载的依赖包传输到没有网络连接的机器上的问题。将下载的依赖包传输到没有网络连接的机器上，可以使用各种传输工具，例如U
阅读更多2024-11-14
【重生之我要苦学C语言】深入理解指针5
回调函数就是一个如果你把函数的指针(地址)作为参数传递给另一个函数，当这个指针被用来调用其所指向的函数时，被调用的函数就是回调函数回调函数不是由该函数的实现方直接调用，而是在特定的事件或条件发生时由另
阅读更多2024-11-14
UniApp 应用、页面与组件的生命周期详解
本文将深入探讨uni-app中应用、页面与组件的生命周期，通过具体的示例来展示如何利用这些生命周期方法，以实现更高效、更优雅的应用开发。无论是初学者还是有经验的开发者，都能从中获得宝贵的知识和技巧，进
阅读更多2024-11-14
前端--＞ nginx--＞gateway产生的跨域问题分析
3、检查CorsFilter的顺序是否是filterChain第一位，如果不是，看他前面的filter是否可以通过。1、后台服务是否配置cors，或者添加CorsFilter。4、如果无法通过，检查n
阅读更多2024-11-14
力扣515：在每个树行中找最大值
力扣515：在每个树行中找最大值。C语言
阅读更多2024-11-14
【LeetCode】每日一题 2024_11_12 统计满足 K 约束的子字符串数量 I（滑动窗口）
【LeetCode】每日一题 2024_11_12 统计满足 K 约束的子字符串数量 I（滑动窗口）
阅读更多2024-11-14