XiYan-SQL：⼀种多⽣成器集成的Text-to-SQL框架

🕗 发布于 2024-12-10 04:25 sql 数据库 人工智能 AIGC 论文阅读

发布于：2024 年 12 月 03 日星期二北京

#NL2SQL #阿里巴巴 #Text-to-SQL

文提出了一种用于自然语言到 SQL 转换的多生成器集成框架 ——XiYan-SQL，旨在应对大型语言模型在 NL2SQL 任务中的挑战。该框架融合提示工程与监督微调（SFT）方法，利用 SFT 的可控性与上下文学习（ICL）潜力提升 SQL 查询质量与多样性。引入的 M-Schema 半结构化模式表示法增强数据库理解，其在多模型实验中表现优于传统模式。在模式链接环节精准筛选数据元素；候选生成阶段，微调 SQL 发生器经两阶段训练定制模型，ICL SQL 发生器依骨架相似选例，SQL 精炼器纠错优化；候选选择模块突破传统自一致性局限，训练模型精准抉择。多数据集实验验证 XiYan-SQL 优势，在 Spider、SQL-Eval、NL2GQL 达领先准确率，消融研究证实各组件关键作用，为 NL2SQL 任务开辟新径、引领发展。关注公众号【AIGC前沿技术追踪】后回复 XiYan 获取第一手英文翻译稿。

在这里插入图片描述

一、引言

在当今数字化时代，海量数据存储于各类数据库中，如何让非专业用户也能便捷地从复杂数据集中提取有价值信息，成为一项关键挑战。自然语言到 SQL（NL2SQL）技术应运而生，它能将自然语言查询转化为结构化查询语言（SQL），极大地提升了数据访问的效率与便捷性。大型语言模型（LLMs）的迅猛发展为 NL2SQL 应用注入强大动力，然而现有基于 LLMs 的 NL2SQL 解决方案仍存在诸多不足。

1.1 现有 NL2SQL 解决方案的局限

当前，基于 LLMs 的 NL2SQL 解决方案主要有提示工程和监督微调（SFT）两种途径。提示工程通过优化提示利用模型固有能力生成多样 SQL 查询，在零样本或少量样本提示的 NL2SQL 任务中成效显著，像 GPT-4 和 Gemini 1.5 等闭源大参数模型潜力巨大、泛化能力强，但多路径生成与自一致性选优的方式致使推理开销高昂。SFT 方法则在 NL2SQL 任务上对小参数模型微调，以生成更可控 SQL 查询，如 CodeS 虽能产生可控结果，却因参数有限，在复杂 NL2SQL 推理及新领域数据库迁移时力不从心。

1.2 XiYan-SQL 的创新理念

为攻克这些难题，XiYan-SQL 框架闪亮登场。它巧妙融合提示工程与 SFT 方法之长，在候选生成阶段展现出卓越性能。一方面，凭借 SFT 的高可控性，精心设计系列训练策略微调模型，生成风格各异、高质量的候选 SQL 查询；另一方面，借助上下文学习（ICL）的强大功能提升候选多样性与复杂查询生成能力。同时，引入 M-schema 这一新颖的半结构化模式表示法，助力 LLMs 更好地把握数据库架构，还通过优化各组件及精细的候选选择策略，全方位提升 NL2SQL 任务的处理水平。

原文地址：https://blog.csdn.net/u014021753/article/details/144222234

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：《MySQL 表结构设计基础》
下一篇：Oracle 用户管理模式下的恢复案例-完全恢复

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

XiYan-SQL：⼀种多⽣成器集成的Text-to-SQL框架

一、引言

1.1 现有 NL2SQL 解决方案的局限

1.2 XiYan-SQL 的创新理念

相关文章