【大语言模型】ACL2024论文-05 GenTranslate: 大型语言模型是生成性多语种语音和机器翻译器

🕗 发布于 2024-11-06 00:20 语言模型机器翻译 人工智能 机器学习 深度学习

【大语言模型】ACL2024论文-05 GenTranslate: 大型语言模型是生成性多语种语音和机器翻译器

在这里插入图片描述
GenTranslate: 大型语言模型是生成性多语种语音和机器翻译器

本文提出了一种新的翻译任务范式“GenTranslate”，它基于大型语言模型（LLMs）来从N-best列表中生成更好的翻译结果。该范式利用LLMs丰富的语言知识和强大的推理能力，整合N-best候选信息以产生更高质量的翻译结果。此外，为了支持LLMs的微调，作者构建并发布了一个包含超过592K个N-best假设-翻译对的HypoTranslate数据集，涵盖11种语言。在各种语音和机器翻译基准测试（例如，FLEURS、CoVoST-2、WMT）上的实验表明，GenTranslate显著优于现有最先进模型。

研究背景

随着大型语言模型（LLMs）的发展，多语种语音和机器翻译领域取得了显著进展。LLMs通过减少表示错误和整合外部知识，推动了多语种语音和机器翻译的发展。然而，现有的翻译任务通常使用束搜索解码和top-1假设选择进行推理，这些技术难以充分利用N-best假设中的丰富信息，对于需要单一、高质量输出序列的翻译任务来说并不理想。
在这里插入图片描述

问题与挑战

主要挑战在于如何充分利用N-best假设中的信息来生成更准确、更高质量的翻译结果。

如何解决

作者提出了GenTranslate，它通过LLMs整合N-best列表中的不同翻译版本，以生成更高质量的翻译结果。此外，为了微调LLMs，作者构建了HypoTranslate数据集。

创新点

提出了GenTranslate，这是一种新的利用LLMs生成高质量翻译结果的范式。
构建并发布了HypoTranslate数据集，支持LLMs的微调。

算法模型

GenTranslate基于LLMs，通过整合N-best假设来生成翻译结果。它使用适当的指令提示LLMs，并通过自回归方式进行优化。具体来说，GenTranslate的框架包括：

使用SeamlessM4T作为基础翻译模型，进行束搜索解码和假设生成。
利用LLMs整合N-best假设，生成最终翻译结果。
采用LLaMAAdapter进行LLMs的高效微调。

实验效果

在多个语音和机器翻译基准测试中，GenTranslate均显示出比现有最先进模型更好的性能。例如，在FLEURS、CoVoST-2、WMT等测试集上，GenTranslate的平均BLEU分数较基线模型有显著提升。具体数据如下：

在FLEURS X→En测试集上，GenTranslate的平均BLEU分数为34.6，而SeamlessM4T-Large为27.1，显示出3.0 BLEU的改进。
在CoVoST-2 X→En测试集上，GenTranslate的平均BLEU分数为41.7，而SeamlessM4T-Large为34.5，显示出7.2 BLEU的改进。

后记

如果您对我的博客内容感兴趣，欢迎三连击(点赞、收藏、关注和评论)，我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型，深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享，助力您更快更准更系统地了解 AI前沿技术。

原文地址：https://blog.csdn.net/fyf2007/article/details/143442534

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Redis-基本了解
下一篇：【vue项目中添加告警音频提示音】

go网络编程
上述代码有个瑕疵就是每次客户端退出就会输出 EOF ，为了避免这个输出，可以使用如下代码处理。完整的改进版 server 端代码如下，客户端代码不变。再打开一个终端，运行客户端代码。再打开一个窗口运行
阅读更多2024-11-08
Webserver(3.3)生产者消费者模型
解决该问题需要用互斥量确保线程同步，用条件变量或者信号量去解决生产者和消费者之间同步的问题，生产者把数据生产满了要通知消费者去消费。会产生数据安全问题，比如生产者还未生产出来，就去消费。
阅读更多2024-11-08
SQL练习专场--01
在这个专场中，会陆续更新一些关于sql的面试题。
阅读更多2024-11-08
MySQL——索引
MySQL索引的特性
阅读更多2024-11-08
Navicat for MySQL 错误：1251
mySql：8.4Navicat for MySQL：11.0.10 企业版绿色版。
阅读更多2024-11-08
【ORACLE】对Oracle中char类型的研究分析
在国产数据库做ORACLE兼容性实现时，无可避免会遇到CHAR类型的差异，但是对于大多数的应用开发者来说，并不会深入去了解char类型的机制。很多开发者之前在ORACLE上就没弄懂，好不容易写出来的S
阅读更多2024-11-08
python venv 使用介绍
注意⭐：`venv` 本身不能直接安装其他版本的 Python。它只能使用已安装的 Python 版本来创建虚拟环境。因此，如果你需要使用不同的 Python 版本（例如 Python 3.8 或 P
阅读更多2024-11-08
Java基础使用①Java特点+环境安装+IDEA使用
Java基础使用①Java特点+环境安装+IDEA使用（Java特点+jdk+IntelliJ IDEA安装和输入hello+IDEA常见快捷键）
阅读更多2024-11-08
浏览器是如何渲染页面的？ - 2024最新版前端秋招面试短期突击面试题
当浏览器的网络线程收到 HTML 文档后，会产生一个渲染任务，并将其传递给渲染主线程的消息队列。主线程会依次处理这些任务，开启渲染流程。浏览器的渲染过程是一个复杂而高效的流水线，每一步都有明确的输入和
阅读更多2024-11-08
法语nous sommes
法语短语。
阅读更多2024-11-08

【大语言模型】ACL2024论文-05 GenTranslate: 大型语言模型是生成性多语种语音和机器翻译器