【大语言模型】ACL2024论文-22 大型语言模型中的自信心：探究大型语言模型生成回答的自信心与概率一致性

🕗 发布于 2024-11-30 10:18 语言模型 人工智能 自然语言处理 机器学习 深度学习

【大语言模型】ACL2024论文-22 大型语言模型中的自信心：探究大型语言模型生成回答的自信心与概率一致性

本文探讨了大型语言模型（LLMs）在生成回答时的自信心与概率一致性问题。随着LLMs在各个领域的广泛应用，理解模型自我评估的自信心对于输出的可靠性至关重要。研究者提出了“自信心-概率一致性”概念，将模型内部的自信心（通过token概率量化）与模型在被明确询问时表达的自信心联系起来。通过使用不同的数据集和提示技术，研究者分析了模型内部和表达的自信心之间的一致性。研究发现，OpenAI的GPT-4在多种任务中展现出最强的自信心-概率一致性。这项工作有助于促进LLMs应用中的风险评估，并进一步理解模型的可信度。
在这里插入图片描述

研究背景

近年来，LLMs如GPT、PaLM、Chinchilla和LLaMa等在自然语言处理（NLP）任务中展现出卓越的性能，并在聊天机器人等领域引起了公众的极大兴趣。随着这些模型被整合到医疗、法律和教育等高风险领域，对它们的行为和可信度进行关键评估变得越来越重要。当前的提示技术，如自我一致性、思维树和多代理辩论，严重依赖于模型对其推理过程的自我评估。然而，如果模型表达的自我推理与其真正的内部自信心存在不一致，这些技术可能会产生误导性结果，削弱它们的实际效用。

问题与挑战

LLMs的一个主要挑战是“幻觉”问题，即模型产生看似合理但事实上错误或编造的输出，并伴随着高表达自信心，使得非专家用户难以区分它们与可靠输出。此外，理解模型的内部自信心对于用户在现实世界应用中的信任和决策至关重要。

如何解决

研究者通过定义口头确定性（模型对其回答的明确表达的自信心）和内部自信心（通过token概率量化）之间的关系，来解决这一问题。他们提出了一种新的框架来评估LLMs的透明度和可靠性，即自信心-概率一致性。研究者使用一系列问题数据集，探索了内部和口头表达的自信心之间的相关性，并分析了模型特定参数（如温度）对表达自信心和回答准确性之间关系的影响。

核心创新点

自信心-概率一致性概念：提出了一种新的框架来评估LLMs的透明度和可靠性。
多样化的LLM架构研究：涵盖了多种LLM架构，使用提示技术鼓励模型自省，揭示了不同的一致性动态。
自信心与正确性关系的分析：进一步分析了模型表达的自信心与回答准确性之间的联系，并为详细的错误分析开发了一种不一致性的分类体系。

算法模型

研究中使用了多种LLMs，包括OpenAI的GPT-3及其变体（如InstructGPT和RLHF版本），以及最新的GPT-4，还有开源模型，如Microsoft的Phi-2-2.7B和HuggingFace的Zephyr-7B。研究者通过结构化提示来生成回答，并提取选定答案的token概率以估算内部自信心。此外，他们还构建了信心查询提示（CQP），以获取模型对其回答的口头确定性。
在这里插入图片描述

实验效果（包含重要数据与结论）

实验结果显示，GPT-4在所有数据集上一致性表现最佳，特别是在QASC数据集上，相关系数接近0.5，显示出中等程度的相关性。相比之下，OpenbookQA和ARC数据集的一致性最低，但仍然高于其他模型版本。这些发现表明，GPT-4可能在模型架构和训练方法上有所进步，包括规模和可能更精细的人类反馈集成。

后续优化方向

更广泛的模型覆盖：研究者指出，他们的工作受限于能够访问token级别log probs/logits的模型，因此需要未来的研究来探索更广泛的模型。
语言特异性限制：研究主要关注英语，可能需要进一步研究以理解LLMs在设计用于具有更复杂句法结构的语言时的自信心-概率一致性。
元级推理：研究设计需要模型能够查询其自身的自信心，这可能引入与模型在主要任务中的‘基础’推理不一致的复杂偏见。
提示技术的依赖性：研究结果在很大程度上依赖于精心构建的提示技术，因此需要开发能够在不显著依赖提示技巧的情况下展示自信心-概率一致性的模型。
模型信心与提示准确性：研究的主要目标不是优化模型回答的准确性，而是探索模型内部和口头表达的自信心之间的关系。

后记

如果您对我的博客内容感兴趣，欢迎三连击 ( 点赞、收藏和关注）和留下您的评论，我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型，深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享，助力您更快更准更系统地了解 AI前沿技术。

原文地址：https://blog.csdn.net/fyf2007/article/details/144125995

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：VUE_使用el.animate实现自定义指令抖动效果
下一篇：python分析wireshark文件

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

【大语言模型】ACL2024论文-22 大型语言模型中的自信心：探究大型语言模型生成回答的自信心与概率一致性