prompt开发生命周期

🕗 发布于 2024-03-18 13:37 prompt

在这里插入图片描述

1.定义任务场景和成功标准

任务场景可分为简单任务：实体抽取、qa等
复杂任务：代码生成、创意写作等

在定义任务后，就要定义模型实现该任务的成功标准：
模型表现和准确率；延迟；价格。

2.开发测试用例

多样化的测试用例覆盖任务的典型应用和边缘情况。

3.设计初始的prompt

设计最初的prompt，从简单描述任务场景、回答的风格等开始。最好是使用few-shot的方式，告诉模型的输入输出格式。

4.针对测试用例评估prompt

将测试用例使用初始的prompt输入到模型，观察和评估回复内容，并与成功标准作比较。使用一致的评分标准，可以是人工评估、与答案核心内容的比较或是用其他模型的回答判断等。

5.优化prompt

根据评估结果，朝着成功标准迭代优化prompt。包括但不限于增加描述明细、示例、模型行为的约束。但是要注意不要过分优化小部分的输入，否则会过拟合。

6.部署prompt

一旦设计的prompt成功通过了测试用例，就可以将其应用。注意监控模型表现，边缘情况等意外仍随时可能发生。

准则：

清晰直接：提供清晰的指令和背景信息以指导Claude的回应。
使用示例：在提示中包含示例以展示期望的输出格式或风格。
赋予Claude角色：让Claude扮演一个特定的角色（如专家），以提升针对你的用例的表现。
使用XML标签：利用XML标签来结构化提示和回应，以提高清晰度。
分解提示：将复杂任务分解成更小、更易管理的步骤，以获得更好的结果。
让Claude思考：鼓励逐步思考以提高Claude输出的质量。
预填充Claude的回应：用几个词开始Claude的回应，以将其输出引向期望的方向。
控制输出格式：指定期望的输出格式以确保一致性和可读性。
请求Claude进行重写：基于评分标准请求修订，以促使Claude迭代并改进其输出。
利用长上下文窗口技巧：优化利用Claude长上下文窗口的提示。

原文地址：https://blog.csdn.net/qq_43814415/article/details/136802735

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：浅谈C++的浅拷贝和深拷贝问题
下一篇：Flutter第五弹：Flutter布局

VBA学习笔记：基础知识
若提示宏被禁止，解决办法之一：工具-宏-安全性-安全级-中，关闭excel重新打开，启用宏。Dim arr(1 to 10) As Integer 数组。Dim x As Integer 整数。Dim
阅读更多2024-11-16
swoole mysql连接池使用
并不支持连结池的功能。连结池通常是数据库连接池的一种，它能够管理多个数据库连接，避免了频繁创建和关闭连接的开销，提高了系统的性能。释放连接，以便其他协程可以使用。这样就实现了连接的复用，提高了系统的性
阅读更多2024-11-16
Jmeter中的监听器（三）
假设我们需要测试一个Web应用，并使用比较断言来验证两个请求的响应数据是否一致，然后使用“比较断言可视化器”来查看比较结果。假设我们需要测试一个Web应用，并使用断言来验证响应数据的正确性，然后使用“
阅读更多2024-11-16
Area-Composition模型部署指南
Area-Composition模型可以通过输入不同的提示词，然后根据各部分提示词进行融合生成图片。本文详细介绍了如何实现该模型的本地部署。
阅读更多2024-11-16
3.task1 suimove helloword 上链
水龙头”通常指的是一种分发加密货币或代币的机制，尤其是通过小额赠送或奖励的方式来吸引用户参与。网络问题，切换为国内源。move.toml中修改。
阅读更多2024-11-16
Unity类银河战士恶魔城学习总结（P126 Item ToolTip物品提示）
本章节实现了把鼠标放到物品上面就会显示物品属性
阅读更多2024-11-16
游戏如何应对内存修改
由于进行内存修改需要提供root权限，GG修改器常运行虚拟机、虚拟框架等环境，在获取root权限后，可以使用magisk实现对游戏隐藏进程，来躲避游戏检测，让传统的检测手段失效，对抗难度大幅度提升。内
阅读更多2024-11-16
C#从入门到放弃
C#是一个编程语言。
阅读更多2024-11-16
NCC前端调用查询弹框
选择左侧查询区拖拽指右侧，并添加对应的查询模板字段，注意右上角区域编码要维护card_query。2. 动态建模平台- 开发配置- 应用管理 - 应用注册下找到对应的单据模板。6. 卡片下调用
阅读更多2024-11-16
UI库架构设计
工程架构：monorepo，core + components + hooks +utils …测试，单元测试，vitest，jest+react-testing-library。构建打包：rollu
阅读更多2024-11-16