ChatGPT推出Canvas功能

🕗 发布于 2024-10-05 21:53 chatgpt 人工智能

"Canvas" 是 OpenAI 推出的全新界面，专为增强写作和编程协作而设计。它让用户能够在聊天之外更高效地进行编辑、审阅和反馈，提供了内联编辑、代码调试和文档版本控制等功能。目前，"Canvas" 已面向 ChatGPT Plus 和 Team 用户推出，未来将扩大适用范围。这个新工具旨在提升用户与 ChatGPT 的互动体验，成为创意和技术上的强力助手。

ChatGPT画布

使用 ChatGPT 编写和编码的全新工作方式

我们即将推出全新的“画布”界面，为与 ChatGPT 协作开展写作和编程项目提供了更加沉浸的体验。与简单的对话不同，画布在独立窗口中打开，让您和 ChatGPT 共同探索、精雕细琢创意。这一测试版标志着合作方式的革新，不再局限于语言交流，而是通过协同创作推动项目的发展。在这里，灵感得以升华，想法得以打磨，真正实现了人机携手并肩的创作之旅。

Canvas 是基于 GPT-4 构建的，目前处于测试阶段，用户可以在模型选择器中手动选择该功能。我们从今天开始向全球的 ChatGPT Plus 和 Team 用户推送该功能，企业和教育用户将在下周获得访问权限。等到测试结束后，所有免费用户也将能够使用画布功能。

更好地与 ChatGPT 合作

人们每天使用 ChatGPT 进行写作和编程帮助，尽管聊天界面简单易用，适合许多任务，但在处理需要多次编辑和修改的项目时存在局限性。为此，Canvas 提供了一种全新的界面，专门用于处理这类复杂工作。

使用 Canvas 时，ChatGPT 可以更好地理解您要完成的任务的上下文。您可以突出特定部分，明确指出希望 ChatGPT 关注的内容。就像一名文稿编辑或代码审查员一样，它能够在项目整体的基础上提供内联反馈和建议，帮助您更精准地完成目标。

在 Canvas 中，您完全掌控项目的进展。您可以直接编辑文本或代码，并使用快捷菜单让 ChatGPT 调整写作长度、调试代码等操作。此外，Canvas 还提供了一个“撤销”按钮，帮助您恢复之前的工作版本。这种灵活性让您在项目中轻松进行调整和优化。

当 ChatGPT 检测到适合使用 Canvas 的场景时，它会自动打开 Canvas。您也可以在提示中加入“使用 Canvas”来手动启动，并在现有项目中进行编辑和工作。

写作快捷方式包括：

建议修改：ChatGPT 提供内联建议和反馈。
调整长度：修改文档长度，缩短或延长内容。
更改阅读水平：根据需要调整阅读难度，从幼儿园到研究生水平。
最终润色：检查语法、清晰度和一致性。
添加表情符号：增加相关表情符号以增强表达效果和色彩。

在Canvas中编程

编程是一个反复迭代的过程，跟踪代码的修改在聊天中可能很困难。Canvas 让追踪和理解 ChatGPT 的代码更简单透明，并计划进一步提升这些编辑的清晰度。

编程快捷方式包括：

审查代码：ChatGPT 提供代码优化建议。
添加日志：插入打印语句帮助调试代码。
添加注释：为代码添加注释，提升可读性。
修复错误：检测并重写问题代码。
移植语言：将代码翻译为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

将模型训练为合作者

我们训练 GPT-4o 作为创意伙伴进行合作。该模型知道何时打开画布、进行有针对性的编辑以及完全改写。它还能理解更广泛的背景，提供精确的反馈和建议。

为此，我们的研究团队制定了以下核心行为：

触发书写和编码画布
生成多种内容类型
进行有针对性的编辑
改写文件
提供在线评论

我们通过 20 多项自动内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术，例如从 OpenAI o1-preview 中提炼输出，对模型的核心行为进行后期训练。这种方法使我们能够快速解决写作质量和新的用户交互问题，而无需依赖人工生成的数据。

一个关键的挑战是确定何时触发画布。我们让模型学会为 "写一篇关于咖啡豆历史的博文 "这样的提示打开画布，同时避免过度触发 "帮我做一份新的晚餐食谱 "这样的一般问答任务。对于写作任务，我们优先提高了 "触发正确率"（以牺牲 "非触发正确率 "为代价），与带有提示指令的基线零触发 GPT-4o 相比，达到了 83%。

值得注意的是，此类基线的质量对所使用的特定提示非常敏感。使用不同的提示时，基线可能仍然表现不佳，但表现方式会有所不同--例如，在编码和写作任务中平均不准确，从而导致错误分布不同，以及其他形式的次优表现。在编码方面，我们有意使模型偏向于不触发，以避免干扰我们的高级用户。我们将根据用户反馈继续改进。

在写作和编码任务中，我们提高了对画布决策边界的正确触发率，与带有提示指令的基线零镜头 GPT-4o 相比，分别达到了 83% 和 94%。

第二个挑战是在画布触发后调整模型的编辑行为，特别是决定何时进行有针对性的编辑，而不是重写整个内容。我们对模型进行了训练，使其在用户通过界面明确选择文本时执行有针对性的编辑，否则则倾向于重写。随着我们对模型的不断完善，这种行为还会继续演变。

对于写作和编码任务，我们优先改进了画布定向编辑。带有画布的 GPT-4o 比基线提示的 GPT-4o 性能高出 18%。

最后，训练模型以生成高质量的评论需要仔细的反复练习。与前两种情况不同的是，前两种情况很容易通过彻底的人工审核实现自动评估，而以自动方式衡量质量则特别具有挑战性。因此，我们使用人工评测来评估评论的质量和准确性。我们的集成画布模型在准确性和质量方面分别比带有提示说明的零点击 GPT-4o 高出 30% 和 16%，这表明与带有详细说明的零点击提示相比，合成训练能显著提高回复质量和行为。

人工评估对画布注释质量和准确性功能进行了评估。我们的画布模型在准确性和质量上分别比带有提示说明的零点击 GPT-4o 高出 30% 和 16%。

下一步

要使人工智能更有用、更易用，就必须重新思考我们与人工智能的交互方式。Canvas 是一种新方法，也是 ChatGPT 自两年前推出以来对可视化界面的首次重大更新。

Canvas 目前处于早期测试阶段，我们计划迅速改进其功能。

全文翻译自openai官网

原文地址：https://blog.csdn.net/ctips/article/details/142702628

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：闲着没事干写的代码
下一篇：Python selenium库学习使用实操二

freex源码抄写+ue5视频2个+渲染泛读催眠
freex的四个模块共计408741行（含空格和注释），如果周一到周四每天300行，周六日开着和平精英抄1000行，那就每周3200行，128周，ue独立游戏可以在周一到周四晚上进行，UE C++视频
阅读更多2024-10-05
【信息系统项目管理师考题预测】整合管理
信息系统项目整合管理是项目管理中的一个重要领域，其常考题目通常涉及项目整合管理的各个方面，包括内容、作用、重要性、过程、输入输出、工具技术，以及在实际项目中遇到的问题与解决方法等。
阅读更多2024-10-05
魔都千丝冥缘——软件终端架构思维———未来之窗行业应用跨平台架构
在那神秘而复杂的数字世界里，软件的舞台上正上演着一场精彩的剧目。当面对终端单页面中如蛛网般交织的复杂业务逻辑，我们如同在迷雾中摸索前行。多个表单承载着各自的使命，却又有着相同字段的微妙关联，而内容却又
阅读更多2024-10-05
解决MySQL报Incorrect datetime value错误
MySQL报错--解决 Incorrect datetime value错误
阅读更多2024-10-05
【pytorch】权重为0的情况
记录一下上述代码，体现了隐含层和输出层的权重为全0时的结果，可惜奇怪的是李沐的例子中权重改为全0仍然能够成功训练，目前还不知道为什么。
阅读更多2024-10-05
如何实现事件流操作
ystemChrome这个类及其方法只能在main方法中运行，其它地方无法使用
阅读更多2024-10-05
《python语言程序设计》2018版第8章19题几何Rectangle2D类(下)-头疼的几何和数学
看来多用空格按钮先从网上找一下Statement expected, found Py:DEDENTTAB还是空格呢??小小总结如何拆分矩形的四个点呢.我们来小小的测试一下这个函数结果出在哪里呢???
阅读更多2024-10-05
如何提高游戏本地化的质量使用QE门户网站Logrus IT
如果直接在游戏背景下进行测试，可以取得更大的效果，这将需要略高的预算。QE门户网站Logrus IT允许您根据现场本地化版本或截图中的脚本进行评估。请咨询如何验证您的内容质量，并在本页订购此服务
阅读更多2024-10-05
CSP-S 2021 T1廊桥分配
CSP-S 2021 T1廊桥分配
阅读更多2024-10-05
动态SLAM总结一
汇总自己最近看到的有关动态SLAM的论文，主要包括离线以及在线，同时包括三大分类，基于深度学习的、基于可视化的、基于网格占据的。这篇文章只是自己学习过程的一个记录，很多可能不是正确的，仅供参考
阅读更多2024-10-05

ChatGPT推出Canvas功能

ChatGPT画布

更好地与 ChatGPT 合作

在Canvas中编程

将模型训练为合作者

下一步

相关文章