翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式一

🕗 发布于 2024-01-28 10:24 python langchain prompt chatgpt

随着 OpenAI 在多模态方面的最新进展，想象一下将这种能力与视觉理解相结合。

现在，您可以在 Streamlit 应用程序中使用 GPT-4 和 Vision，以：

从草图和静态图像构建 Streamlit 应用程序。
帮助你优化应用的用户体验，包括调试和文档。
克服LLM的局限性和幻觉hallucinations。

在本文中，我将带您了解 8 个实际用例，这些用例举例说明了将 GPT-4 与 Vision 结合使用的新可能性！
在这里插入图片描述

1. 人工智能中的多模态简史

在我们深入研究各种用例之前，重要的是要为多模态奠定一些概念基础，讨论开创性模型，并探索当前可用的多模态模型。

多模态(Multi-modal LLMs) LLMs 是一种基于多种类型的数据（如文本、图像和音频）进行训练的 AI 系统，而不是专注于单一模态的传统模型。
在这里插入图片描述
近年来，多模态的旅程取得了长足的进步，各种模式都铺平了道路：

CLIP 是 OpenAI 于 2021 年推出的 OG 模型，它是一种开创性的模型，能够以零样本和少样本学习的方式泛化到多个图像分类任务。
2022 年发布的 Flamingo 以其在多模态领域生成开放式响应方面的强劲表现而著称。
Salesforce 的 BLIP 模型是一个统一视觉语言理解和生成的框架，可提高一系列视觉语言任务的性能。

GPT-4 with Vision 建立在开创性模型的基础上，以推进视觉和文本模式的整合。然而，它并不是当今唯一争夺注意力的多模态模型;Microsoft 和 Google 也越来越受欢迎：

Microsoft 的 LLaVA 使用预先训练的 CLIP 视觉编码器，尽管数据集较小，但仍提供与 GPT-4 相似的性能。
Gemini 是 Google 的多模式模型，它之所以脱颖而出，是因为它从根本上设计为多模式。

参考

https://blog.streamlit.io/7-ways-gpt-4-vision-can-uplevel-your-streamlit-apps/

原文地址：https://blog.csdn.net/zgpeace/article/details/135890457

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式二
下一篇：Gateway API 实践之（四）FSM Gateway 的重试功能

管家婆工贸ERP BR039.采购订单关联MRP明细表
ⅲ. 由于以上报表是复制系统原有功能的基础上增加定制功能，所以如果在以后版本升级中复制参考的系统中的原报表增加了新功能，该定制插件虽然可以支持升级到新版本，但是升级后不包含新版本中增加的新功能，如需变
阅读更多2024-11-17
3271.哈希分割字符串
这个问题通过简单的字符串处理和数学运算实现了字符串的哈希转换。算法时间复杂度为 O(n)，其中 n 是字符串的长度。这种方法高效且易于理解，非常适合用来解决类似的字符串处理问题。
阅读更多2024-11-17
Java核心知识体系-线程管理
在Java程序开发中，线程管理是一个至关重要的方面。它涉及到如何有效地创建、调度、同步和销毁线程，以确保程序的性能、响应性和稳定性。以下是对Java线程管理的详细探讨。
阅读更多2024-11-17
WebChromeClient 方法分类及其功能
`WebChromeClient` 是 Android `WebView` 的关键组件，处理网页交互事件。本文介绍了其主要回调方法及注意事项，帮助开发者提升 Web 应用的用户体验。
阅读更多2024-11-17
服务端高并发分布式结构进阶之路
服务端高并发分布式结构演进之路
阅读更多2024-11-17
物理hack
手把手教你黑进你朋友的电脑，然后给他关机，哈哈哈，来玩吧网络安全红队（成长ing）,学习分享
阅读更多2024-11-17
R 语言科研配色 --- 第 15 期
在使用 R 语言进行科研绘图时，颜色的选择是一件让人特别纠结的事情。本系列文章介绍了 R 语言科研绘图时常用的一些配色。本账号内所有原创内容，未经允许禁止转载和用于商业用途，违者必究。为了解决 R 语
阅读更多2024-11-17
【Android、IOS、Flutter、鸿蒙、ReactNative 】静态数组
Android Java 静态数组、Android Kotlin 静态数组、IOS Object-c 静态数组、IOS Swift 静态数组、鸿蒙静态数组、React Native 静态数组。
阅读更多2024-11-17
蓝牙 HFP 协议详解及 Android 实现
蓝牙免提协议（HFP，Hands-Free Profile）是用于支持免提通话的标准协议，广泛应用于车载蓝牙系统、蓝牙耳机等设备。HFP提供了拨号接听电话挂断电话以及语音拨号等功能，同时支持同步手机电
阅读更多2024-11-17
lua实现雪花算法
雪花算法（Snowflake Algorithm）是一种用于生成唯一ID的分布式生成算法，最初由Twitter开发。它的主要目的是在分布式系统中生成唯一的、时间有序的ID，这些ID通常用于数据库的主键
阅读更多2024-11-17

翻译: GPT-4 with Vision 升级 Streamlit 应用程序的 7 种方式一

1. 人工智能中的多模态简史

参考

相关文章