SpringAI-基于java大模型的胡言乱语

🕗 发布于 2024-09-19 21:22 java 人工智能 开发语言

最近看了一点相关的springAI知识，做个小总结

胡言乱语开始

1.不同的ai调用api一般单独汇总成一个依赖，比如说调用openai的api的依赖是spring-ai-openai-spring-boot-starter。

2.最常用的展示方式是流式对话，AI的数据是一个字一个字生成的，不等AI全部生成才传过来。看上去提高响应速度，给用户一个好体验，主要使用SSE技术。

3.为了让ai有上下文对话能力，需要将历史对答+本次提问组成一个list传输给ai，Message有

SystemMessage系统限制信息，该类信息在对话中的权重很大
UserMessage用户信息
AssistantMessageAI回复信息

等类型，由于ai计费方式按长度计算，所以一般会对这个列表长度进行限制。

4.人设功能，实际上属于提示词Prompt工程的一部分，在openai中人设设定存储在SystemMessage中，该SystemMessage在在对话中的权重很大，ai会优先对这部分反应。一般塞在历史数据list中的第一个。

5.Prompts模板语法，PromptTemplate能够创建结构化提示词，实现了三个接口：

PromptTemplateStringActions: 主要用于创建和渲染提示词字符串，返回值类型均是String类型，提示词基本形式。
PromptTemplateActions: 主要用于创建Prompt对象，该对象可直接传递给ChatClient以生成响应。
PromptTemplateMessageActions：主要用于创建Message对象，这允许我们针对Message对象进行其他的相关操作。

6.OutputParser 生成解析器，可以将AI生成的内容解析为Java对象。实际上是靠Prompt提示词强规范返回输出格式为json

Parser接口用于解析AI生成的内容并将其转换为Java对象返回。在Spring AI中，OutputParser接口有三个具体的实现类：

BeanOutputParser: 通过让AI生成JSON格式的文本，然后通过JSON反序列化为Java对象返回；
MapOutputParser: 与BeanOutputParser的功能类似，但会将JSON反序列化为Map对象；
ListOutputParser: 让AI生成以逗号分隔的列表；

7.基于数据库的多Key轮询需求，在实际业务场景下，不可能只通过一个Key来保证系统稳定运行，因为一旦超过单key请求上限，就会出现无法请求AI的情况，所以需要实现多Key轮询请求，保证系统不会出现因为单key达到请求限制而无法运行的情况。

8.函数调用功能，在一些大模型中可能集成了函数调用功能，函数调用允许 AI 大模型执行客户端的函数，从而根据需要访问必要的信息或动态地执行任务。

9.不同于对话的ChatClient，绘图使用的ImageClient，需要给出ImageMessage(绘图指令)、ImageOptions(图片数、图片配置、返回的图片格式、绘图模型等)。

10.多模态对话，自行判断对话和图片方式，大概率取决去提示词，为了精准一般使用英文写提示词框架，第一次对话让ai判断使用什么方式，第二次对话调用相应的ChatClient或者ImageClient，当然，也可以要求同时输出文字和图片，通过ChatClient添加同时输出文字和图片的提示词来实现

11.Embeddings技术，将文本或图片等各种之后需要用的信息转换为数值向量。这些向量化后的数值数据对于文本分析和检索有着至关重要的作用。一般需要关注选用的Embedding模型model（比如text-embedding-3）和编码格式encodingFormat（通常float）

12.突破Token限制的取巧方法，上下文太长会超过Token限制导致ai无法根据所有信息进行回复，比如提取一篇几十页的论文的总结或者其中提出的名词的含义，直接提问显得不太显示，这时需要一种能存储大量信息并且能被ai理解的事物，也就是向量数据库，与传统数据库执行的精确性搜索不同，向量数据库执行相似性搜索。相似性搜索的算法有很多，比如计算两个向量之间的距离或者夹角来判断是否相似。

13.RAG技术，向量数据库执行搜索后的结果是一组与用户问题相似的数据，在让AI处理超大文本时，只需将这组数据发送给AI即可，这解决了传入超大文本时突破Token限制，节省大量开销。这就是增强检索生成(RAG)，RAG的实现原理：

文本分割成一组文本；
一组文本调用嵌入模型获得一组向量并存储到向量数据库中；
提问时，在向量数据库执行相似性搜索获得与问题相关的一组文本；
将这组文本和问题一并发给AI

如果想使用RAG技术，需要以下几个功能：

文件上传功能和接口
向量数据库的CURD
创建提示词来让AI知道自己要根据查找的内容进行回复
创建对话接口

原文地址：https://blog.csdn.net/qq_42078712/article/details/142368664

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：函数的高级应用
下一篇：Win11|Win10电脑如何卸载软件？这3种方法帮你卸载烦人的程序。

使用淘宝商品关键词搜索API接口提升销售利润
综上所述，淘宝商品关键词搜索API接口为商家和开发者提供了一个强大的工具，通过合理使用这一接口，商家可以轻松获取丰富的商品信息，提高运营效率，优化用户体验，并最终实现销售利润的提升。：传统的搜索方式需
阅读更多2024-09-24
USB总线同步数据采集卡6路高速模拟量采集带DIO功能USB2884/2885/2886
数据采集卡概述：系统框图：规格参数：板卡外形图：尺寸图及元器件功能说明：
阅读更多2024-09-24
python爬虫/引用requests/基本使用
3.找到该文件一般在第一个的位置，点击查看信息。进入控制台使用该命令安装requests。这里用对网站进行post请求，然后打印。1.访问网站打开发F12这里使用百度演示。这里用对网站进行get请求，
阅读更多2024-09-24
基于双向 LSTM 和 CRF 的序列标注模型
本文介绍了如何使用 Keras 构建一个基于双向 LSTM 和 CRF 的序列标注模型。这种模型结合了双向 LSTM 的上下文建模能力和 CRF 的标签依赖关系考虑，能够在序列标注任务中取得较好的性能
阅读更多2024-09-24
数据结构 - 查找算法
存储记录时，有意的建立key与记录的存储位置之间的关系，以构建哈希表。
阅读更多2024-09-24
蓝牙技术|详谈蓝牙信道探测技术，可实现厘米级精准定位
苹果发布AirTag发布以来，大家都更加注重物品的防丢，苹果的 Find My 就可以查找 iPhone、Mac、AirPods、Apple Watch，如今的Find My已经不单单可以查找苹果的设
阅读更多2024-09-24
JUC并发编程_ReadWriteLock
通过合理地使用读写锁，可以显著提高程序的并发性能和资源的利用率。当没有线程持有写锁时，读锁可以被多个线程同时获取，这提高了并发读取的效率。（Write Lock）：写锁是独占的，当一个线程获得写锁后，
阅读更多2024-09-24
Spring Boot 中实现任务后台处理的几种常见方式
在现代应用程序中，后台处理对于处理发送电子邮件、处理文件、生成报告等任务至关重要。Spring Boot 提供了多种机制来高效地实现后台任务。本文探讨了在 Spring Boot 中处理后台处理的各
阅读更多2024-09-24
时序约束进阶三：Create_clock与Create_Generated_Clock详解
时序约束中，使用Create_clock约束来生成主时钟，主时钟可以说是设计的心脏。主时钟是来自FPGA芯片外部的时钟，通过时钟输入端口或高速收发器GT的输出引脚进入FPGA内部。对于赛灵思7系列的器
阅读更多2024-09-24
ubuntu查看全部的磁盘分区命令
使用以上命令中的任何一个都可以获取完整的磁盘分区信息。这将显示磁盘和分区的层次结构以及文件系统类型。这个命令也可以显示所有分区信息。这将列出所有磁盘及其分区。
阅读更多2024-09-24

SpringAI-基于java大模型的胡言乱语

胡言乱语开始

相关文章