【大模型学习】利用最新版Langchain-Chatchat搭建个人知识库问答LLM

🕗 发布于 2024-07-20 10:54 学习 langchain pytorch 深度学习 人工智能

langchain-ChatGLM 版本：v0.3.1

操作系统及版本: Windows11

Python 版本: 3.10

搭建方案：

设计功能
选择框架和模型
收集数据
将数据Embeddings存入向量数据库
设计Prompt模板让LLM指令遵循
验证迭代
前后端搭建

大模型应用开发思路

二、搭建过程

2.1 环境配置

搭建一个虚拟环境，这步不是必须的，如果你之前就已经有了可以忽略：

conda create -n chat python=3.10 -y

拉取ChatChat的代码：

https://github.com/chatchat-space/Langchain-Chatchat.git

安装chatchat的环境：

pip install "langchain-chatchat[xinference]" -U

使用模型推理框架并加载模型，这里用到的是Xinference。

注意：为避免依赖冲突，请将 Langchain-Chatchat 和模型部署框架如 Xinference 等放在不同的 Python 虚拟环境中，比如 conda, venv, virtualenv 等。

因此建议新建一个虚拟环境：

conda create -n xinf python=3.10 -y

Xinference 可以安装在 Linux、Windows 和 macOS 上。要使用 Xinference 运行模型，需要安装与打算服务的模型类型相对应的后端，可以用pip命令完成。

如果打算提供所有受支持的模型，则可以使用单个命令安装所有必要的依赖项：

pip install "xinference[all]"

如果只想要安装个简单的，Transformers支持大多数最先进的模型的推理。它是 PyTorch 格式模型的默认后端：

pip install "xinference[transformers]"

2.2 启动推理框架和下载模型

在本地运行 Xinference，这里有个细节要注意，Windows中不能直接使用0.0.0.0启动服务，需要给出本地IP地址，不然会报错：

xinference-local --host 127.0.0.1 --port 9997

终端启动

打开的页面

本次的LLM模型选择是GLM-chat4：

选择GLM-chat4

选择下载内容

下载权重

终端就会开始下载模型权重了。

Embeddings模型选择的是bge-large-zh-v1.5，选择后一样就可以开始下载了

bge-large-zh-v1.5

2.3 配置chatchat

现在打开chatchat：

设置 Chatchat 存储配置文件和数据文件的根目录，在文件夹中新建一个chatchat_data文件夹：

chatchat_data文件夹

# on linux or macos 
export CHATCHAT_ROOT=/path/to/chatchat_data 
# on windows 
set CHATCHAT_ROOT=/path/to/chatchat_data

若不设置该环境变量，则自动使用当前目录。

执行初始化：

chatchat init

该命令会执行以下操作：

创建所有需要的数据目录
复制 samples 知识库内容
生成默认 yaml 配置文件

数据库中的内容

初始化成功

修改配置文件，需要根据步骤2. 模型推理框架并加载模型中选用的模型推理框架与加载的模型进行模型接入配置，具体参考model_settings.yaml中的注释。主要修改以下内容：

# 默认选用的 LLM 名称
 DEFAULT_LLM_MODEL: qwen1.5-chat

 # 默认选用的 Embedding 名称
 DEFAULT_EMBEDDING_MODEL: bge-large-zh-v1.5

# 将 `LLM_MODEL_CONFIG` 中 `llm_model, action_model` 的键改成对应的 LLM 模型
# 在 `MODEL_PLATFORMS` 中修改对应模型平台信息

配置知识库路径（basic_settings.yaml），这步可以不做，如果你就是用前面配置好的数据库地址。

默认知识库位于CHATCHAT_ROOT/data/knowledge_base，如果你想把知识库放在不同的位置，或者想连接现有的知识库，可以在这里修改对应目录即可。

# 知识库默认存储路径
 KB_ROOT_PATH: D:\chatchat-test\data\knowledge_base

 # 数据库默认存储路径。如果使用sqlite，可以直接修改DB_ROOT_PATH；如果使用其它数据库，请直接修改SQLALCHEMY_DATABASE_URI。
 DB_ROOT_PATH: D:\chatchat-test\data\knowledge_base\info.db

 # 知识库信息数据库连接URI
 SQLALCHEMY_DATABASE_URI: sqlite:///D:\chatchat-test\data\knowledge_base\info.db

配置知识库（kb_settings.yaml）（可选）：

默认使用 FAISS 知识库，如果想连接其它类型的知识库，可以修改 DEFAULT_VS_TYPE 和 kbs_config。

支持的数据文件类型很多，包括PDF、TXT、MP4、CSV、MD等，但是要注意放置到对应的文件夹下面：

直接将文件放在这些文件夹内即可

2.4 初始化知识库

进行知识库初始化前，请确保已经启动模型推理框架及对应embedding模型（也就是Xinference框架要启动着），且已按照上述步骤3完成模型接入配置。

chatchat kb -r

数据处理中

出现这个就说明已经加载好了

更多功能可以查看：

chatchat kb --help

-r, --recreate：重新创建矢量存储。如果存在此选项，则使用它。已将文档文件复制到内容文件夹，但矢量存储尚未填充或DEFAUL_VS_TYPE/DEFAUL_EMBEDING_MODEL已更改。
--create-table：如果不存在，则创建空表。
--clear-table：创建空表，或在重新创建矢量存储之前删除数据库表。
-u, --db-update：数据库中存在文件的矢量存储更新。如果要重新创建矢量存储，请使用此选项。文件存在于数据库中，跳过文件存在于本地文件夹。
-i, --incremental：本地文件夹中存在文件的增量更新矢量存储，数据库中不存在。如果您希望逐步创建矢量，请使用此选项。
--trim-db：删除本地数据库中不存在的文档文件夹中的文档。用于删除用户在文件浏览器中删除的文档文件。
--trim-folder：删除本地文件夹中不存在的文档文件数据库。用于释放本地磁盘空间，删除未使用的文档文件。
-n, --kb-name TEXT：指定要操作的知识库名称。默认值为KB_ROOT_PATH中存在的所有文件夹。
-e, --embed-model TEXT：指定嵌入模型。
--import-from-db TEXT：从指定的sqlite数据库导入表。
--help：显示此消息并退出。

2.5 启动项目

chatchat start -a

主页面

原文地址：https://blog.csdn.net/cjy_colorful0806/article/details/140552165

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：CH552G使用IAP下载
下一篇：《0基础》学习Python——第十八讲__爬虫\＜1＞

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20