GraphRAG + Ollama + Groq 构建知识库续篇利用neo4j显示知识库

🕗 发布于 2024-10-20 11:54 neo4j python 人工智能 自然语言处理知识图谱

GraphRAG + Ollama + Groq 构建知识库
在上一篇文章中，我们详细介绍了如何创建一个知识库。尽管知识库已经建立，但其内容的可视化展示尚未实现。我们无法直接看到知识库中的数据，也就无法判断这些数据是否符合我们的预期。为了解决这个问题，本文将向你展示如何使用Neo4j这一强大的图形数据库，将知识库中的数据以图形化的形式呈现出来。

0. 环境准备

pip install yfiles_jupyter_graphs --quiet

确保安装 Docker 和 Docker Compose
docker --version
docker-compose --version
如果没有安装，请根据您的操作系统访问 Docker 官方网站 进行安装。https://docs.docker.com/get-started/get-docker/

要使用您提供的 Docker Compose 配置文件来启动 Neo4j 数据库，请按照以下步骤操作：

1. 确保安装 Docker 和 Docker Compose

确保您的系统上已安装 Docker 和 Docker Compose。您可以在终端中运行以下命令以检查是否已安装：

docker --version
docker-compose --version

如果没有安装，请根据您的操作系统访问 Docker 官方网站进行安装。
window 启动docker desktop

2. 创建项目目录

在您的工作目录中，创建一个新的文件夹来存放 Neo4j 数据库相关的文件：

mkdir neo4j_project # 此目录和前回文章中的graphRAG目录是平级的
cd neo4j_project

3. 创建必要的子目录

根据您的配置，您需要创建以下目录：

mkdir -p data\neo4j logs import

4. 创建 `docker-compose.yml` 文件

在 neo4j_project 目录中创建一个名为 docker-compose.yml 的文件，并将您提供的内容粘贴到该文件中：

version: "3.0"
services:
  neo4j:
    image: "neo4j:5.24-community"
    restart: always
    ports:
      - "7474:7474"
      - "7687:7687"
    volumes:
      - ./data/neo4j:/data
      - ./logs:/var/lib/neo4j/logs
      - ./import:/var/lib/neo4j/import
    environment:
      - NEO4J_AUTH=neo4j/123456

您可以使用文本编辑器（如 VS Code、Notepad++ 或任何其他）来创建和编辑此文件。

5. 启动 Neo4j 服务

在终端中，确保您仍在 neo4j_project 目录下，然后运行以下命令以启动 Neo4j 服务：

docker-compose up -d neo4j

-d 参数表示在后台运行容器。

6. 访问 Neo4j 浏览器

一旦服务启动，您可以通过浏览器访问 Neo4j 浏览器，通常地址为：

http://localhost:7474/browser/

使用用户名 neo4j 和密码 123456 登录。

7. 验证服务状态

如果需要查看正在运行的容器，可以使用以下命令：

docker-compose ps

这将显示所有由 Docker Compose 管理的服务及其状态。

通过以上步骤，您应该能够成功搭建并运行 Neo4j 图数据库。如果在过程中遇到任何问题，请检查 Docker 日志以获取更多信息：

docker-compose logs neo4j

这将帮助您诊断可能出现的问题。

8.导入数据

8.1 把前回文章中，graphRAG生成的parquet文件，转换成csv文件

display_graph\parquet转csv.py

import os
import pandas as pd

# 定义一个函数，用于处理parquet文件
def process_parquet_files(path):
    # 遍历指定路径下的所有文件
    for root, dirs, files in os.walk(path):
        for file in files:
            # 如果文件以.parquet结尾，则进行处理
            if file.endswith('.parquet'):
                # 获取文件的完整路径
                file_path = os.path.join(root, file)
                # 读取parquet文件
                df = pd.read_parquet(file_path)
                # 打印正在处理的文件路径
                print(f"Processing file: {file_path}")
                # 定义输出文件的路径
                out_path = os.path.join(root, r'.\display_graph\neo4j_project\import', str(file).replace('parquet', 'csv'))
                # 将parquet文件转换为csv文件
                df.to_csv(out_path, index=False)

# 指定要处理的文件路径，graphRAG生成的parquet文件目录
path = r'.\graphRAG\output\20241012-003213\artifacts'
# 调用函数处理文件
process_parquet_files(path)

8.2 导入csv文件到neo4j，cypher语句批量导入csv文件。

节点导入：

LOAD CSV WITH HEADERS FROM 'file:///create_final_entities.csv' AS row
CREATE (n:PERSON)
SET 
    n.id = row.id,
    n.name = row.name,
    n.type = row.type,
    n.description = row.description,
    n.humanReadableId = row.human_readable_id;

关系导入:

LOAD CSV WITH HEADERS FROM 'file:///create_final_relationships.csv' AS row
MATCH (s:PERSON { name: toString(row.source) })
MATCH (t:PERSON { name: toString(row.target) }) 
CREATE (t)-[r:REL]->(s)
SET 
    r.weight = row.weight, 
    r.description = row.description,
    r.textUnitIds = split(row.text_unit_ids, ','), 
    r.id = row.id,
    r.humanReadableId = row.human_readable_id,
    r.sourceDegree = toInteger(row.source_degree), 
    r.targetDegree = toInteger(row.target_degree), 
    r.rank = toInteger(row.rank);

我们的每一步进步，都是站在前人的肩膀上取得的。正如饮水思源，我们在享受成果的同时，不应忘记那些辛勤挖掘井泉的人。前人种下树木，后人得以乘凉。我们应带着感恩的心，继续传承和发扬无私分享的精神。

参照连接

https://blog.csdn.net/Johntill/article/details/142380487
https://www.cnblogs.com/222wan/p/18212878

原文地址：https://blog.csdn.net/tomlone/article/details/142993488

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：LabVIEW风机滚动轴承监测系统
下一篇：使用AITemplate和AMD GPU的高效图像生成：结合Stable Diffusion模型

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

GraphRAG + Ollama + Groq 构建知识库 续篇 利用neo4j显示知识库