实现Python将csv数据导入到Neo4j

🕗 发布于 2024-12-25 20:35 neo4j 数据库 Python 《我是刑警》 Python连接Neo4j

一、获取数据集

1.1 获取数据集

1.2 以“记事本”方式打开文件

3.3.1 点击“File”-“Settings”

3.3.2 找到“Project:PythonProject”-"Python Interpreter"

3.4 导入相关依赖，打开Terminal

4.6 运行代码后，查看Neo4j是否有节点

4.7 导入节点关系

4.8 查看Neo4j

五、该过程出现的Bug

5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte

一、获取数据集

1.1 获取数据集

《我是刑警》的人物关系数据集资源https://download.csdn.net/download/Z0412_J0103/90160496

1.2 以“记事本”方式打开文件

1.3 另存为“UTF-8”格式文件

1.4 选择“是”

二、打开Neo4j并运行

2.1 创建新的Neo4j数据库

2.2 分别设置数据库名和密码

2.3 启动Neo4j数据库

2.4 打开Neo4j数据库

2.5 运行查看该数据库是否为空

match(n) return n;

三、打开Python创建项目

3.1 创建一个包，存项目

3.2 创建一个项目

3.3 检查自己的依赖是否完全

3.3.1 点击“File”-“Settings”

3.3.2 找到“Project:PythonProject”-"Python Interpreter"

检查是否导入了“neo4j”、“pandas”、”py2neo“

3.4 导入相关依赖，打开Terminal

3.5 输入命令

pip install neo4j-python-driver pandas py2neo

四、实现Python连接Neo4j

4.1 Python连接Neo4j测试

from py2neo import *
import pandas as pd
from neo4j import GraphDatabase


graph = Graph('http://neo4j:123456@127.0.0.1:7474')
其中的”123456“是你刚刚建立的Neo4j密码，此处只需要修改该密码就可以了

4.2 导入数据集

invoice_data = pd.read_csv("D:/我是刑警.csv", header=0)
print(invoice_data.shape)
其中地址需要改变，其它地方都不用变

运行结果如下

4.3 处理数据集

peoples = list(set(invoice_data['人物'].astype(str)))
people_ties = list(set(invoice_data['关系人物'].astype(str)))
people = list(set(peoples).union(set(people_ties)))
print(people)

# 清除neo4j里面的所有数据
graph.delete_all()

执行结果如下

4.4 初始化neo4j并合并数据集关系

# 初始化一个空列表来存储所有的元组
tuple_total = []

# 迭代DataFrame的每一行
for index, row in invoice_data.iterrows():
    ties_total = [row['人物'], row['关系'], row['关系人物']]
    # 将所有元组添加到结果列表中
    tuple_total.extend([ties_total])
print(tuple_total)

4.5 把节点导入到Neo4j中

#把节点导入neo4j中
def create_node(people):
    for name in people:
        node_1 = Node('人物', name = name)
        graph.create(node_1)
create_node(people)

4.6 运行代码后，查看Neo4j是否有节点

4.7 导入节点关系

matcher = NodeMatcher(graph)
# 导入关系
for i in range(0, len(tuple_total)):
    name_1 = matcher.match('人物', name=tuple_total[i][0]).first()
    name_2 = matcher.match('人物', name=tuple_total[i][2]).first()
    rel = tuple_total[i][1]
    relationship = Relationship(name_1, rel, name_2)
    graph.create(relationship)

4.8 查看Neo4j

五、该过程出现的Bug

5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte

解决过程：

是因为你的CSV文件没有设置为”UTF-8“ ，具体过程看本文的1.2和1.3过程

上一篇文章：CSDN中群发功能及自动回复设置教程_csdn粉丝群发https://blog.csdn.net/Z0412_J0103/article/details/144074981下一篇文章：

原文地址：https://blog.csdn.net/Z0412_J0103/article/details/144611549

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：ffmpeg添加sps,pps
下一篇：分布式数据存储基础与HDFS操作实践

太空探索的未来掌握在人工智能和机器人手中
NASA 还在规划未来更先进的深空探索任务，计划设计更多具有自主能力的航天器和着陆器，以便能够在现场做出决策，消除通信中继的延迟时间。机器人则通过行星漫游车的机械设计、太空操纵器的机械设计、太空机器人
阅读更多2024-12-26
fpgafor循环语句使用
genvar i;//循环变量名称generate for(i=0;i<4;i=i+1)begin:tx//自己定义名称//循环内容endendgenerate
阅读更多2024-12-26
GitPuk安装配置指南
GitPuk支持各种自定义配置，配置文件默认位置：系统默认位置Windows默认在安装目录下的conf目录下，编辑application.yaml文件Mac默认在app下的Contents -->
阅读更多2024-12-26
Zookeeper常见面试题解析
通过对这些常见 Zookeeper 面试题的深入剖析，我们全方位了解了 Zookeeper 从基础概念、核心特性到应用实践、性能优化以及运维排查的知识要点。在面试中，面对此类问题，不仅要精准回答理论知
阅读更多2024-12-26
Vue.js组件开发-使用vue-pdf显示PDF
<pdf></pdf>pdf},data() {return {rotate: 0},methods: {},},
阅读更多2024-12-26
SpringBoot从入门到实战：动态解析MyBatis SQL字符串获取可执行的SQL
工作中有时需要手动调用SqlSession或者SqlTemplate去执行SQL字符串，而SQL字符串可能是动态的，可能包括if、foreach等标签，所以需要解析mybatis语法生成最终可以执行的
阅读更多2024-12-26
java版Spring Cloud+Mybatis+Oauth2+分布式+微服务+实现工程管理系统
二、企业通过数字化转型，不仅有利于优化业务流程、提升经营管理能力和风险控制能力，还可强有力地促进企业体制机制的全面创新。四、在企业里建立一个管过程、提效率、降风险、控成本的工程项目管理环境，科学化、规
阅读更多2024-12-26
分布式通信，微服务协调组件，zookeeper
远程调用，跨进程的调用方法。跨进程，跨同一台计算机的多个进程，多个jvm，多台计算机之间的进程。rpc，remote procedure call，远程过程调用，指通过网络从远程计算机上获取服务，而不
阅读更多2024-12-26
Spring如何处理循环依赖
Spring通过三级缓存和依赖检查机制有效地解决了大部分由setter注入或字段注入导致的循环依赖问题。然而，对于构造器注入的情况，由于其实现原理的不同，Spring默认不支持这种类型的循环依赖，除非
阅读更多2024-12-26
选择排序：简单算法的实现与优化探索
选择排序是一种简单直观的排序算法。它的基本思想是每次从未排序的部分中选择最小（或最大）元素，将其放到已排序部分的末尾。尽管选择排序的时间复杂度较高，但其实现简洁，适合小规模数据的排序。
阅读更多2024-12-26

实现Python将csv数据导入到Neo4j

一、获取数据集

1.1 获取数据集

1.2 以“记事本”方式打开文件

1.3 另存为“UTF-8”格式文件

1.4 选择“是”

二、 打开Neo4j并运行

2.1 创建新的Neo4j数据库

2.2 分别设置数据库名和密码

2.3 启动Neo4j数据库

2.4 打开Neo4j数据库

2.5 运行查看该数据库是否为空

三、打开Python创建项目

3.1 创建一个包，存项目

3.2 创建一个项目

3.3 检查自己的依赖是否完全

3.3.1 点击“File”-“Settings”

3.3.2 找到“Project:PythonProject”-"Python Interpreter"

3.4 导入相关依赖，打开Terminal

3.5 输入命令

四、实现Python连接Neo4j

4.1 Python连接Neo4j测试

4.2 导入数据集

4.3 处理数据集

4.4 初始化neo4j并合并数据集关系

4.5 把节点导入到Neo4j中

4.6 运行代码后，查看Neo4j是否有节点

4.7 导入节点关系

4.8 查看Neo4j

五、该过程出现的Bug

5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte

相关文章

二、打开Neo4j并运行