使用python写出对比两个xlsx文件

🕗 发布于 2024-09-23 16:47 fpga开发 数据结构

import pandas as pd


def compare_xlsx(file1_path, file2_path):
    try:
        df1 = pd.read_excel(file1_path)
        df2 = pd.read_excel(file2_path)

        # 检查列名是否相同
        if list(df1.columns)!= list(df2.columns):
            print("列名不同：")
            print("文件1列名：", list(df1.columns))
            print("文件2列名：", list(df2.columns))
            return

        # 比较数据
        diff_count = 0
        for index, row1 in df1.iterrows():
            if index >= len(df2):
                print(f"文件1比文件2多数据，在索引 {index} 处开始有多余数据。")
                break
            row2 = df2.iloc[index]
            for col in df1.columns:
                if row1[col]!= row2[col]:
                    diff_count += 1
                    print(f"在索引 {index}，列 {col} 处数据不同：{row1[col]} 和 {row2[col]}")
        if diff_count == 0:
            print("两个文件数据相同。")
    except FileNotFoundError:
        print("文件不存在，请检查文件路径。")

以下是使用示例：

file1 = "test1.xlsx"
file2 = "test2.xlsx"
compare_xlsx(file1, file2)

代码逻辑
- 首先，使用pandas库中的read_excel函数读取两个.xlsx文件到DataFrame对象df1和df2。
- 接着，检查两个DataFrame的列名是否相同。如果不同，直接输出列名差异并返回。
- 然后，通过迭代df1的每一行来比较数据。对于每一行，如果该行索引超过了df2的行数，说明df1有多余数据并输出提示。否则，比较每列的数据，如果不同则输出差异信息并记录差异数量。
- 最后，如果差异数量为0，则表示两个文件数据相同。
异常处理
- 在try - except块中捕获FileNotFoundError异常，如果文件不存在，会输出相应的提示信息。

原文地址：https://blog.csdn.net/QQ_778132974/article/details/142438124

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Qt实战案例（60）——利用QTimer类实现实时时间功能
下一篇：Spring Boot框架下的心理教育辅导系统开发

「QT」文件类之 QTemporaryDir 临时目录类
QTemporaryDir类是Qt框架中用于创建和管理临时目录的类。它提供了一个便捷且安全的方式来生成唯一的临时目录，这些目录通常用于存储临时文件或子目录，以便在程序运行期间进行临时存储或处理。QTe
阅读更多2024-11-16
【c++笔试强训】（第五篇）
因此，Fibonacci数列就形如：0, 1, 1, 2, 3, 5, 8, 13, ...，在Fibonacci数列中的数我们称为Fibonacci数。给你一个N，你想让其变为一个Fibonacci
阅读更多2024-11-16
vue2 动态路由的实现
一般情况下，路由都是前端约定好的，但是每当项目发布上线，或者客户需求新的页面的时候，都需要做出路由改变。这样运维就可以现场支持，方便做出可操作的中户中台，来管理我们的中心项目登录及权限，路由等方面；注
阅读更多2024-11-16
算法导论第二章
从今天开始会陆续更新关于算法导论的啃书相关文章，先从前往后而且比较常用的章节开始讲起，所以可能会有部分不怎么用的着的章节会跳过。由于第一章没讲什么具体内容，所以选择跳过从第二章开始讲起。
阅读更多2024-11-16
生成式GPT商品推荐：精准满足用户需求
随着人工智能（AI）技术的飞速发展，电商平台正在逐步迎来一场前所未有的变革。尤其是生成式GPT（Generative Pre-trained Transformer）技术的应用，正在重新定义电商平台如
阅读更多2024-11-16
【机器学习基础】西瓜书阅读笔记task01
机器学习：研究如何通过计算的手段，利用经验来改善系统自身的性能计算机系统中，经验通常以数据形式存在。机器学习研究的主要内容：计算机从数据中产生模型的算法，即“学习算法”把经验（经验数据）提供给这个算法
阅读更多2024-11-16
卷积神经网络之Yolo详解
IoU用于衡量预测框与真实框的重叠程度，是目标检测中的基础评估指标。置信度反映了模型对于其预测框包含物体的信心。精确率衡量了预测为目标的框中，实际是目标的比例。召回率衡量了模型能够找到的真实目标的比例
阅读更多2024-11-16
ssm092基于Tomcat技术的车库智能管理平台+jsp(论文+源码)_kaic
它将程序数据通过使用不同的数据表格进行保存，在增加了程序数据的存储速度的时候，也提高了数据库的灵活性。当前需要开发的程序软件是根据当下的用户需求进行设计开发的，但是随着时间的推移，社会大环境的改变，开
阅读更多2024-11-16
vue3初始项目结构与分析
时隔多年再次学习vue，单纯学习刚创立好的项目分析其结构与运作方式，掌握了基础才能在工作中延申。
阅读更多2024-11-16
理解 C++ 中的 `const` 关键字
const关键字在 C++ 中的使用是良好的编程实践。它能提高代码的安全性、可读性，并帮助优化编译器的性能。为了防止逻辑错误和性能问题，建议在可能的情况下尽量使用const。通过对比其他编程语言，可以
阅读更多2024-11-16

使用python写出对比两个xlsx文件

相关文章