Python与Excel交互：pandas库安装及基本用法

🕗 发布于 2024-11-08 08:22 python excel pandas

在之前的文章中，我们探讨了Python处理Excel文件的基本概念，如工作簿、工作表以及单元格等。现在我们将转向具体的工具介绍——pandas库，它是Python中最常用的数据分析库之一，能够非常便捷地读取、处理和写入Excel文件。

安装pandas库

首先，确保你的Python环境中已经安装了pandas库。如果没有安装，可以通过以下命令进行安装：

pip install pandas

如果需要同时支持Excel文件的读写功能，则还需要安装openpyxl或xlrd和xlsxwriter来读写.xlsx文件：

pip install openpyxl
# 或者
pip install xlrd xlsxwriter

pandas基本用法

读取Excel文件

import pandas as pd

# 读取Excel文件中的第一个Sheet
df = pd.read_excel('example.xlsx')

# 读取指定Sheet（通过名称）
df = pd.read_excel('example.xlsx', sheet_name='SheetName')

# 读取指定Sheet（通过索引）
df = pd.read_excel('example.xlsx', sheet_name=0)

# 获取所有Sheet的名称列表
xls = pd.ExcelFile('example.xlsx')
sheet_names = xls.sheet_names

查看数据

# 查看前几行数据
print(df.head())

# 查看后几行数据
print(df.tail())

基本数据处理

# 选择某一列数据
column_data = df['ColumnName']

# 选择某几列数据
selected_columns = df[['Column1', 'Column2']]

# 按条件筛选数据
filtered_df = df[df['ColumnName'] > 5]

# 添加新列
df['NewColumn'] = df['ColumnA'] + df['ColumnB']

写入Excel文件

# 将DataFrame写入Excel文件
df.to_excel('output.xlsx', index=False)

实践案例

假设有一个Excel文件包含了员工的信息，我们可以使用pandas来进行简单的数据分析：

# 读取Excel文件
employees_df = pd.read_excel('employees.xlsx')

# 查看前5条记录
print(employees_df.head())

# 筛选出部门为'Engineering'的员工
engineering_employees = employees_df[employees_df['Department'] == 'Engineering']

# 计算Engineering部门员工的平均年龄
average_age = engineering_employees['Age'].mean()
print(f"Average age of Engineering department: {average_age:.2f}")

总结

本文介绍了如何使用pandas库来安装并执行基本的Excel文件读写操作。我们学习了如何读取Excel文件中的数据，筛选和处理数据，以及如何将处理后的数据写回Excel文件。这些技能为使用Python进行数据分析提供了坚实的基础。接下来，我们将继续深入探索更多的pandas功能以及其他与Excel交互的方法。

原文地址：https://blog.csdn.net/m0_62283350/article/details/143587383

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Avalonia中使用Zxing.Net生成二维码,一维码
下一篇：Hive 查询各类型专利 Top 10 申请人及对应的专利申请数

python包管理工具pip和conda的使用对比
pip相对于conda,对应包的依赖关系管理不强，坏处是容易造成包冲突，好处是对于一些特定需要，可以避免处理包依赖关系，直接使用pip安装。一般deactivate 两次即可。2.1.0是相应包的版本
阅读更多2024-11-08
github.io出现的问题及解决方案
手动修改DNS，尝试过很多个DNS解析服务，只有首选DNS服务器设置为114.114.114.114，备用设置为208.67.222.222成功了一个下午，之后莫名打回原形，使用DNS jupmpe
阅读更多2024-11-08
HTML 块级元素和内联（行内）元素详解
块级元素是页面中的结构元素，它们独占一行，通常用于搭建页面的主要框架，如段落、容器、标题等。它们无论其内容多少，都会占据父元素的整个宽度。这种特性使得块级元素特别适合用于页面的整体布局和内容的分区组织
阅读更多2024-11-08
ACM社团第一次测试题解（禁止直接复制粘贴提交）
思路：解法一：暴力比较，两个数之间一直比较得出中位数解法二：快排函数，数组中间值即为中位数代码：1.c语言版：2.c++版：求和：思路：判断是否有两个数相加为第三个数即可代码：1.c语言版：2.c++
阅读更多2024-11-08
机器学习——排序特征（Ranking Features）原理详解
通过以上步骤，我们了解了排序特征的原理及实现过程。排序特征通过特征工程和点对、列表排序算法学习样本之间的相对顺序。RankNet 模型实现了点对比较，通过神经网络生成特征的排序分数。代码实现展示了如何
阅读更多2024-11-08
Django安装
在 Django 项目中，app是一个功能模块，它包含了特定的业务逻辑、数据模型和视图，是 Django 项目结构化管理的核心部分。python manage.py startapp app文件名称。
阅读更多2024-11-08
Centos 下安装 jsoncpp 库、bundle 数据压缩库、httplib 库 -- 详细教程
Centos 下安装 jsoncpp 库、bundle 数据压缩库、httplib 库
阅读更多2024-11-08
Linux（CentOS）安装 Nginx
Linux（CentOS）安装 Nginx。
阅读更多2024-11-08
golang笔记
本应在栈中内存,被分配到了堆中1 返回指针对象在外部被使用2 reutrn 函数使用了上面方法的敞亮3 入参是interface{} 动态参数4 make超过栈大小-gcflags="-
阅读更多2024-11-08
webworker
总结：js异步是始终要回到主线程的，webworker是不需要回到主线程，它自己创建一条线程自己去操作，这样主线程就可以不用管它，等它计算完了后，它可以主动把计算结果发给主线程（得主动发，不然收不到）
阅读更多2024-11-08

Python与Excel交互：pandas库安装及基本用法

安装pandas库

pandas基本用法

实践案例

总结

相关文章