python自动化办公实例（使用openpyxl、os处理统计Excel表中的数据并将其合并）

🕗 发布于 2024-10-16 23:48 自动化 excel 运维 python 学习

源数据格式

以其中一个表格为例

可以看到表中数据比较杂乱且并没有我们想要的数据、指标（如一等奖、二等奖的数量）不利于下一步数据的分析。所以我们需要手动对数据进行一些处理，大致格式如下：

数据处理格式

这里的手动处理可以通过优化我们的代码来进行一些简化以减少我们的工作量（如其他列不用删只要把奖项这里的列名进行统一就好了、文件名其实也可以不用进行重命名可以直接用我们之前的名字这样不仅可以减少工作量又可以让表的名字更加清晰且有辨识度）不过由于本人之前并未接触过python相关库的使用所以代码写完之后才意识到这些问题。以后有时间再把代码优化优化......

数据处理好存储在一个文件目录下就可以开始运行我们的代码了

代码

import openpyxl
import os
'''
    1、使用代码前请检查表格格式
    2、请安装相应的库（openpyxl、os、pandas）
    3、代码运行前需关闭打开的需要处理的文件
    4、本人水平有限，如果一直报错请上CSDN........
'''
dizhi1=input("请输入原数据存储的路径：")
dizhi2=input("请输入数据处理后存储的路径：")
# 当前目录
base_dir = dizhi1
# 获取当前目录下的所有文件
# 遍历文件列表，输出文件名
#获取绝对路径        files = [os.path.join(base_dir, file) for file in os.listdir(r"{}".format(base_dir))]

for file in os.listdir(r"{}".format(base_dir)):
    print(file)
    # 获取工作簿对象
    wb = openpyxl.load_workbook(r'{}/{}'.format(dizhi1,file))
    wb2=openpyxl.load_workbook('湖南省本科院校清单.xlsx')
    # 获取所有工作表名称
    print(wb.sheetnames)
    # 获取工作表对象
    sheet1 = wb.worksheets[0]
    sheet_2 = wb2.worksheets[0]
    # 设置Sheet名称
    sheet1.title = '竞赛成绩'
    # 创建一个新sheet，可以指定名称，index表示新创建的工作簿放在第几个位置, index从0开始计数
    sheet2 = wb.create_sheet(index=1, title='竞赛成绩统计及汇总')
    # 获取所有工作表名称
    print(wb.sheetnames)
    #获取名单
    b=[]#名单
    # 获取工作表总行数
    rows_2 = sheet_2.max_row
    # 获取工作表总列数
    cols_2 = sheet_2.max_column
    # 总行，总列
    print(rows_2, cols_2)
    for i in range(2, rows_2):
        cell_value = sheet_2.cell(row=i, column=1).value
        b.append(cell_value)
    print(b)
    #给表二的列命名
    sheet2['A1'] = '学校'
    sheet2['B1'] = '一等奖'
    sheet2['C1'] = '二等奖'
    sheet2['D1'] = '三等奖'
    sheet2['E1'] = '获奖总数'
    sheet2['F1'] = '排名'
    sheet2['G1'] = '排名指标'
    sheet2['H1'] = '综合竞赛指标'

    # 获取所有工作表名称
    print(wb.sheetnames)
    # 获取工作表总行数
    rows = sheet1.max_row
    # 获取工作表总列数
    cols = sheet1.max_column
    # 总行，总列
    print(rows, cols)
    # 读取所有内容
    zs=0#获奖总数
    no1=0#一等奖
    no2=0#二等奖
    no3=0#三等奖
    mz=[]
    a=[]#初始表
    x=[]#最终表
    for i in range(1, rows+1):
        row_list = []
        for j in range(1, cols+1):
            cell_value = sheet1.cell(row=i, column=j).value
            row_list.append(cell_value)
        a.append(row_list)
    for i in range(1, rows):
        name=a[i][0]
        if(name not in mz and name in b):
            zs=0
            no1=0
            no2=0
            no3=0
            zhzb=0
            mz.append(name)
            for j in range(1, rows):
                if a[j][0] == name:
                    zs = zs + 1
                    if a[j][1] == '一等奖' or a[j][1] == '一等':
                        no1 = no1 + 1
                    if a[j][1] == '二等奖' or a[j][1] == '二等':
                        no2 = no2 + 1
                    if a[j][1] == '三等奖' or a[j][1] == '三等':
                        no3 = no3 + 1
            print(name,zs, no1, no2, no3)
            # 竞赛综合指标依据2021年度吉首大学教学奖励办法，按照导向性、重点性、示范性原则制定
            zhzb = no1 * 0.5 + no2 * 0.2 + no3 * 0.1
            # 写入多个单元格(追加模式，不会覆盖之前的，从有数据的下一行开始)
            #sheet2.append([name,no1,no2,no3,zs,None,None,zhzb])
            x.append([name,no1,no2,no3,zs,None,None,zhzb])
    x.sort(key=lambda x: (x[1], x[2], x[3]),reverse=True)
    n=len(x)
    s=100
    pm=1
    t=x[0][1:4]
    for i in range(n):
        #print(t[1],x[i][1]);
        if(x[i][1:4] != t):
            pm=i+1
            print(pm)
        x[i][5]=pm
        x[i][6]=round(s-(pm-1)*(100/n),2)
        sheet2.append(x[i])
        t=x[i][1:4]
    # 保存
    print(x)
    wb.save(r"{}\{}".format(dizhi2,file))

注释全写在代码里了哦

数据处理后的格式

将处理汇总好的数据放在了另一个表里

附录

湖南省本科院校清单

我直接把这个表放在了python文件的同一目录下以便调用

原文地址：https://blog.csdn.net/2301_80330510/article/details/142993057

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【优选算法】——双指针(下篇)！
下一篇：常用STL的操作以及特点

js判断字符包含数字字母特殊符号不可包含中文
可以使用正则表达式来检查字符串是否包含数字、字母和特殊符号，同时不包含中文字符。{|}~])` 确保字符串中至少包含一个特殊符号。确保字符串中至少包含一个字母。确保字符串中至少包含一个数字。分别指定字
阅读更多2024-10-17
计算机毕业设计 | vue+SpringBoot图书借阅管理系统图书管理系统(附源码)
vue+SpringBoot图书借阅管理系统。管理员模块：登录、书籍管理、图书类别管理、借阅信息管理、用户管理、修改密码；读者模块：注册、登录、查询图书信息、借阅和归还图书、查看个人借阅记录、修改密码
阅读更多2024-10-17
深入解析JavaScript中的Object.freeze()：冻结对象，保护数据完整性
软考鸭微信小程序学软考,来软考鸭!提供软考免费软考讲解视频、题库、软考试题、软考模考、软考查分、软考咨询等服务。
阅读更多2024-10-17
24/10/12 算法笔记 NiN
因此，在处理具有明显空间结构的数据（如图像）时，通常先使用卷积层来提取空间特征，然后再使用全连接层进行分类或其他任务。使用1*1卷积层来实现逐像素的全连接操作，有助于在通道维度上整合特征，同时保持空间
阅读更多2024-10-17
【分布式训练（5）】无法 kill PID？如何 kill 休眠中的 GPU 占用进程
所以对这些 .cursor-server 的 PID 号进行 kill 就可以解决该问题啦。
阅读更多2024-10-17
AI程序开发体验之CRM系统
CRM系统是企业用于管理与客户关系的软件，它通过集成多种功能来提升客户满意度和企业效率。：这是CRM系统的基础功能，允许企业存储和组织客户的联系信息、购买历史和偏好等数据，以便快速访问并提供个性化服务
阅读更多2024-10-17
不看后悔！45个与生成树相关的术语，赶紧收藏
例如，10Mbps 端口的成本为 100，100Mbps 端口的成本为 19，1Gbps 端口的成本为 4。在生成树协议所处的学习状态之下，端口会对所接收到的数据包的源 MAC 地址予以学习并记录下来
阅读更多2024-10-17
VLAN资源池
原VLAN资源池中有VLAN 5、6、7、8、9、10、15、18、20、21、30，从资源池中移除15后，资源池中剩下的VLAN为 5、6、7、8、9、10、18、20、21、30，按照题目描述格式
阅读更多2024-10-17
CUDA 全局内存
全局内存在片外。特点是：容量最大、延迟最大、使用最多全局内存中的数据是所有线程可见的，Host端可见，且具有与程序相同的生命周期。
阅读更多2024-10-17
综合小案例
综合小案例
阅读更多2024-10-17

python自动化办公实例（使用openpyxl、os处理统计Excel表中的数据并将其合并）

源数据格式

数据处理格式

代码

数据处理后的格式

附录

相关文章