Python--递归与非递归遍历文件夹的方法

🕗 发布于 2024-07-22 08:04 python windows 开发语言

递归概念

递归是一种编程技术，允许函数调用自身来解决问题。设计递归函数时，需要考虑基本情况和递归步骤。

递归函数设计

基本情况：递归结束的条件。
递归步骤：函数调用自身解决更小的子问题。

递归方法实现

import os

def get_files_recursion_from_dir(path):
    file_list = []
    if os.path.exists(path):
        for f in os.listdir(path):
            new_path = os.path.join(path, f)
            if os.path.isdir(new_path):
                file_list += get_files_recursion_from_dir(new_path)
            else:
                file_list.append(new_path)
    return file_list

非递归遍历方法

除了递归，以下是几种常用的遍历文件夹的方法：

1. 使用 `os.walk()`

os.walk() 是一个生成器函数，遍历指定目录及其子目录，生成三元组 (dirpath, dirnames, filenames)。

import os

def get_files_walk(path):
    file_list = []
    for dirpath, dirnames, filenames in os.walk(path):
        for filename in filenames:
            file_list.append(os.path.join(dirpath, filename))
    return file_list

2. 使用 `glob.glob()` 和 `glob.iglob()`

glob 模块提供通配符搜索文件路径的功能。

import glob

def get_files_glob(path):
    file_list = []
    for filename in glob.iglob(path + "/**/*", recursive=True):
        file_list.append(filename)
    return file_list

3. 使用 `pathlib.Path`

pathlib 提供面向对象的文件系统路径操作。

from pathlib import Path

def get_files_pathlib(path):
    file_list = [str(file) for file in Path(path).rglob('*')]
    return file_list

4. 使用 `scandir()` 和 `scandir_iter()`

scandir() 是一个迭代器，可以遍历目录中的文件和目录。

import os

def get_files_scandir(path):
    file_list = []
    for entry in os.scandir(path):
        if entry.is_file():
            file_list.append(entry.path)
        elif entry.is_dir():
            file_list.extend(get_files_scandir(entry.path))
    return file_list

5. 使用 `subprocess`

通过调用系统命令，可以使用 subprocess 模块获取文件列表。

import subprocess

def get_files_subprocess(path):
    result = subprocess.run(['find', path, '-type', 'f'], stdout=subprocess.PIPE)
    file_list = result.stdout.decode().split('\n')
    return [file for file in file_list if file]

注意事项

递归函数需要有明确的退出条件，避免栈溢出错误。
递归深度可能受到限制，对于极深的文件夹结构，递归可能不是最佳选择。
os.walk() 在遍历过程中遇到权限错误会抛出 OSError。
遍历过程中，如果目录结构发生变化，os.walk() 的行为是未定义的。

使用 `os.access()` 检查文件或目录的权限

os.access() 函数用于检查当前进程是否有权限访问指定的文件或目录。它接受以下模式作为访问权限的检查：

os.F_OK：检查文件或目录是否存在。
os.R_OK：检查文件是否可读。
os.W_OK：检查文件是否可写。
os.X_OK：检查文件是否可执行（在UNIX系统上有效）。

使用 `os.access()` 检查文件或目录的权限：

import os

path = '/path/to/file/or/directory'
if os.access(path, os.F_OK):
    print(f"{path} 存在。")
else:
    print(f"{path} 不存在。")

检查文件是否可读：

if os.access(path, os.R_OK):
    print(f"{path} 是可读的。")
else:
    print(f"{path} 不可读。")

检查文件是否可写：

if os.access(path, os.W_OK):
    print(f"{path} 是可写的。")
else:
    print(f"{path} 不可写。")

检查文件是否可执行（仅UNIX系统）：

if os.access(path, os.X_OK):
    print(f"{path} 是可执行的。")
else:
    print(f"{path} 不可执行。")

组合检查：

if os.access(path, os.R_OK | os.W_OK):
    print(f"{path} 是可读写的。")

避免 `os.walk()` 遍历时的权限错误

在使用 os.walk() 遍历文件夹时，可能会遇到权限错误。以下是一些避免或处理权限错误的策略：

检查权限：在尝试访问目录之前，使用 os.access() 函数检查当前用户是否有权限读取该目录。
捕获异常：在遍历过程中，使用 try-except 块来捕获可能发生的 OSError 或 PermissionError 异常，并决定如何处理这些异常（例如，跳过该目录或记录错误信息）。
使用更宽松的权限：如果程序运行在具有较少权限的用户下，考虑以更高权限运行程序，例如使用 sudo（在Linux系统中）。
修改文件夹权限：在某些情况下，可能需要修改文件夹的权限，以便用户可以访问。这可以通过 os.chmod() 函数实现，但需要谨慎使用，以避免安全风险。
记录错误：在无法访问的目录上记录错误信息，可能对调试或了解程序运行情况有帮助。
用户反馈：如果程序是交互式的，可以向用户报告权限错误，并提示他们采取适当的行动。
使用日志：记录权限错误的详细信息到日志文件中，有助于事后分析。
递归检查：在递归调用 os.walk() 之前，先检查子目录的权限，如果无权限则不进行递归。
使用 pathlib：虽然 pathlib 的 Path.rglob() 方法在遇到权限错误时也会抛出异常，但它提供了更现代的面向对象的API，可以与异常处理结合使用。

选择哪种方法取决于具体需求和个人偏好。递归是一种强大的技术，但需要谨慎使用。非递归方法如 os.walk() 和 pathlib.Path.rglob() 提供了易于理解和使用的替代方案。

原文地址：https://blog.csdn.net/mmd666/article/details/140596731

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：MOM电容寄生参数重复提取
下一篇：keepalived服务介绍

基于RK3588的移动充电机器人应用解决方案
伴随着国内新能源汽车保有量的持续增长，充电难题愈发凸显，配套充电设施的建设需求进一步扩大。可外接4G/5G、WiFi模块，用于传感数据、视频数据的上传，同时，通过网络的连接，能够远程监控机器人的状态和
阅读更多2024-11-16
开源，一天200star，解锁视频字幕生成新方式——一款轻量级开源字幕工具，免费，支持花字，剪映最新会员模式吃相太难看了
是一款基于开源的轻量级视频字幕生成工具，由开发者 @WEIFENG2333 精心打造。其主要目的是为用户提供一套免费、易用的字幕生成方案，支持各种视频格式，并结合现代化的自然语言处理技术，实现精准、高
阅读更多2024-11-16
docker：基于Dockerfile镜像制作完整案例
docker：基于Dockerfile镜像制作完整案例
阅读更多2024-11-16
【数据库系列】 Spring Boot 集成 Neo4j 的详细介绍
Spring Boot 提供了对 Neo4j 的良好支持，使得开发者可以更方便地使用图数据库。通过使用 Spring Data Neo4j，开发者可以轻松地进行数据访问、操作以及管理。本文将详细介绍如
阅读更多2024-11-16
微信小程序02-页面制作
微信小程序提供了丰富的组件，如view、image等，用于构建具有微信风格的UI界面。视口单位用于移动端页面适配，如vw和vh。表单组件用于收集用户信息，如form、button、input等。
阅读更多2024-11-16
2024 CCF中国开源大会“开源科学计算与系统建模openSCS”分论坛成功举办
目前MWORKS用户已遍及国内外295所高校，仅深圳就有41家应用验证企业，覆盖新能源、芯片、车辆、低空经济、医疗、制造、自动化、电力、航天、金融、船舶等优势行业单位，已经具备良好的生态基础。该委员会
阅读更多2024-11-16
C&C++内存管理
pChar3是指针变量，存在栈中，*pChar3是由const修饰的，pChar3指向的内容不能修改，内容具有常属性，因此pChae3存在代码段中，也就是常量区。内存泄漏并不是指内存在物理上的消失，而
阅读更多2024-11-16
单片机面试
答案：宏定义是在编译预处理阶段被处理的。预处理包含：头文件包含，宏替换，条件编译，去除注释，添加行号。
阅读更多2024-11-16
Ubuntu23.10下解决C语言调用mysql.h问题
在学习C语言和MySQL的调用的时候遇到包和版本的问题，由于使用的书很老（10年的），因此很多MySQL的包已经过时，在查找很多资料和询问gpt之后得到了解决方案
阅读更多2024-11-16
高级java每日一道面试题-2024年11月07日-Redis篇-Redis有哪些功能?
Redis 是一个功能强大且灵活的 NoSQL 数据库，广泛应用于缓存、消息队列、实时分析等多种场景。在高级 Java 面试中，了解 Redis 的数据类型、持久化、发布/订阅、事务、Lua 脚本、主
阅读更多2024-11-16

Python--递归与非递归遍历文件夹的方法

递归概念

递归函数设计

递归方法实现

非递归遍历方法

1. 使用 os.walk()

2. 使用 glob.glob() 和 glob.iglob()

3. 使用 pathlib.Path

4. 使用 scandir() 和 scandir_iter()

5. 使用 subprocess

注意事项

使用 os.access() 检查文件或目录的权限

使用 os.access() 检查文件或目录的权限：

避免 os.walk() 遍历时的权限错误

相关文章