自学内容网 自学内容网

使用python iter方法读取文件

什么是 iter()?

iter() 是 Python 内置的一个函数,用来返回一个迭代器。迭代器是一种对象,允许你逐个访问其元素,而无需一次性将所有元素加载到内存中。当我们把 iter() 应用于文件对象时,它可以让我们逐行读取文件内容
iter() 的基本语法:

iter(object[, sentinel])
  • object:需要转换为迭代器的对象,可以是可迭代对象(如列表、字符串)或自定义对象。
  • sentinel(可选):用于配合函数生成迭代器,直到函数返回 sentinel 值时停止迭代。

使用 iter() 逐行读取文件

# 逐行读取文件内容
with open('example.txt', 'r') as file:
    for line in iter(file):
        print(line.strip())  # 输出每行内容

使用 iter() 和自定义结束标记

iter() 还可以结合自定义的结束标记(sentinel)使用。在处理一些自定义读取逻辑时,iter() 可以根据我们提供的条件结束迭代。这种方式通常用于从文件中读取固定的块或分段数据,直到遇到特定标记为止。
示例:使用 iter() 和自定义标记

def read_chunk(file_obj, chunk_size):
    return file_obj.read(chunk_size)

with open('example.txt', 'r') as file:
    for chunk in iter(lambda: read_chunk(file, 10), ''):  # 每次读取 10 字符
        print(chunk)

iter() 与其他读取文件方法的对比

iter() 并不是唯一一种读取文件的方式,我们来对比它与其他常用文件读取方法的优劣。

  1. read() 方法
    file.read() 一次性读取整个文件,适用于小文件。
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)
  • 优点:代码简单,可以一次性获取文件所有内容。
  • 缺点:如果文件过大,可能导致内存溢出,尤其是几 GB 或更大的文件。
  1. readline() 方法
    file.readline() 每次读取文件的一行,直到遇到文件末尾。
with open('example.txt', 'r') as file:
    while True:
        line = file.readline()
        if not line:
            break
        print(line.strip())
  • 优点:逐行读取,适合大文件,节省内存。
  • 缺点:相比 iter(),代码略显冗长,且必须手动处理文件结束条件。
  1. readlines() 方法
    file.readlines() 一次性读取所有行,并返回一个包含每行内容的列表。
with open('example.txt', 'r') as file:
    lines = file.readlines()
    for line in lines:
        print(line.strip())
  • 优点:可以直接获取文件所有行的列表,适合小文件。
  • 缺点:与 read() 类似,对于大文件,它会将所有内容加载到内存中,内存占用较大。
  1. iter() 方法
with open('example.txt', 'r') as file:
    for line in iter(file):
        print(line.strip())
  • 优点:简单高效,逐行读取,内存占用少。可以与 for 循环结合,代码更简洁,不需要显式处理文件结束条件。
  • 缺点:相比于 read(),在某些场景下可能需要额外处理数据,比如处理多行同时读取的情况。

原文地址:https://blog.csdn.net/summerriver1/article/details/142682229

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!