python简易应用：去掉重复的项

🕗 发布于 2024-10-03 16:24 python 前端 linux windows labview

txt文件中，有很多ip或域名，相互之间用空格+逗号+空格间隔，要求去掉里面重复的部分，另存为一个新文件。

python代码如下：

# 读取文件并去重
def remove_duplicates(input_file, output_file):
    with open(input_file, 'r') as file:
        # 读取文件内容并拆分成条目
        data = file.read().strip().split(' , ')
    
    # 使用集合去重
    unique_data = set(data)
    
    # 将去重后的数据写入新文件
    with open(output_file, 'w') as file:
        file.write(' , '.join(unique_data))

# 输入和输出文件名
input_file = 'input.txt'  # 替换为你的输入文件名
output_file = 'output.txt'  # 替换为你的输出文件名

# 调用函数
remove_duplicates(input_file, output_file)

将以上内容粘到记事本，另存为后缀为py的文件后，双击即可运行，原文件名为input_file.txt , 输出为output_file.txt

关于win10下如何安装配置python , 前帖有讨论，点此进入！

https://blog.csdn.net/weixin_62598385/article/details/141552019

这个代码的作用是从一个文本文件中读取内容，去掉其中重复的IP和域名，并将去重后的结果写入到另一个文件。下面是对代码的详细解读：

1. `remove_duplicates` 函数

def remove_duplicates(input_file, output_file):

这段代码定义了一个名为 `remove_duplicates` 的函数。它接收两个参数：
- `input_file`：表示需要处理的输入文本文件的文件名。
- `output_file`：表示保存去重后数据的输出文本文件的文件名。

2. 读取文件内容并拆分条目

with open(input_file, 'r') as file:
    data = file.read().strip().split(' , ')

- `open(input_file, 'r')`：以只读模式打开 `input_file` 文件。
- `file.read()`：将整个文件内容读取为一个字符串。
- `strip()`：去除文件内容的首尾空白字符（包括空格、换行符等）。
- `split(' , ')`：将字符串按照 `' , '`（即空格 + 逗号 + 空格）的分隔符进行拆分，结果是一个列表 `data`，其中每个元素都是一个IP地址或域名。

3. 使用集合去重

unique_data = set(data)

`set(data)`：将列表 `data` 转换为集合（`set`），集合是一种无序且不重复的元素集合，这一步会自动去掉 `data` 中的重复项。
- `unique_data` 变量存储了去重后的IP地址和域名。

4. 将去重后的数据写入新文件

with open(output_file, 'w') as file:
    file.write(' , '.join(unique_data))

- `open(output_file, 'w')`：以写模式打开 `output_file` 文件，如果文件不存在则创建该文件。
- `join(unique_data)`：将集合 `unique_data` 中的元素用 `' , '` 连接成一个字符串。
- `file.write()`：将生成的字符串写入到 `output_file` 文件中。

5. 脚本中的输入输出文件名设置

input_file = 'input.txt'  # 替换为你的输入文件名
output_file = 'output.txt'  # 替换为你的输出文件名

- 这两行代码定义了输入和输出文件名。你可以根据实际情况更改为具体的文件路径或文件名。

6. 调用函数

remove_duplicates(input_file, output_file)

- 这一行代码调用了 `remove_duplicates()` 函数，传入上面定义的 `input_file` 和 `output_file`，执行去重操作并生成输出文件。

总结
- 该代码的核心是通过读取输入文件内容并使用集合（`set`）去除重复的IP和域名。
- 最终将处理过的结果写入到指定的输出文件中。

原文地址：https://blog.csdn.net/weixin_62598385/article/details/142656145

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【C++】模拟实现红黑树
下一篇：量化交易里面的挂单成交率大概是多少呢

数据结构——List接口
在集合框架中，List是一个接口，通过其源码，我们可以清楚看到其继承了Collection。Collection 也是一个接口，该接口中规范了后序容器中常用的一些方法，具体如下所示：Iterable也
阅读更多2024-10-06
SpringCloud-基于Docker和Docker-Compose的项目部署
本文详细介绍了如何利用Docker和Docker-Compose实现项目的高效部署。首先，初始化环境，包括卸载旧版本的Docker、更新系统和安装必要的依赖项。然后，设置国内的Docker镜像源（如腾
阅读更多2024-10-06
分布式理论：拜占庭将军问题
拜占庭将军问题是对分布式共识问题的一种情景化描述，由兰伯特于1082首次发表《The Byzantine Generals Problem》中提及，它是分布式领域最复杂的一个容错模型，它描述了如何在
阅读更多2024-10-06
visual studio2022添加新项中没有html和css
重装的vs2022，开发c#项目，但是打开发现添加新项中没有html,也没有css样式表文件
阅读更多2024-10-06
c#里氏替换
/is关键字用于检查对象实际运行时类型，虽然传递了Rectangle子类，也进行了隐式转换，但只是把他当作Shape类对象在方法里去使用，实际的对象信息并没有改变（可以理解为不在方法里了他实际还是Re
阅读更多2024-10-06
一行 Python 代码能实现什么丧心病狂的功能？圣诞树源代码
手头有 109 张头部 CT 的断层扫描图片，我打算用这些图片尝试头部的三维重建。基础工作之一，就是要把这些图片数据读出来，组织成一个三维的数据结构（实际上是四维的，因为每个像素有 RGBA 四个通道
阅读更多2024-10-06
华为OD的职级与薪资
除了月薪（base），华为 OD 也是有年终奖的，年终奖和个人绩效挂钩，绩效为 A 可以拿 4 个月年终，绩效为 B 可以拿 2 个月年终，因此华为 OD 年终奖的范围在 2~4 个月。这几年随着招聘
阅读更多2024-10-06
深度解析：Tkinter 界面布局与优化技巧
pack()grid()和place()，每一种都有其适用场景。选择合适的布局管理器是界面设计的关键步骤。pack()：组件按顺序排列，适用于简单、线性布局。grid()：基于行和列的布局管理器，适合
阅读更多2024-10-06
[单master节点k8s部署]29.Istio流量管理（五）
测试istio熔断管理。采用httpbin镜像和fortio镜像，其中httpbin作为服务端，fortio是请求端。这两个的配置yaml文件都在istio的samples/httpbin目录下，fo
阅读更多2024-10-06
在centos7.9启动docker 18.09.9报错 error initializing graphdriver: overlay2
d_type`是XFS文件系统的一个特性，它允许文件系统直接报告目录项的类型（比如普通文件、目录等），这对于Docker这样的容器运行时来说是很重要的。3. 编辑Docker配置文件（通常是`/etc
阅读更多2024-10-06

python简易应用：去掉重复的项

这个代码的作用是从一个文本文件中读取内容，去掉其中重复的IP和域名，并将去重后的结果写入到另一个文件。下面是对代码的详细解读：

相关文章