【深度学习实战（11）】搭建自己的dataset和dataloader

🕗 发布于 2024-04-21 02:39 深度学习 人工智能

一、dataset和dataloader要点说明

在我们搭建自己的网络时，往往需要定义自己的dataset和dataloader，将图像和标签数据送入模型。
（1）在我们定义dataset时，需要继承torch.utils.data.dataset，再重写三个方法：

init方法，主要用来定义数据的预处理
getitem方法，数据增强；返回数据的item和label
len方法，返回数据数量

（2）在我们定义dataloader时，需要考虑下面几个参数：

dataset :使用哪个数据集
batch_size:将数据集拆成一组多少个进行训练
shuffle:是否需要打乱数据
num_workers：几个mini_batch并行计算，一般<=你的电脑cpu数目
collect_fn：数据打包方式

（3）通过迭代的方式，按批次，获取dataloader中的数据

（4）关系图

在这里插入图片描述

二、核心代码框架

import os
import cv2
from torchvision import transforms
from torch.utils.data.dataset import Dataset
from torch.utils.data import DataLoader


# -------------------------------------------------------------#
#   自定义dataset需要继承torch.utils.data.dataset，
#   再重写def __init__，def __len__，def __getitem__三个方法
# -------------------------------------------------------------#
class YourDataset(Dataset):
    def __init__(self,  root_path):
        super(YourDataset, self).__init__()
        self.root_path = root_path
        #-------------------------------------------------------------------------#
        #   获取样本名，以jpg原始图片为参考，修改后缀名为json，png，获取json，png标签文件路径
        #-------------------------------------------------------------------------#
        self.sample_names = []
        jpg_path = os.path.join(os.path.join(self.root_path, "images"),)
        for file in os.listdir(jpg_path):
            if file.endswith(".jpg"):
                self.sample_names.append(os.path.splitext(file)[0]) # 去掉.json

    def __len__(self):
        #----------------------#
        #   返回数据数量
        #----------------------#
        return len(self.sample_names)

    def __getitem__(self, index):
        name = self.sample_names[index]

        # ----------------------#
        #   读取图像
        # ----------------------#
        img_path = os.path.join(os.path.join(self.root_path, "images"), name + '.jpg')
        image = cv2.imread(img_path)
        # ----------------------#
        #   读取标签
        # ----------------------#
        label_path = os.path.join(os.path.join(self.root_path, "jsons"), name + '.json')
        with open(label_path) as label_file:
            points = self.get_data_from_json(label_file)
        #----------------------#
        #   图像数据增强
        #----------------------#
        image = self.random_color(image)
        #----------------------#
        #   标签归一化
        #----------------------#
        labels = self.convert_labels(points)
        return image,  labels

# -------------------------------------#
#   图片和标签格式转换后，按批次（batch)打包
# -------------------------------------#
def dataloader_collate_fn(batch):
    images = []
    labels = []
    for img, label in batch:
        images.append(transforms.ToTensor()(img))
        labels.append(label)
    return images, labels


if __name__ == '__main__':
    # -------------------------------------#
    #   构建dataset
    # -------------------------------------#
    path = './data/train'
    train_dataset = YourDataset(path)

    # -------------------------------------#
    #   构建Dataloader
    # -------------------------------------#
    dataset = train_dataset
    batch_size = 32
    shuffle = True
    num_workers = 0
    collate_fn = dataloader_collate_fn
    sampler = None
    train_gen = DataLoader(dataset=dataset, shuffle=shuffle, batch_size=batch_size, num_workers=num_workers, pin_memory=True,drop_last=True, collate_fn=collate_fn, sampler=sampler)
    # ---------------------------------------------#
    #   通过迭代的方式，一批一批读取训练集中的图像和标签数据
    # ---------------------------------------------#
    for iter, batch in enumerate(train_gen):
        images,  labels = batch

原文地址：https://blog.csdn.net/m0_51579041/article/details/137988404

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：软件测试基础知识
下一篇：微信小程序自定义导航栏定位及胶囊按钮图解

ubuntu设置自启动
3. 在 /etc/systemd/system/multi-user.target.wants 目录下创建 A.service 的软连接。1. 把要启动的程序或者脚本(比如A.sh、A1)放在 /u
阅读更多2024-11-17
Ubuntu从入门到精通（一）系统安装
本文《Ubuntu从入门到精通（一）》主要介绍Ubuntu系统的安装相关知识。首先，用户需根据需求选择合适的Ubuntu镜像版本。接着，详细阐述了如何下载并安装系统镜像以及必要的恢复工具，确保安装过程
阅读更多2024-11-17
前端开发迈向全栈之路：规划与技能
此外，前端开发还需与后端开发人员合作，通过 API 接口与后端服务器进行数据交互，并关注用户体验设计，优化页面加载速度，确保在不同设备和浏览器上的兼容性。同时，随着云计算和容器化技术的普及，全栈开发人
阅读更多2024-11-17
【机器学习】数学知识：欧式距离（Euclidean Distance）和曼哈顿距离（Manhattan Distance）
欧式距离和曼哈顿距离是两种常用的距离度量方法，用于衡量两点之间的相似性或差异性。它们在几何分析、数据挖掘、机器学习等领域有广泛应用。欧式距离（Euclidean Distance）是最常见的直线距离度
阅读更多2024-11-17
Python sys模块介绍
无论是处理命令行参数、管理输入输出流、添加模块搜索路径，还是获取系统信息和退出程序，sys模块都为我们提供了强大的工具。在Python中， sys模块是一个非常重要的内置模块，它提供了一系列与Pyth
阅读更多2024-11-17
unity3d————Resources同步加载
Resources动态加载资源的方法提高了资源的拓展性和灵活性。相对于拖曳操作，更加一劳永逸、方便快捷。重要知识点熟记和等API的使用方法。注意不同资源类型的加载方式和使用方式。预设体加载后需要实例化
阅读更多2024-11-17
Spring Boot应用中的文件压缩与解压技术实践
在选择压缩算法时，了解各种算法的特点和适用场景至关重要。Gzip：一种广泛使用的无损压缩算法，特别适用于网络传输，因为它能有效减小文件大小，同时保持较高的压缩速度和解压速度。Zip：另一种流行的无损压
阅读更多2024-11-17
【数据结构】快速排序——非递归实现快速排序
内存中分了几个区用于存储数据栈区比较小，堆区比较大我们在递归时是在栈区开辟空间所以当递归深度过深时会有栈溢出的风险有时在某些特定情况下我们担心会栈溢出所以采用非递归的方式就是我们自己来模拟函数在栈上递
阅读更多2024-11-17
JavaSE常用API-日期（计算两个日期时间差-高考倒计时）
JavaSE常用API，LocalDate、LocalTime/LocalDateTime/DateFormatter/Date/SimpleDateformat/Calendar
阅读更多2024-11-17
spring boot 常用参数总结
这些参数直接传递给 JVM，用于控制内存、垃圾回收等。-Xms<size>-Xmx<size>：设置JVM初始堆内存大小。例如，-Xms512m表示初始堆内存为512MB。：设
阅读更多2024-11-17

【深度学习实战（11）】搭建自己的dataset和dataloader

一、dataset和dataloader要点说明

二、核心代码框架

相关文章