创建自定义数据集功能时拆分图像

发布于 2025-02-10 02:48:50 字数 962 浏览 1 评论 0原文

我有5000x5000x3尺寸的图像，我想将图像分为多个较小的图像。我试图创建具有分裂图像的数据集。但是它占据了更多的空间，管理这些图像是非常繁琐的任务。然后，我尝试创建一条管道，在训练时拆分图像。但是，如何将其作为Pytorch自定义数据集类别进行混淆。

import os
import pandas as pd
from torchvision.io import read_image

class CustomImageDataset(Dataset):
    def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
          self.img_labels = pd.read_csv(annotations_file)
          self.img_dir = img_dir
          self.transform = transform
          self.target_transform = target_transform

   def __len__(self):
         return len(self.img_labels)

  def __getitem__(self, idx):
        img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
        image = read_image(img_path)
        label = self.img_labels.iloc[idx, 1]
        if self.transform:
            image = self.transform(image)
        if self.target_transform:
            label = self.target_transform(label)
        return image, label

原文

I have 5000x5000X3 sized images, I want to split image into multiple smaller images. I have tried to create dataset with splitted images. But it occupies more space and is very tedious task to manage those images. Then I tried to create a pipeline where images are split while training. But confused with how to implement it as pytorch custom dataset class.

import os
import pandas as pd
from torchvision.io import read_image

class CustomImageDataset(Dataset):
    def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
          self.img_labels = pd.read_csv(annotations_file)
          self.img_dir = img_dir
          self.transform = transform
          self.target_transform = target_transform

   def __len__(self):
         return len(self.img_labels)

  def __getitem__(self, idx):
        img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
        image = read_image(img_path)
        label = self.img_labels.iloc[idx, 1]
        if self.transform:
            image = self.transform(image)
        if self.target_transform:
            label = self.target_transform(label)
        return image, label

分享到QQ

分享到微博