DataLoaders - 在数据集上包装一个可迭代对象意味着什么?
我正在阅读 Dataloaders 的官方文档:
https://pytorch.org/tutorials/beginner/basics/data_tutorial.html
并且有这样一句话“DataLoader 围绕数据集包装了一个可迭代对象..”
我知道数据加载器用于迭代数据集,但我不明白的是包装一个可迭代对象是什么?超过数据集意味着什么?我想要了解理论观点。
I am reading the official documentation of Dataloaders:
https://pytorch.org/tutorials/beginner/basics/data_tutorial.html
And there is this sentence "DataLoader wraps an iterable around the Dataset.."
I know that dataloaders are used to iterate over the dataset but what I don't get is that what does wrapping an iterable over the dataset means? I want an insight of the theoretical point of view.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这句话的意思是DataLoader可以用来迭代Dataset的内容。例如,如果您有一个包含 1000 个图像的数据集,您可以按照某些属性存储在数据集中的顺序迭代某些属性,而无需单独迭代其他属性。另一方面,包装该数据集的 DataLoader 允许您批量迭代数据、洗牌数据、应用函数、示例数据等。只需在
torch.utils.data.DataLoader
和您将看到包含的所有选项。The sentence means that a DataLoader can be used to iterate the contents of a Dataset. For example, if you've got a Dataset of 1000 images, you can iterate certain attributes in the order that they've been stored in the Dataset and nothing else by itself. In the other hand, a DataLoader that wraps that Dataset allows you to iterate the data in batches, shuffle the data, apply functions, sample data, etc. Just checkout the Pytorch docs on
torch.utils.data.DataLoader
and you'll see all of the options included.