为什么Pytorch创建另一个数据repro torchdata

发布于 2025-01-27 10:39:49 字数 173 浏览 3 评论 0原文

为什么Pytorch创建另一个称为torchdata的Repro，用于相似/新 dataset 和dataloader，而不是在现有的pytorch repro中添加它们？ 数据集和datapipe有什么区别？谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烟凡古楼 2025-02-03 10:39:49

torchdata是一个通用模块化数据加载原语的库，用于轻松构建灵活和性能的数据管道。

它的目的是提供可合并的Itable style和map-style构建块，称为dataPipes，它们可以与Pytorch的数据载体一起使用。它包含功能性，可以重现火炬和火炬文字中的许多不同数据集，即加载，解析，缓存以及其他几个实用程序（例如检查）。

datapipe只是用于组合用法的pytorch数据集的重命名和重新应用。 DataPipe通过Python数据结构接收一些访问功能，__ Iter __用于iterdatapipes 和__ getitem __ getitem __ for MapDataPipes，并返回一个新的访问功能应用转换。