当前位置：文江博客话题详情

Pytorch分布式数据加载器

发布于 2025-01-26 22:24:13 字数 147 浏览 4 评论 0原文

有什么推荐的方法使Pytorch DataLoader（torch.utils.data.dataloader）在分布式环境，单个机器和多台机器中工作吗？可以没有distributeDataParallear可以完成吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

红焚 2025-02-02 22:24:13

也许您需要清楚您的问题。 distributeDataParallel被缩写为ddp，您需要在分布式环境中使用ddp训练模型。这个问题似乎询问如何安排数据集加载过程进行分布式培训。

首先，

data.dataloader适用于DIST和非待命培训，通常无需在此上做某事。

但是采样策略在这两种模式下有所不同，您需要为数据加载器指定一个采样器（sampler in data.dataloader），采用torch.utils .data.distributed.distributedsampler是最简单的方法。

回复收藏 0 原文

~没有更多了~

关于作者

伏妖词

暂无简介

文章

29 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

Pytorch分布式数据加载器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者