如何使用 MRJob 输入多个文件

发布于 2025-01-18 13:37:46 字数 266 浏览 1 评论 0原文

我正在学习 hadoop 并想在我的脚本中使用两个不同的文件,但我不知道终端中执行此操作的逗号。要读取一个文件,我使用:

python script.py hdfs://dataset/u.data -r hadoop

我也想读取文件 u.item,它位于同一个目录、数据集中。

我尝试 python script.py hdfs:///dataset/u.data hdfs:///dataset/u.item -r hadoop ,但它不起作用

I am leraning hadoop and wanna use two diferent files in my script, but i don`t know the commado in terminal that do this. To read one file I use:

python script.py hdfs://dataset/u.data -r hadoop

I want to read the file u.item too, which is in the same diretory, dataset.

i try python script.py hdfs:///dataset/u.data hdfs:///dataset/u.item -r hadoop, but it didn`t work

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文