如何使用 MRJob 输入多个文件
我正在学习 hadoop 并想在我的脚本中使用两个不同的文件,但我不知道终端中执行此操作的逗号。要读取一个文件,我使用:
python script.py hdfs://dataset/u.data -r hadoop
我也想读取文件 u.item,它位于同一个目录、数据集中。
我尝试 python script.py hdfs:///dataset/u.data hdfs:///dataset/u.item -r hadoop ,但它不起作用
I am leraning hadoop and wanna use two diferent files in my script, but i don`t know the commado in terminal that do this. To read one file I use:
python script.py hdfs://dataset/u.data -r hadoop
I want to read the file u.item too, which is in the same diretory, dataset.
i try python script.py hdfs:///dataset/u.data hdfs:///dataset/u.item -r hadoop
, but it didn`t work
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论