Hadoop Pig Latin 无法通过 Python 脚本进行流式传输

发布于 2024-10-31 21:13:53 字数 628 浏览 10 评论 0原文

我有一个简单的 python 脚本（moo.py），我正在尝试流式传输

import sys, os
for line in sys.stdin:
    print 1;

，当我在本地运行此猪脚本（pig -x local）时，我尝试运行此猪脚本

DEFINE CMD `python moo.py` ship('moo.py');
data = LOAD 's3://path/to/my/data/*' AS (a:chararray, b:chararray, c:int, d:int);
res = STREAM data through CMD;
dump res;

，一切都很好，但是当我在没有 -x local 的情况下运行它时，它会打印出此错误

[main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 2017：创建作业配置时发生内部错误。

[日志档案]

原因：java.io.FileNotFoundException：文件moo.py不存在。

有什么想法吗？

原文

I have a simple python script (moo.py) that i am trying to stream though

import sys, os
for line in sys.stdin:
    print 1;

and i try to run this pig script

DEFINE CMD `python moo.py` ship('moo.py');
data = LOAD 's3://path/to/my/data/*' AS (a:chararray, b:chararray, c:int, d:int);
res = STREAM data through CMD;
dump res;

when i run this pig script local (pig -x local) everything is fine,
but when i run it without -x local, it prints out this error

[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2017: Internal error creating job configuration.

[Log file]

Caused by: java.io.FileNotFoundException: File moo.py does not exist.

any idea?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

豆芽 2024-11-07 21:13:53

这很可能是相对路径的问题。

尝试：

DEFINE CMD `python moo.py` ship('/local/path/to/moo.py');

这也可能是读/写/执行权限的问题。

it's most likely an issue of relative path.

try:

DEFINE CMD `python moo.py` ship('/local/path/to/moo.py');

it can also be an issue of read/write/execute permission.

回复收藏 0 原文

心不设防 2024-11-07 21:13:53

问题是我使用了ship()函数而不是cache()
while ship() 工作文件 - 将本地文件从主服务器传递到从服务器
cache() 用于从属设备从可访问的位置获取文件
例如亚马逊上的 s3

希望对任何人有帮助:]

回复收藏 0 原文

~没有更多了~

关于作者

丿*梦醉红颜

暂无简介

文章

24 人气

关注发私信

西西弗的石头怪

文章 0 评论 0

关注

5397313

文章 0 评论 0

关注

烟沫凡尘

文章 0 评论 0

关注

一个破名字

文章 0 评论 0

关注

萌︼了一个春

文章 0 评论 0

关注

当爱已成负担

文章 0 评论 0

友情链接

文江博客

Hadoop Pig Latin 无法通过 Python 脚本进行流式传输

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

Hadoop Pig Latin 无法通过 Python 脚本进行流式传输

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。