是否可以使用 Whirr 在 EC2 上创建包含 Hbase、Hive 和 Pig 的 Hadoop 集群
是否可以使用 Whirr 在 Amazon EC2 上创建一个包含 Hbase、Hive 和 Pig 的 Hadoop 集群?…
使用 Cassandra 在 Java 中嵌入 Pig:无法向后查看流中的多个标记
我正在本地模式下从 Java 运行一个 pig (0.9.1) 脚本,该脚本从 Cassandra (1.0.6) 获取记录。该脚本是: rows = LOAD 'cassandra://Keyspace/Data' U…
猪拉丁翻译器java
我正在开发一个猪拉丁语翻译器,它将给定的单词翻译成猪拉丁语。这里是pig Latin 方法和isVowel 方法。 public static void pigLatin(String s) { cha…
使用 Pig 有效合并 2 个已排序的文件
我的 HDFS 2 数据集具有完全相同的结构,都按相同的键排序。我想将它们合并成一个按该键排序的大数据集。 现在我知道pig有一个有效的合并连接(http:/…
Hadoop Pig排序结果;找到订单位置?
我想对我的猪结果进行排序,然后能够确定某些项目在我的排序结果中的位置。示例: mydata = LOAD 'mydata.txt' AS (label:chararray, rank_score:floa…
Pig Cassandra集群ClassNotFoundException:org.apache.cassandra.hadoop.ColumnFamilySplit
我正在尝试运行 Cassandra-0.8.5、Hadoop 0.2.0 和 Pig 0.8.1。我运行一个非常简单的猪脚本,因为 rows = LOAD 'cassandra://pygmalion/$CF' USING Ca…
存储 Pig 输出时出现语法错误
我在将猪输出存储到文件时遇到一些问题。这是我用来存储的: '将相关内容存储到'简单'中; ' 如果我转储 'rel' 我得到: >(car,0.5,(door,tire,jello,…
将 C++ 中的句子转换为 Pig Latin
我是一个初学者,我无法找出一种有效或不太复杂的方法来使这个程序工作。 我需要采用数组形式的句子(通过 cin.getline)并编写一个函数,将其转换为…
Java 或 Pig 正则表达式从 UserAgent 字符串中删除值
我需要删除用户代理字符串的“括号”部分中的第三个及后续值。 为了得到 Mozilla/4.0(兼容;MSIE 8.0) ) Mozilla/4.0(兼容;MSIE 8.0;Windows NT…
在 Elastic Map Reduce 上使用带有 Pig 的分布式缓存
我正在尝试在 Amazon 的 Elastic Map Reduce 上运行我的 Pig 脚本(使用 UDF)。 我需要使用 UDF 中的一些静态文件。 我在我的 UDF 中做了类似的事情…
Pig 通过带有导入模块的 python 脚本进行流式传输
使用 Pigtmp$ pig --version Apache Pig 版本 0.8.1-cdh3u1(重新导出) 编译于 2011 年 7 月 18 日,08:29:40 我有一个 python 脚本 (c-python),它…
如何将pig bag保存为json格式
我 example$ pig --version Apache Pig version 0.8.1-cdh3u1 (rexported) compiled Jul 18 2011, 08:29:40 在非常简单的数据集上 example$ hadoop fs…