Pig与Cassandra集成:简单的分布式查询只需几分钟即可完成。这是正常的吗?
我设置了 Cassandra + Pig/Hadoop 的测试集成。 8 个节点是 Cassandra + TaskTracker 节点,1 个节点是 JobTracker/NameNode。 我启动了 cassandra 客…
与 apache Pig 拉丁语中的 GROUP 相反?
假设我在 apache pig 中有以下输入: (123, ( (1, 2), (3, 4) ) ) (666, ( (8, 9), (10, 11), (3, 4) ) ) 并且我想将这 2 行转换为以下 7 行: (123, …
删除“字符串表达式”的过程/代码是什么?使用 Apache Pig 从文件中获取?
A = load '/home/wrdtest.txt'; B = foreach A generate flatten(TOKENIZE((chararray)$0)) as word; C = filter B by word != 'the'; D = group C by…
无法从 apache Pig 中的地图中提取值
我在 Apache Pig 中有一个简单的关系 v: dump v; (151364,[ 'ref'#'R813','highway'#'secondary', 'name:ga'#'Lána Chairdif', 'name'#'Cardiff Lane…
apache pig 中的子查询
寻找有关在 apache pig 中编写子查询的一些帮助。例如,我有以下两个关系 - A sam 12 grad maths sony 13 postgrad english B maths {(4.5,sam),(4,da…
将 PIG 与 cassandra 结合使用的限制
我打算将 PIG 与 cassandra 一起使用来进行查询。 我为此目的安装了《皮格马利翁》。 我过去在 HIVE 上做了一些工作,这显然有查询语言的限制。 我们…
Apache Pig,程序运行问题
REGISTER /home/hadoop/pigg/trunk/contrib/piggybank/java/piggybank.jar; -- Use the PigStorage function to load the excite log file into the r…
安装 Apache Pig 时,为什么我看到 Hbase 和 Hive 正在安装?
我正在从 本 教程安装 Apache Pig 的 Piggybank。 当我使用 ant 构建源代码时,我观察到它正在安装 apache hive 和 hbase。 谁能告诉我为什么这样做?…
嵌入式 hadoop-pig:使用 UDF 自动 addContainingJar 的正确方法是什么?
当您使用pigServer.registerFunction时,您不应该显式调用pigServer.registerJar,而是让pig使用jarManager.findContainingJar自动检测jar。 然而,我…
我们如何使用 Apache Pig 处理未格式化的数据?
我想使用 Apache Pig,但到目前为止我刚刚解析了 csv 或逗号分隔等格式化数据。 但是如果我有一些用 ';' 分隔的数据& '@&@' 等,我该如何使用它? 就…
在 Java (Pig) Regex 中,我该如何执行以下操作?
我的数据来自一个由管道分隔的 txt 文件。不幸的是 2 个字段可以有多个值。为了分隔这些倍数,发送者再次使用管道,但在其周围加上引号。我的正则表达…
Hadoop Pig ISO 日期转 Unix 时间戳
我在 Pig 中有一个由 ISO 8601 (YYYY-MM-DD) 格式的日期字符串组成的项目列表: (2011-12-01) (2011-12-01) (2011-12-02) 除了在 Java 中实现我自己的…
是否可以使用 Whirr 在 EC2 上创建包含 Hbase、Hive 和 Pig 的 Hadoop 集群
是否可以使用 Whirr 在 Amazon EC2 上创建一个包含 Hbase、Hive 和 Pig 的 Hadoop 集群?…
使用 Cassandra 在 Java 中嵌入 Pig:无法向后查看流中的多个标记
我正在本地模式下从 Java 运行一个 pig (0.9.1) 脚本,该脚本从 Cassandra (1.0.6) 获取记录。该脚本是: rows = LOAD 'cassandra://Keyspace/Data' U…