使用 Hadoop Hive 从 OLTP Mysql 制作 OLAP
我对 Hadoop hive 有点困惑,我从 Wiki 上读到它用于制作 OLAP。 现在我想从使用 Mysql 的 OLTP 数据库在 Hive 上进行 OLAP。 我该如何解决这个问题?…
理论上在 Hive 中可以实现并置连接 (a-la-netezza) 吗?
当您连接分布在同一键上的表并在连接条件中使用这些键列时,netezza 中的每个 SPU(机器)将 100% 独立于其他设备工作(请参阅 nz-interview)。 在 h…
使用hue api注册hive udf
如何使用HUE API注册UDF? 我正在使用下面的代码,但无法注册它。 Query query1=new Query("create temporary function calculate as 'com.sample.MYU…
Brisk cassandra TimeUUIDType
我用的是轻快的。 cassandra 列族自动映射到 Hive 表。 但是,如果列族中的数据类型为 timeuuid,则在 Hive 表中不可读。 例如,我使用以下命令在 hiv…
RDBMS 和 Hive 有什么区别?
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题吗?通过编辑这篇文章来更新问题,使其…
实时查询/聚合数百万条记录 - hadoop?数据库?卡桑德拉?
我有一个可以并行化的解决方案,但我(还)没有 hadoop/nosql 的经验,并且我不确定哪种解决方案最适合我的需求。理论上,如果我有无限的 CPU,我的结…
如何使用 Hive 对大数据进行高效排序(order by)?
我想有效地对大数据集进行排序(即使用自定义分区器,如下所述:MapReduce排序算法是如何工作的?),但我想用hive来实现。 然而,Hive手册指出“orde…
hive :从分布式缓存中删除内容
我可以通过向分布式缓存添加内容 add file largelookuptable ,然后运行一堆 HQL。 现在,当我有一系列命令时,如下所示, add file largelookuptable…
sqoop导入完成但hive显示表看不到表
安装hadoop、hive(CDH版本)后我执行 ./sqoop import -connect jdbc:mysql://10.164.11.204/server -username root -password password -table user …
在 Maven 项目中使用 Hive
我有一个项目正在从 ant 迁移到 Maven。该项目使用轻度定制的 Hive 构建。我想我只需将此构建导入到我们的内部 Maven 存储库中,并将其列为项目 pom …
Hive (Hadoop) 中的 COLLECT_SET()
我刚刚了解了 Hive 中的collect_set() 函数,并开始了开发 3 节点集群的工作。 我只有大约 10 GB 需要处理。然而,这项工作确实需要很长时间。我认为c…
Hive - 从 zip 文件创建表
我有一堆 CSV 的 zip 文件,我想从中创建 Hive 表。我正在尝试找出最好的方法是什么。 解压文件,上传到HDFS。 有没有办法将文件复制到 HDFS,解压 或…
一步步遵循 Hive apache wiki 时的 Hive 安装问题
按照 Hive apache wiki 上的说明一步步安装 Hive 后,我调用 hive shell 并输入“CREATE TABLE pokes (foo INT, bar STRING);”,然后出现以下错误,…