使用hue api注册hive udf
如何使用HUE API注册UDF? 我正在使用下面的代码,但无法注册它。 Query query1=new Query("create temporary function calculate as 'com.sample.MYU…
Brisk cassandra TimeUUIDType
我用的是轻快的。 cassandra 列族自动映射到 Hive 表。 但是,如果列族中的数据类型为 timeuuid,则在 Hive 表中不可读。 例如,我使用以下命令在 hiv…
RDBMS 和 Hive 有什么区别?
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题吗?通过编辑这篇文章来更新问题,使其…
实时查询/聚合数百万条记录 - hadoop?数据库?卡桑德拉?
我有一个可以并行化的解决方案,但我(还)没有 hadoop/nosql 的经验,并且我不确定哪种解决方案最适合我的需求。理论上,如果我有无限的 CPU,我的结…
如何使用 Hive 对大数据进行高效排序(order by)?
我想有效地对大数据集进行排序(即使用自定义分区器,如下所述:MapReduce排序算法是如何工作的?),但我想用hive来实现。 然而,Hive手册指出“orde…
hive :从分布式缓存中删除内容
我可以通过向分布式缓存添加内容 add file largelookuptable ,然后运行一堆 HQL。 现在,当我有一系列命令时,如下所示, add file largelookuptable…
sqoop导入完成但hive显示表看不到表
安装hadoop、hive(CDH版本)后我执行 ./sqoop import -connect jdbc:mysql://10.164.11.204/server -username root -password password -table user …
在 Maven 项目中使用 Hive
我有一个项目正在从 ant 迁移到 Maven。该项目使用轻度定制的 Hive 构建。我想我只需将此构建导入到我们的内部 Maven 存储库中,并将其列为项目 pom …
Hive (Hadoop) 中的 COLLECT_SET()
我刚刚了解了 Hive 中的collect_set() 函数,并开始了开发 3 节点集群的工作。 我只有大约 10 GB 需要处理。然而,这项工作确实需要很长时间。我认为c…
Hive - 从 zip 文件创建表
我有一堆 CSV 的 zip 文件,我想从中创建 Hive 表。我正在尝试找出最好的方法是什么。 解压文件,上传到HDFS。 有没有办法将文件复制到 HDFS,解压 或…
一步步遵循 Hive apache wiki 时的 Hive 安装问题
按照 Hive apache wiki 上的说明一步步安装 Hive 后,我调用 hive shell 并输入“CREATE TABLE pokes (foo INT, bar STRING);”,然后出现以下错误,…
如何配置hive服务器以远程模式运行?
我将 hive 包添加到我的 hadoop 集群中。如果我进入 hive cli,我可以在远程模式下运行 hive。但是通过 hive 服务器的查询以本地模式运行,这非常慢..…
在配置单元中支持外部表的数组列类型的最佳方法是什么?
所以我有制表符分隔数据的外部表。一个简单的表格如下所示: create external table if not exists categories (id string, tag string, legid string…