HIVE 中 REGEXP_EXTRACT 正则 提取, 如何实现同一模式多次迭代匹配
希望找出序列中“0”多次(>1)出现的子序列 select REGEXP_EXTRACT('010011000111','(0){2,}',0) 实际返回00(共2个0) 期望返回00000(共5个0) 另…
sqoop 导出mysql到hive失败
问题描述 不胜感激指点 这是执行的导入命令sqoop import-all-tables --connect "jdbc:mysql://0.0.0.0:3306/hwkj_crm?useSSL=false&useUnicode=tr…
Impala使用UDF的时候输入的文本都变问号
同一个UDF在hive下是正常的,但是在impala下,文本都变成了???? 我又写了一个直接打印输入的byte,结果发现impala在进入UDF函数的时候,就已经都…
hive groupby查询报出的找不到jar包问题
虚拟机centos7 搭建hadoop单点伪集群 core-site配置 <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://192…
求教一个Hive SQL
表数据如下: 学生ID 课程ID 分数 1 1 90 1 2 80 1 3 70 2 1 90 2 2 90 2 3 90 3 1 60 需要查出的结果如下: 学生ID 课程ID 分数 1 1,2,3 90,80,70 2…
$SPARK_HOME/conf下配置core-site.xml连接远程hive仓库的HDFS不起作用
问题描述 执行spark-submit [pyspark脚本].py,执行到SQL语句时报连接失败错误,在配置使用远程HDFS的情况下依然尝试连接本地的9000端口,根据此错误…
hive执行oom,OutOfMemoryError: Java heap space
ERROR : FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask. Vertex failed, vertexName=Reducer 5, vertex…
一个hive查询的问题
有一个分区表,里面存放的是 json 文件 查询的时候,总是报错 Failed with exception java.io.IOException:org.apache.hadoop.hdfs.BlockMissingExcept…
hue连接hive时在hue页面上不显示内部表
使用hue连接hive,在hue的界面左侧栏中只显示外部表,内部表不能显示,但是使用show tables是可以显示所有的表,这个问题是什么原因造成的?另外hue页…
python pyhive通过SSH隧道连接hive报错,求解
python pyhive通过SSH隧道连接hive,报错内容为:Could not start SASL: b'Error in sasl_client_start (-4) SASL(-4): no mechanism available: Unab…
hadoop resourcemanager报错 INTERNAL_SERVER_ERROR 如何解决?
问题描述 hive执行mapreduce时卡死或没有速度看日志hadoop resourcemanager报错 2018-07-17 19:17:18,791 WARN org.apache.hadoop.yarn.webapp.Gener…
按照CDH时创建 Hive Metastore 数据库表失败。
安装CDH时,创建 Hive Metastore 数据库表失败: hive/hive.sh ["create_metastore_tables"] ++ false ++ exec /opt/cloudera/parcels/CDH-5.14.0-1.…