获取ORC文件格式错误“它与指定格式不匹配”在蜂巢中
我正在尝试以兽人格式写入数据,并遇到以下错误。 Job failed with message [pyspark.sql.utils.AnalysisException: The format of the existing tabl…
CTE的Parseerror -Hive
CTE给出了parseerror: ParseException行1:42在语句中“ cust_xref_id”附近的“期望” with table1 as (select 2020.cust_xref_id as 2020_cust, 201…
我们可以在蜂巢的镶板和外部表格中有不同的模式吗?
在Hive外部表和Parquet文件中,我们可以拥有多种数据类型,但列名称相同? 例如,我可以在镶木quet文件中的所有字段中都有文本并将蜂巢表中的数据类型…
阅读雅典娜的Json Field
列值 [[[1652336534,860,0],[1652343704,51,0],[1652345322,24,0],[1652349754,70,0] ]列需要哪种数据类型来读取此类型的JSON数组。…
我如何在数据映中创建带有Hive格式的外部表格
我有一个外部表,蜂巢中的格式下面。 CREATE EXTERNAL TABLE cs_mbr_prov( key struct, memkey string, ob_id string, ..... ) ROW FORMAT SERDE 'org…
为什么DBT在CLI中运行,但在云UI上为完全相同的模型丢弃了错误?
我正在执行 dbt run -s model_name ,任务成功完成。但是,当我在DBT云上运行完全相同的命令时,我会发现此错误: Syntax or semantic analysis error…
由于own_task_failure,FailedTasks:1 althTasks:0,Vertex pertex_16520744645349_0075_3_3_01 [MAP 1]
ERROR : FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask. Vertex failed, vertexName=Map 1, vertexId=ve…
列值未正确传递给Hive UDF Spark Scala
我创建了一个像下面的蜂巢UDF一样, Class customUdf extends UDF{ def evaluate(col : String): String = { return col + "abc" } } 然后我在Sparkse…
Hive SQL Regexp_extract(编号)_(编号)
我是HIVEQL的新手,我正在尝试从 col_a 从数据 df 中提取值:该格式: \\\“ ID \\\”:\\\“ 101_12345 \\\” 我只需要提取 101_12345 ,但是下划线…
蜂巢查询以找到转化率
我正在尝试使用Hive的查询,但它无法正常工作。 select ( ( select count(*) from click_streaming where page_id= 'e7bc5fb2-1231-11eb-adc1-0242ac1…
HDFS产生的Hive提取太慢,因为太多的映射任务,当执行Hive SQL查询时,我该如何合并查询结果
Hive查询在“/tmp/hive/hive”中产生太多结果文件,接近4W任务。 因此,我想知道是否有一种方法可以在查询之后合并结果,减少结果文件的数量并提高提…
Hive SQL:如何与其他表加入时如何创建标志出现
我想检查我的成员是否来自表B中的表A?这是问题A和表B具有数百万记录,并且表B具有重复的记录。这样我就不能离开加入。运行需要数小时。 表A 表B utpu…
从Hive/Spark中选择XML的值
我有XML: 2022-01-01 USA New York 我想在XPATH上选择“纽约”,但是当我编写此查询时: 选择XPATH_STRING(正文,'info/infofield [3]/@name')我的…