调spark sql hive报错了 : serious problem

发布于 2022-01-03 20:01:35 字数 3948 浏览 831 评论 1

: HiveConf of name hive.strict.checks.cartesian.product does not exist
Exception in thread "main" org.apache.spark.sql.catalyst.errors.package$TreeNodeException: execute, tree:
Exchange SinglePartition
+- *HashAggregate(keys=[], functions=[partial_count(1)], output=[count#48L])
+- HiveTableScan CatalogRelation `default`

at org.apache.spark.sql.execution.WholeStageCodegenExec.doExecute(WholeStageCodegenExec.scala:386)
   at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$1.apply(SparkPlan.scala:117)
   at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$1.apply(SparkPlan.scala:117)
   at org.apache.spark.sql.execution.SparkPlan$$anonfun$executeQuery$1.apply(SparkPlan.scala:138)
   at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
   at org.apache.spark.sql.execution.SparkPlan.executeQuery(SparkPlan.scala:135)
   at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:116)
   at org.apache.spark.sql.execution.SparkPlan.getByteArrayRdd(SparkPlan.scala:228)
   at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:311)
   at org.apache.spark.sql.execution.CollectLimitExec.executeCollect(limit.scala:38)
   at org.apache.spark.sql.Dataset.org$apache$spark$sql$Dataset$$collectFromPlan(Dataset.scala:2853)
   at org.apache.spark.sql.Dataset$$anonfun$head$1.apply(Dataset.scala:2153)
   at org.apache.spark.sql.Dataset$$anonfun$head$1.apply(Dataset.scala:2153)
   at org.apache.spark.sql.Dataset$$anonfun$55.apply(Dataset.scala:2837)
   at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:65)
   at org.apache.spark.sql.Dataset.withAction(Dataset.scala:2836)
   at org.apache.spark.sql.Dataset.head(Dataset.scala:2153)
   at org.apache.spark.sql.Dataset.take(Dataset.scala:2366)
   at org.apache.spark.sql.Dataset.showString(Dataset.scala:245)
   at org.apache.spark.sql.Dataset.show(Dataset.scala:644)
   at org.apache.spark.sql.Dataset.show(Dataset.scala:603)
   at org.apache.spark.sql.Dataset.show(Dataset.scala:612)
   at ML.SparkSql.main(SparkSql.java:63)
Caused by: java.lang.RuntimeException: serious problem
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1021)
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.getSplits(OrcInputFormat.java:1048)
   at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:194)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
   at scala.Option.getOrElse(Option.scala:121)
   at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
   at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
   at scala.Option.getOrElse(Option.scala:121)
   at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
   at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.s

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

秉烛思 2022-01-04 23:09:06

HiveConf of name hive.vectorized.input.format.excludes does not exist
2020-02-24 10:23:39,462 WARN --- [main] org.apache.hadoop.hive.conf.HiveConf(line:2753) : HiveConf of name hive.strict.checks.bucketing does not exist
2020-02-24 10:23:39,463 WARN --- [main] org.apache.hadoop.hive.conf.HiveConf(line:2753) : HiveConf of name hive.strict.checks.type.safety does not exist
2020-02-24 10:23:39,463 WARN --- [main] org.apache.hadoop.hive.conf.HiveConf(line:2753) : HiveConf of name hive.strict.checks.cartesian.product does not exist
Exception in thread "main" java.lang.RuntimeException: serious problem
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1021)
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.getSplits(OrcInputFormat.java:1048)
   at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:194)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
   at scala.Option.getOrElse(Option.scala:121)
   at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
   at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
   at scala.Option.getOrElse(Option.scala:121)
   at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
   at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
   at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
   at scala.Option.getOrElse(Option.scala:121)
   at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
   at org.apache.spark.rdd.UnionRDD$$anonfun$1.apply(UnionRDD.scala:84)
   at org.apache.spark.rdd.UnionRDD$$anonfun$1.apply(UnionRDD.scala:84)
   at scala.collection.parallel.AugmentedIterableIterator$class.map2combiner(RemainsIterator.scala:115)
   at scala.collection.parallel.immutable.ParVector$ParVectorIterator.map2combiner(ParVector.scala:62)
   at scala.collection.parallel.ParIterableLike$Map.leaf(ParIterableLike.scala:1054)
   at scala.collection.parallel.Task$$anonfun$tryLeaf$1.apply$mcV$sp(Tasks.scala:49)
   at scala.collection.parallel.Task$$anonfun$tryLeaf$1.apply(Tasks.scala:48)
   at scala.collection.parallel.Task$$anonfun$tryLeaf$1.apply(Tasks.scala:48)
   at scala.collection.parallel.Task$class.tryLeaf(Tasks.scala:51)
   at scala.collection.parallel.ParIterableLike$Map.tryLeaf(ParIterableLike.scala:1051)
   at scala.collection.parallel.AdaptiveWorkStealingTasks$WrappedTask$class.internal(Tasks.scala:169)
   at scala.collection.parallel.AdaptiveWorkStealingForkJoinTasks$WrappedTask.internal(Tasks.scala:443)
   at scala.collection.parallel.AdaptiveWorkStealingTasks$WrappedTask$class.compute(Tasks.scala:149)
   at scala.collection.parallel.AdaptiveWorkStealingForkJoinTasks$WrappedTask.compute(Tasks.scala:443)
   at scala.concurrent.forkjoin.RecursiveAction.exec(RecursiveAction.java:160)
   at scala.concurrent.forkjoin.ForkJoinTask.doExec(ForkJoinTask.java:260)
   at scala.concurrent.forkjoin.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:1339)
   at scala.concurrent.forkjoin.ForkJoinPool.runWorker(ForkJoinPool.java:1979)
   at scala.concurrent.forkjoin.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:107)
Caused by: java.lang.NullPointerException
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$BISplitStrategy.getSplits(OrcInputFormat.java:560)
   at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1010)
   ... 35 more