Spark

Spark

文章 222 浏览 116

Spark 的 executor memory 不影响系统的执行效率

我自己搭建了一个 Spark 开发测试环境。配置是 2 CPU,8G 内存,单机 standalone 模式部署。我运行了三次我的ALS程序(数据集每次都一样的),三次运…

我爱人 2022-09-12 02:25:46 27 0

有偿求会用spark分析数据的

分析的内容很少,一个数据表,两列内容,纯论文使用…

强辩 2022-09-12 02:23:59 25 0

NoSuchMethodError: scala.Product.$init$(Lscala/Product;)V

最近在学习大数据,然后使用Scala创建Datasets时,运行代码爆出了如下异常: Exception in thread "main" java.lang.NoSuchMethodError: scala.Produ…

思念满溢 2022-09-12 02:01:01 25 0

Spark分析HugeGraph/JanusGraph/Nebula的时候数据先要从数据库中拿到HDFS中么?

Spark分析HugeGraph/JanusGraph/Nebula的时候数据先要从数据库中拿到HDFS中么?那岂不是很慢?…

烟火散人牵绊 2022-09-12 01:38:09 30 0

leader说Spark不是Hadoop的替代物。哪些方面,Spark不能替代Hadoop?

leader说Spark不是Hadoop的替代物。哪些方面,Spark不能替代Hadoop?…

ぇ气 2022-09-12 01:35:28 31 0

Spark的数据默认是存在HDFS上的么?

1、Spark可以直接读取写入HBase数据库么?需要做哪些工作来实现这件事? 2、hadoop可以直接读取写入HBase数据库么?需要做哪些工作来实现这件事? 3…

孤星 2022-09-12 01:34:30 34 0

Spark可以直接读取写入HBase数据库么?需要做哪些工作来实现这件事?

1、Spark可以直接读取写入HBase数据库么?需要做哪些工作来实现这件事? 2、hadoop可以直接读取写入HBase数据库么?需要做哪些工作来实现这件事? 3…

满栀 2022-09-12 01:33:35 35 0

spark shuffle算子拉取数据到一个节点处理完毕后按照什么机理在把数据分发到不同的节点上?

spark shuffle算子拉取数据到一个节点处理完毕后按照什么机理在把数据分发到不同的节点上?…

如此安好 2022-09-12 01:24:20 31 0

Spark 或 hadoop里 map 和 reduce 操作的区别?

Spark 里 map 和 reduce 操作的区别?…

萌梦深 2022-09-12 01:24:11 26 0

spark.excutor.instance 和 spark.excutor.cores 有什么区别?

spark.excutor.instance 和 spark.excutor.cores 有什么区别?…

不念旧人 2022-09-12 01:04:49 17 0

scala项目打包出现object java.lang.Object in compiler mirror not found

maven打包出现scala.reflect.internal.MissingRequirementError: object java.lang.Object in compiler mirror not found. 执行 maven clean package…

雾里花 2022-09-12 00:42:01 17 0

spark 的aggregate 函数查询出的数据不对? 好像是线程不安全的? 该怎么处理

最后结果是30 ,错误的; 在shell上可以得到正确的结果 …

超可爱的懒熊 2022-09-12 00:11:55 22 0

scala、spark,cannot resolve reference XXX with such signature

目前还是scala方面的小白,遇到问题毫无头绪,也没法提出明确的问题。下面是根据ALS算法做出推荐的代码案例。我的实际需求比案例代码多出一个子公司的…

中二柚 2022-09-11 23:14:30 24 0

python开发,spark接收kafka的输入流时

import cv2 import sys import findspark findspark.init() from kafka import KafkaConsumer from pyspark import SparkContext from pyspark.strea…

沉鱼一梦 2022-09-11 22:39:45 26 0

SparkSql调用hive Insert语句执行超级慢

问题描述 在使用Spark SQL 执行 sparkseccion.sql("insert overwrite table xxxx partition(date_time) select * from zzzz") 的时候,非常慢,大约…

伴随着你 2022-09-11 22:39:44 22 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文