Spark兼容狭窄数据的数据质量框架
我正在尝试在a 格式。 像这样 传感器 时间戳 值 A 12251 12 B 12262 ” A 看起来 图片 “ 的 数 : 十亿 行 数据 值。 我正在为这些数据构建数据质量…
如何在 Deequ 包中传递直方图的基数阈值?
默认情况下,变量 default_cardinality_threshold 设置为120 deequ。对于我们的用例,这很低。 任何人都可以建议我们是否可以将此值设置为更高的数字…
PyDeequ hasPattern 失败并显示“PatternMatch”;对象没有属性“_Check”;
我正在尝试使用 PyDeequ 运行模式检查“hasPattern()”的示例代码,但失败并出现异常 代码: import pydeequ from pyspark.sql import SparkSession, …
推断类型参数 [_$1] 不符合方法类型参数边界
我有一个案例类: case class AnomalyCheckConfigBuilder[S <: State[S]](anomalyDetectionStrategy: AnomalyDetectionStrategy, analyzer: Analyzer[…
- 共 1 页
- 1