1 驱动日志——问题原因
如任务因为超过最大试错次数spark.task.maxFailures
导致失败等。
理解:通常可作为问题诊断的出发点。
此案例的原因为执行器失联。
1 统计聚合函数除以零问题
统计聚合函数:std, stddev, stddev_samp, variance, var_samp, skewness, kurtosis, covar_samp, corr
版本<3.1, 返回nan;版本="">=3.1,返回NULL。3.1,>
返回NaN设置spark.sql.legacy.statisticalAggregate为true。
适用于版本日期20210710。
OverlayFS是一个现代的union filesystem,相较AUFS更加简单高效。Docker提供了两个版本:overlay和overlay2(推荐)。