Пользовательский аккумулятор Spark Аккумулятор

вставьте сюда описание изображения

1. Аккумулятор

В Spark аккумулятор — это специальная переменная, используемая для накопления результатов всех задач в общую переменную. Аккумуляторы в Spark особенно хорошо подходят для операций «суммирования», таких как подсчет и суммирование.

Основные характеристики и области применения аккумуляторов следующие:

  1. Глобальный : Аккумулятор — это переменная, используемая всеми задачами. Каждая задача может добавлять данные в аккумулятор, но только драйвер может получить доступ к значению аккумулятора.

  2. Параллелизм и эффективность : Spark гарантирует, что каждый аккумулятор обновляется только один раз для каждой задачи, что позволяет избежать ненужных накладных расходов на связь.

  3. Отказоустойчивость : если задача не удалась, Spark автоматически пересчитает и обновит значение аккумулятора.

  4. Часто используется для отладки и мониторинга . Аккумуляторы можно использовать для простого мониторинга и отладки состояния приложения Spark.

Обратите внимание, что обновление аккумулятора выполняется в операциях действия (например,col

Supongo que te gusta

Origin blog.csdn.net/m0_47256162/article/details/132380917
Recomendado
Clasificación