запись данных Apache Спарк Delta Lake, используя анализ кода и принцип реализации
Дельта озеро запись данные являются самой основной функцией, и его использование и существующего Спарк запись Паркетных файлы в основном тем же, перед введением принципов реализации Delta Lake взглянуть на то, как она используется, конкретное применение следующим образом:
df.write.format("delta").save("/data/yangping.wyp/delta/test/")
//数据按照 dt 分区
df.write.format("delta").partitionBy("dt").save("/data/yangping.wyp/delta/test/")
// 覆盖之前的数据
df.write.format("delta").mode(SaveMode.Overwrite).save("/data/ya