запись данных Apache Спарк Delta Lake, используя анализ кода и принцип реализации

запись данных Apache Спарк Delta Lake, используя анализ кода и принцип реализации

Дельта озеро запись данные являются самой основной функцией, и его использование и существующего Спарк запись Паркетных файлы в основном тем же, перед введением принципов реализации Delta Lake взглянуть на то, как она используется, конкретное применение следующим образом:

df.write.format("delta").save("/data/yangping.wyp/delta/test/")
 
//数据按照 dt 分区
df.write.format("delta").partitionBy("dt").save("/data/yangping.wyp/delta/test/")
 
// 覆盖之前的数据
df.write.format("delta").mode(SaveMode.Overwrite).save("/data/ya

рекомендация

отyq.aliyun.com/articles/719419