Airflow 中文文档:Lineage

注意

Lineage 支持是非常实验性的,可能会发生变化。

Airflow可以帮助跟踪数据的来源,发生的事情以及数据随时间的变化。 这有助于实现审计跟踪和数据治理,还可以调试数据流。

气流通过任务的入口和出口跟踪数据。 让我们从一个例子开始,看看它是如何工作的。

 from airflow.operators.bash_operator import BashOperator
from airflow.operators.dummy_operator import DummyOperator
from airflow.lineage.datasets import File
from airflow.models import DAG
from datetime import timedelta

FILE_CATEGORIES = [ "CAT1" , "CAT2" , "CAT3" ]

args = {
    'owner' : 'airflow' ,
    'start_date' : airflow . utils . dates . days_ago ( 2 )
}

阅读全文/改进本文

猜你喜欢

转载自blog.csdn.net/wizardforcel/article/details/84637393