你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
适用于:
Azure 数据工厂
Azure Synapse Analytics
提示
试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用!
重要
2026 年 1 月 1 日,你将无法再使用 ADF 的工作流业务流程管理器创建新的 Airflow 实例。 建议在 2025 年 12 月 31 日之前将所有工作流业务流程管理器(Azure 数据工厂 中的 Apache Airflow)工作负荷迁移到 Microsoft Fabric 中的 Apache Airflow 作业 。
有关在使用 Microsoft Fabric 迁移到 Apache Airflow 期间获取更多信息或技术支持,请联系微软技术支持。
Azure 数据工厂中的工作流编排管理器使用基于 Python 的有向无环图 (DAG) 来运行业务流程工作流。 要使用此功能,需要在 Azure Blob 存储中或通过 GitHub 存储库提供 DAG 和插件。 可以使用命令行界面 (CLI) 或软件开发工具包 (SDK) 从 ADF 启动 Airflow UI 以管理 DAG。
创建工作流编排管理器环境
请参考:创建工作流编排管理器环境
导入 DAG
工作流编排管理器提供了两种不同的方法,用于将 python 源文件中的 DAG 加载到 Airflow 的环境中。 这些方法包括:
启用 Git 同步:此服务允许将 GitHub 存储库与工作流编排管理器同步,使你能够直接从 GitHub 存储库导入 DAG。 请参考:在工作流编排管理器中同步 GitHub 存储库
Azure Blob 存储:可以将 DAG、插件等上传到与 Azure 数据工厂链接的 Blob 存储帐户中的指定文件夹。 然后,在工作流编排管理器中导入文件夹的文件路径。 请参阅:使用 Azure Blob 存储导入 DAG
从 Airflow 环境中删除 DAG
请参考:在工作流编排管理器中删除 DAG
监视 DAG 运行
要监视 Airflow DAG,请使用之前创建的用户名和密码登录 Airflow UI。
选择创建的 Airflow 环境。
使用创建 Airflow Integration Runtime 期间提供的用户名-密码登录。 (如果需要,可以通过编辑 Airflow Integration Runtime 来重置用户名或密码)
排查导入 DAG 问题
问题:DAG 导入需要超过 5 分钟的时间 缓解措施:通过单次导入减小导入的 DAG 的大小。 实现此目的的一种方法是在多个容器中创建多个具有较少 DAG 的 DAG 文件夹。
问题:登录 Airflow UI 时,导入的 DAG 不显示。 缓解措施:登录 Airflow UI 并查看是否存在任何 DAG 解析错误。 如果 DAG 文件包含任何不兼容的代码,就会发生这种情况。 通过 Airflow UI 找到存在问题的确切行号和文件。