使用 Notebook 活动来运行您在 Microsoft Fabric 中创建的 notebooks,作为数据工厂管道的一部分。 笔记本 允许运行 Apache Spark 作业,以引入、清理或转换数据作为数据工作流的一部分。 要在 Fabric 中的管道里添加 Notebook 活动非常简单,本指南将逐步引导您完成整个过程。
先决条件
如果要开始,必须满足以下先决条件:
- 要访问具有已预配容量的Microsoft Fabric租户,您必须拥有访问权限。 可以使用免费试用版try Fabric。
- 分配给该容量的 Fabric workspace。
- 在工作区中创建了笔记本。 若要创建新笔记本,请参阅 如何创建Microsoft Fabric笔记本。
创建笔记本活动
在工作区中创建新管道。
在管道的“活动”窗格中搜索“笔记本”,然后将其添加到管道画布上。
在画布上选择新的笔记本活动(如果尚未选择)。
若要配置“常规”设置选项卡,请参阅“常规”设置指导。
配置笔记本设置
选择 “设置” 选项卡。
在 “连接”下,选择笔记本运行的身份验证方法并提供所需的凭据。
从 “笔记本” 下拉列表中选择现有笔记本,并根据需要指定要传递给笔记本的任何参数。
在 Notebook 活动中使用Fabric工作区标识(WI)
创建工作区标识
必须在工作区中启用 WI(这可能需要一点时间才能加载)。 在Fabric工作区中创建工作区标识。 请注意,WI 应在与您的管道相同的工作区内创建。
查看有关 工作区标识的文档。
启用租户级设置
启用以下租户设置(默认禁用):服务主体可以调用Fabric公共 API.
可以在 Fabric 管理门户中启用此设置。 有关此设置的详细信息,请参阅 为管理员 API 启用服务主体身份验证一文。
向工作区标识授予工作区权限
打开工作区,选择“管理访问权限”,并向工作区标识分配权限。 贡献者访问权限足以满足大多数场景。 如果笔记本与管道不在同一工作区,您需要将在管道工作区创建的WI至少赋予贡献者权限,以访问笔记本工作区。
查看有关 授予用户对工作区的访问权限的文档。
设置会话标记
为了尽量减少执行笔记本作业所需的时间,可以选择设置会话标签。 设置会话标记会指示 Spark 重复使用任何现有的 Spark 会话,从而最大限度地减少启动时间。 会话标签可以使用任意字符串值。 如果不存在会话,将使用标记值创建一个新会话。
注意
为了能够使用会话标签,必须启用对运行多个笔记本的管道使用高并发模式的选项。 可在工作区设置下的 Spark 高并发模式设置下找到此选项
保存并运行或调度管道
切换到管道编辑器顶部的“ 开始 ”选项卡,然后选择保存按钮以保存管道。 选择 “运行 ”以直接运行,或 计划 以按特定时间或间隔计划运行。 有关管道运行的详细信息,请参阅: 计划管道运行。
运行后,可以从画布下方的“ 输出 ”选项卡监视管道执行并查看运行历史记录。
已知问题
- 使用服务主体运行包含语义链接代码的笔记本具有功能限制,并且仅支持语义链接功能的子集。 有关详细信息,请参阅 支持的语义链接函数 。 若要使用其他功能,建议 使用服务主体手动对语义链接进行身份验证。