通过


通过运行笔记本转换数据

使用 Notebook 活动来运行您在 Microsoft Fabric 中创建的 notebooks,作为数据工厂管道的一部分。 笔记本 允许运行 Apache Spark 作业,以引入、清理或转换数据作为数据工作流的一部分。 要在 Fabric 中的管道里添加 Notebook 活动非常简单,本指南将逐步引导您完成整个过程。

先决条件

如果要开始,必须满足以下先决条件:

  • 要访问具有已预配容量的Microsoft Fabric租户,您必须拥有访问权限。 可以使用免费试用版try Fabric
  • 分配给该容量的 Fabric workspace

创建笔记本活动

  1. 在工作区中创建新管道。

  2. 在管道的“活动”窗格中搜索“笔记本”,然后将其添加到管道画布上。

    Fabric UI的截图,其中活动窗格和笔记本活动被突出显示。

  3. 在画布上选择新的笔记本活动(如果尚未选择)。

    屏幕截图显示笔记本活动的“常规”设置选项卡。

    若要配置“常规”设置选项卡,请参阅常规”设置指导。

配置笔记本设置

选择 “设置” 选项卡。

“连接”下,选择笔记本运行的身份验证方法并提供所需的凭据。

“笔记本” 下拉列表中选择现有笔记本,并根据需要指定要传递给笔记本的任何参数。

屏幕截图显示“笔记本”设置选项卡,并突出显示用于选择笔记本和用于添加参数的选项卡。

在 Notebook 活动中使用Fabric工作区标识(WI)

  1. 创建工作区标识

    必须在工作区中启用 WI(这可能需要一点时间才能加载)。 在Fabric工作区中创建工作区标识。 请注意,WI 应在与您的管道相同的工作区内创建。

    查看有关 工作区标识的文档。

  2. 启用租户级设置

    启用以下租户设置(默认禁用):服务主体可以调用Fabric公共 API.

    可以在 Fabric 管理门户中启用此设置。 有关此设置的详细信息,请参阅 为管理员 API 启用服务主体身份验证一文

  3. 向工作区标识授予工作区权限

    打开工作区,选择“管理访问权限”,并向工作区标识分配权限。 贡献者访问权限足以满足大多数场景。 如果笔记本与管道不在同一工作区,您需要将在管道工作区创建的WI至少赋予贡献者权限,以访问笔记本工作区。

    查看有关 授予用户对工作区的访问权限的文档。

设置会话标记

为了尽量减少执行笔记本作业所需的时间,可以选择设置会话标签。 设置会话标记会指示 Spark 重复使用任何现有的 Spark 会话,从而最大限度地减少启动时间。 会话标签可以使用任意字符串值。 如果不存在会话,将使用标记值创建一个新会话。

屏幕截图显示“笔记本设置”选项卡,其中突出显示了可在其中添加会话标签的选项卡。

注意

为了能够使用会话标签,必须启用对运行多个笔记本的管道使用高并发模式的选项。 可在工作区设置下的 Spark 高并发模式设置下找到此选项

屏幕截图显示工作区设置选项卡,其中突出显示了用于为运行多个笔记本的管道启用高并发模式的选项卡。

保存并运行或调度管道

切换到管道编辑器顶部的“ 开始 ”选项卡,然后选择保存按钮以保存管道。 选择 “运行 ”以直接运行,或 计划 以按特定时间或间隔计划运行。 有关管道运行的详细信息,请参阅: 计划管道运行

屏幕截图显示管道编辑器中的“开始”选项卡,并突出显示了选项卡名称、“保存”、“运行”和“计划”按钮。

运行后,可以从画布下方的“ 输出 ”选项卡监视管道执行并查看运行历史记录。

已知问题