Compartir a través de


Crear un Azure Synapse Link para Dataverse con su Azure Synapse Workspace

Puede usar Azure Synapse Link para conectar sus datos de Microsoft Dataverse a Azure Synapse Analytics para explorar sus datos y acelerar el tiempo de conclusión. Este artículo muestra cómo realizar las siguientes tareas:

  1. Conectar sus datos de Dataverse a su área de trabajo de Azure Synapse Analytics con el servicio de Azure Synapse Link.
  2. Administrar tablas de Dataverse incluidas en Azure Synapse Link.
  3. Supervisar su Azure Synapse Link.
  4. Desvincular su Azure Synapse Link.
  5. Volver a vincular su Azure Synapse Link.
  6. Ver los datos en Azure Synapse Analytics.

Nota

Azure Synapse Link para Microsoft Dataverse anteriormente se conocía como Exportación a lago de datos. El servicio cambió de nombre a partir de mayo de 2021 y continuará exportando datos a Azure Data Lake, así como Azure Synapse Analytics.

Requisitos previos

  • Dataverse: debe tener el rol de seguridad de administrador del sistema de Dataverse. Además, las tablas que desee exportar mediante Azure Synapse Link deben tener habilitada la propiedad Control de cambios. Más información: Opciones avanzadas

Requisitos de Azure Data Lake Storage Gen2

Debe tener una cuenta de Azure Data Lake Storage Gen2 y los roles siguientes:

  • Owner
  • Colaborador de datos de blobs de almacenamiento
  • Propietario de datos de blobs de almacenamiento

Requisito de rol de propietario: El rol Propietario es necesario porque agregar la identidad administrada del servicio Azure Synapse Link a la cuenta de almacenamiento es una operación con privilegios. Esta identidad administrada permite al servicio realizar la sincronización desde Dataverse a Synapse. Actualmente, el rol Propietario es necesario y no se admiten roles personalizados con privilegios similares para este paso.

Privilegios para la identidad administrada:

  • Propietario y colaborador de la cuenta de almacenamiento: Solo es necesario durante la configuración inicial para crear el sistema de archivos en la cuenta de almacenamiento y se asignan en la cuenta de almacenamiento. Después de la configuración, estos privilegios se pueden quitar sin afectar a las operaciones de sincronización.
  • Colaborador de datos de blob de almacenamiento: Necesario para las operaciones normales de blob durante la sincronización normal.
  • Propietario de datos de Storage Blob: Actualmente es necesario para administrar los permisos de datos y acceso en escenarios que implican Azure Data Lake Storage Gen2.

La cuenta de almacenamiento debe habilitar el espacio de nombres jerárquico para la configuración inicial y la sincronización diferencial.

Permitir el acceso a la clave de la cuenta de almacenamiento solo es necesario para la configuración inicial, ya que el servicio usa la autorización de clave compartida para realizar operaciones con privilegios, como crear el sistema de archivos y establecer el vínculo antes de cambiar a la autenticación de identidad administrada. Después de la instalación, ya no se necesita acceso basado en claves.

La cuenta de almacenamiento debe tener el ámbito permitido para las operaciones de copia establecidas en Desde cualquier cuenta de almacenamiento.

  • Área de trabajo de Synapse: debe tener un área de trabajo de Synapse y acceso al rol Administrador de Synapse dentro de Synapse Studio. El área de trabajo de Synapse debe estar en la misma región que su cuenta de Azure Data Lake Storage Gen2. La cuenta de almacenamiento debe agregarse como un servicio vinculado dentro de Synapse Studio. Para crear un área de trabajo de Synapse, vaya a Crear un área de trabajo de Synapse.

Nota

  • La cuenta de almacenamiento y el espacio de trabajo de Synapse se debe crear en el mismo inquilino de Microsoft Entra que su inquilino de Power Apps.
  • Para establecer Habilitado desde las redes virtuales y las direcciones IP seleccionadas para la cuenta de almacenamiento y el área de trabajo vinculadas, debe crear un Azure Synapse Link con identidades administradas. Más información: Utilice identidades administradas para Azure con su Azure Data Lake Storage (sin configurar identidades administradas, debe habilitar el acceso a la red pública para recursos de Azure tanto para la configuración inicial como para la sincronización delta).
  • No se admiten espacios de trabajo de Synapse que tengan puntos de conexión privados administrados, protección contra filtración de datos o redes virtuales administradas.
  • Debe tener el rol de acceso Lector en el grupo de recursos con la cuenta de almacenamiento y el espacio de trabajo de Synapse.
  • Cuando agrega varios usuarios al área de trabajo de Synapse, deben tener el acceso al rol Administrador de Synapse dentro de Synapse Studio y el rol Colaborador de datos de blob de almacenamiento en la cuenta de Azure Data Lake Storage Gen2.
  • La creación de perfiles Synapse Link en un único entorno DV está limitada a un máximo de 10.

Conectar Dataverse al área de trabajo de Synapse

  1. Inicie sesión en Power Apps y seleccione el entorno que prefiera.

  2. En el panel de navegación izquierdo, seleccione Azure Synapse Link. Si Azure Synapse Link no está visible en el panel lateral, seleccione …Más y elija Descubrir todo. Seleccione Azure Synapse Link en la sección Administración de datos.

  3. En la barra de comandos, seleccione Nuevo enlace.

  4. Seleccione la opción Conectar a su Azure Synapse workspace.

  5. Seleccione la Suscripción, el Grupo de recursos, el Nombre del área de trabajo y la Cuenta de almacenamiento. Asegúrese de que el área de trabajo y la cuenta de almacenamiento de Synapse cumplan con los requisitos especificados en la sección Requisitos previos. Seleccione Siguiente.

    Conectar al área de trabajo.

    Nota

    Como parte de vincular el entorno a un Data Lake, usted otorga acceso al servicio Azure Synapse Link a su cuenta de almacenamiento. Asegúrese de seguir los prerrequisitos de crear y configurar la cuenta Azure Data Lake Storage y otorgarse un rol de propietario en la cuenta de almacenamiento. Además, otorgue el acceso al servicio de flujo de datos de Power Platform a su cuenta de almacenamiento. Más información Preparación de los datos de autoservicio con flujos de datos.

  6. Elija las tablas que desea exportar seleccionándolas una por una o introduciendo una lista de tablas separadas por comas en el cuadro de búsqueda y, a continuación, seleccione Guardar. Solo las tablas con la propiedad Control de cambios activada pueden exportarse. Más información: Opciones avanzadas.

    Agregue tablas.

Puede seguir los pasos anteriores para crear un enlace desde un entorno a múltiples espacios de trabajo de Azure Synapse Analytics y lagos de datos de Azure en su suscripción de Azure al agregar un lago de datos de Azure como un servicio vinculado en un área de trabajo de Synapse. Del mismo modo, puede crear un enlace desde varios entornos al mismo área de trabajo de Azure Synapse Analytics y lago de datos de Azure, todo dentro del mismo inquilino.

Nota

El servicio Azure Synapse Link para Dataverse se integra perfectamente en Power Platform como una función lista para usar. Cumple con los estándares de seguridad y gobernanza establecidos para el almacenamiento y la gobernanza de datos de Power Platform. Más información: Almacenamiento y gobernanza de datos

Los datos exportados por el servicio Azure Synapse Link se cifran en tránsito mediante la Seguridad de la capa de transporte (TLS) 1.2 o superior y se cifran en reposo en Azure Data Lake Storage Gen2. Además, los datos transitorios en el Blob Storage también se cifran en reposo. El cifrado en Azure Data Lake Storage Gen2 le ayuda a proteger sus datos, implementar políticas de seguridad empresarial y cumplir con los requisitos de cumplimiento normativo. Más información: Cifrado de datos en reposo de Azure Más información: Configurar firewalls y redes virtuales de Azure Storage

Administrar datos de tablas en el espacio de trabajo de Synapse

Una vez que haya configurado Azure Synapse Link, puede administrar las tablas que se exportan de una de estas dos formas:

  • En el área de Power Apps (make.powerapps.com) Azure Synapse Link, seleccione Administrar tablas en la barra de comandos para agregar o eliminar una o más tablas vinculadas.

  • En el área Tablas de Power Apps Maker Portal, seleccione al lado de una tabla y después seleccione el lago de datos vinculado al que desea exportar los datos de la tabla.

    Seleccionar una tabla para la exportación.

Después de configurar Azure Synapse Link, puede supervisar Azure Synapse Link en la pestaña Tablas.

Supervisar un Azure Synapse Link

  • Habrá una lista de tablas que son parte del Azure Synapse Link seleccionado.
  • Hay diferentes etapas por las que circula el estado de sincronización. NotStarted indica que la tabla está esperando ser sincronizada. Una vez que se ha Completado la sincronización inicial de la tabla, habrá una etapa de procesamiento posterior en la que no se realizarán actualizaciones incrementales. Puede tardar varias horas, en función del tamaño de los datos. A medida que comiencen a realizarse las actualizaciones incrementales, la fecha de la última sincronización se actualizará periódicamente.
  • La columna Cuenta muestra el número de filas escritas. Cuando Solo anexar se establece en No, este es el número total de registros. Cuando Solo anexar se establece en , este es el número total de cambios.
  • Las columnas Anexar solo y Estrategia de partición muestran el uso de diferentes configuraciones avanzadas.
  1. Seleccione el Azure Synapse Link que desea desvincular.

  2. Seleccione Desenlazar en la barra de comandos.

  3. Para eliminar tanto el sistema de archivos de Data Lake como la base de datos de Synapse, escriba el nombre del enlace para confirmar.

  4. Seleccione y espere unos minutos para que todo se desvincule y elimine.

Importante

Los objetos de base de datos personalizados que cree dentro de la base de datos de Azure Synapse Link se eliminan una vez que se completa la desvinculación.

Deberá implementar su propio control de versiones de sus scripts de objetos de base de datos personalizados para asegurarse de que tienen una copia de seguridad.

Si eliminó el sistema de archivos al desvincular, siga los pasos anteriores para volver a vincular el mismo espacio de trabajo y data lake de Synapse. Si no eliminó el sistema de archivos al desvincular, debe borrar los datos para volver a vincular:

  1. Navegue a Azure Synapse Analytics.

  2. Seleccione ... para la base de datos desvinculada y seleccione Nuevo cuaderno>Cuaderno vacío.

  3. Adjunte el cuaderno a un grupo de Apache Spark seleccionando un grupo en el menú desplegable. Si no tiene un grupo de Apache Spark, seleccione Administrar grupos para crear uno.

  4. Introduzca el siguiente script, reemplace <DATABASE_NAME> con el nombre de la base de datos para desvincular y ejecutar el cuaderno.

    %%sql
    DROP DATABASE <DATABASE_NAME> CASCADE
  1. Después de ejecutar el cuaderno, actualice la lista de la base de datos desde el panel izquierdo. Si la base de datos aún existe, intente hacer clic derecho en la base de datos y seleccionar Borrar.

  2. Navegue a Power Apps y vuelva a vincular el espacio de trabajo y el lago de datos de Synapse.

Acceda a datos casi en tiempo real y datos de instantáneas de solo lectura

Después de crear un Azure Synapse Link, dos versiones de los datos de la tabla se sincronizarán en Azure Synapse Analytics y/o Azure Data Lake Storage Gen2 en su suscripción de Azure predeterminada para asegurarse de que puede consumir datos actualizados de manera confiable en el lago en cualquier momento:

  • Datos casi en tiempo real: Proporciona una copia de los datos sincronizados desde Dataverse a través de Azure Synapse Link de manera eficiente, detectando qué datos han cambiado desde que se extrajeron inicialmente o se sincronizaron por última vez.
  • Datos de instantánea: proporciona una copia de solo lectura de datos casi en tiempo real que se actualiza a intervalos regulares (en este caso, cada hora). 

Nota

Para crear datos de instantáneas de solo lectura, asegúrese de que la opción Ámbito permitido para operaciones de copia esté configurada en Desde cualquier cuenta de almacenamiento. Más información: Configurar el alcance permitido para las operaciones de copia

  1. Seleccione el Azure Synapse Link deseado y seleccione Ir a espacio de trabajo de Azure Synapse Analytics desde el panel superior.
  2. Expanda las Bases de datos Lake n el panel izquierdo, seleccione dataverse-environmentName-organizationUniqueName y expanda Tablas.

Todas las Tablas de datos casi en tiempo real se enumeran y están disponibles para su análisis con la convención de nomenclatura DataverseTableName. Todas las Tablas de datos instantáneas se enumeran y están disponibles para su análisis con la convención de nomenclatura DataverseTableName_partitioned.

Tablas instantáneas y casi en tiempo real

¿Qué es lo próximo?

Después de usar con éxito el servicio Azure Synapse Link para Dataverse, descubra cómo puede analizar y consumir sus datos con el centro de descubrimiento. Para obtener acceso al Centro de descubrimiento, vaya a Power Apps>Azure Synapse Link. Seleccione su servicio vinculado y luego seleccione el centro de descubrimiento. Aquí puede encontrar herramientas recomendadas y documentación seleccionada para ayudarlo a aprovechar al máximo sus datos. Centro de descubrimiento.

Vea también

Configurar Azure Synapse Link para Dataverse con su Azure Data Lake

Configuración avanzada de Azure Synapse Link para Dataverse

Preguntas más frecuentes de Azure Synapse Link

Blog: Anuncio de Azure Synapse Link para Dataverse