Compartir a través de


tablas de Azure Databricks

Azure Databricks admite varios tipos de tabla y formatos de almacenamiento para satisfacer diferentes necesidades de administración de datos. Para obtener información general sobre los tipos de tabla, los formatos de almacenamiento y la integración del catálogo de Unity, consulte Azure Databricks conceptos de tablas.

Tipos de tablas

Explore diferentes tipos de tabla y sus funcionalidades para diversos escenarios de administración de datos.

Tipo de tabla Description
Tablas gestionadas por Unity Catalog en Azure Databricks para Delta Lake y Apache Iceberg Azure Databricks administra los metadatos y los archivos de datos para las nuevas tablas que requieren un rendimiento optimizado.
Tablas temporales Tablas administradas por el Unity Catalog con alcance de sesión para datos intermedios. Solo almacenes de datos SQL.
Trabajar con tablas externas Datos almacenados en sistemas externos. El catálogo de Unity solo administra los metadatos.
Trabajar con tablas externas Acceso de solo lectura a los datos de sistemas externos conectados a través de la federación de Lakehouse.

Formatos de almacenamiento

Trabaje con formatos de tabla abiertos que admiten funcionalidades avanzadas de administración de datos.

Formato Description
Delta Lake Formato predeterminado de almacenamiento con transacciones ACID, viaje en el tiempo e imposición de esquemas para tablas administradas y externas.
Apache Iceberg Abra el formato de tabla para la integración con el ecosistema de Iceberg, lo que admite la administración avanzada de metadatos.

Administración de tablas

Configure y optimice el comportamiento, la estructura y el rendimiento de las tablas.

Característica Description
Restricciones de tabla Defina y aplique reglas de calidad de datos con restricciones check y no restricciones NULL.
Aplicación de esquemas Controlar cómo Azure Databricks controla los cambios de esquema y la aplicación del tipo de datos durante las escrituras.
Creación de particiones de tablas Organice los datos mediante claves de partición para mejorar el rendimiento de las consultas y la administración de datos.
Supervisión del tamaño de tabla Supervise y analice los patrones de uso y crecimiento de Table Storage.
Convertir externo a administrado Migre tablas externas a tablas administradas para mejorar el rendimiento y la administración.
Detección de particiones externas Detectar y registrar automáticamente particiones en tablas externas almacenadas en el almacenamiento en la nube.