Compartir a través de


DataReference Clase

Representa una referencia a los datos de un almacén de datos.

DataReference representa una ruta de acceso en un almacén de datos y se puede usar para describir cómo y dónde deben estar disponibles los datos en una ejecución. Ya no es el enfoque recomendado para el acceso a datos y la entrega en Azure Machine Learning. El conjunto de datos admite el acceso a datos desde Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database y Azure Database for PostgreSQL mediante una interfaz unificada con funcionalidades de administración de datos agregadas. Se recomienda usar el conjunto de datos para leer datos en los proyectos de aprendizaje automático.

Para más información sobre cómo usar el conjunto de datos de Azure ML en dos escenarios comunes, consulte los artículos:

Constructor Class DataReference.

Constructor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
datastore
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
str

Nombre de la referencia de datos.

Valor predeterminado: None
path_on_datastore
str

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

Valor predeterminado: None
mode
str

Operación en la referencia de datos. Los valores admitidos son "mount" (el valor predeterminado) y "download".

Use el modo "descargar" cuando el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) para los datos de entrada. En este caso, especifique la ruta de acceso con el path_on_compute parámetro al declarar DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

Con el modo "montaje", se crea un directorio temporal con los datos montados y una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> se establece con la ruta de acceso al directorio temporal. Si pasa dataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

Valor predeterminado: mount
path_on_compute
str

Ruta de acceso en el destino de proceso para la referencia de datos.

Valor predeterminado: None
overwrite

Indica si se deben sobrescribir los datos existentes.

Valor predeterminado: False
datastore
Requerido

El almacén de datos al que se hace referencia.

data_reference_name
Requerido
str

Nombre de la referencia de datos.

path_on_datastore
Requerido
str

La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos.

mode
Requerido
str

Operación en la referencia de datos. Valores admitidos 'mount' (el valor predeterminado) y 'download'.

Use el modo "descargar" cuando el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) para los datos de entrada. En este caso, especifique la ruta de acceso con el path_on_compute parámetro al declarar DataReference. Azure Machine Learning descargará los datos especificados por esa ruta de acceso antes de ejecutar el script.

Con el modo "montaje", se crea un directorio temporal con los datos montados y una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> se establece con la ruta de acceso al directorio temporal. Si pasa dataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución.

path_on_compute
Requerido
str

Ruta de acceso en el destino de proceso para la referencia de datos.

overwrite
Requerido

Indica si se deben sobrescribir los datos existentes.

Comentarios

DataReference define la ubicación de los datos y cómo se usan los datos en el enlace de proceso de destino (montaje o carga). La ruta de acceso a los datos del almacén de datos puede ser la raíz /, un directorio dentro del almacén de datos o un archivo del almacén de datos.

Métodos

as_download

Cambie la operación de referencia de datos para descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Cambie la operación de referencia de datos al montaje.

El montaje de DataReference solo admite Azure Blob. Para montar datos en azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2 se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Cambie la operación de referencia de datos para cargar.

Para obtener más información sobre qué procesos y almacenes de datos admiten la carga de los datos, vea: https://aka.ms/datastore-matrix.

create

Cree una dataReference mediante DataPath y DataPathComputeBinding.

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

as_download

Cambie la operación de referencia de datos para descargar.

La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
path_on_compute
str

Ruta de acceso del proceso para la referencia de datos.

Valor predeterminado: None
overwrite

Indica si se deben sobrescribir los datos existentes.

Valor predeterminado: False

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

as_mount

Cambie la operación de referencia de datos al montaje.

El montaje de DataReference solo admite Azure Blob. Para montar datos en azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2 se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

as_upload

Cambie la operación de referencia de datos para cargar.

Para obtener más información sobre qué procesos y almacenes de datos admiten la carga de los datos, vea: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parámetros

Nombre Description
path_on_compute
str

Ruta de acceso del proceso para la referencia de datos.

Valor predeterminado: None
overwrite

Indica si se deben sobrescribir los datos existentes.

Valor predeterminado: False

Devoluciones

Tipo Description

Nuevo objeto de referencia de datos.

create

Cree una dataReference mediante DataPath y DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parámetros

Nombre Description
data_reference_name
str

Nombre de la referencia de datos que se va a crear.

Valor predeterminado: None
datapath

[Obligatorio] Ruta de acceso a datos que se va a usar.

Valor predeterminado: None
datapath_compute_binding

[Obligatorio] Enlace de proceso de ruta de datos que se va a usar.

Valor predeterminado: None

Devoluciones

Tipo Description

Objeto DataReference.

path

Cree una instancia de DataReference basada en la ruta de acceso especificada.

path(path=None, data_reference_name=None)

Parámetros

Nombre Description
path
str

Ruta de acceso en el almacén de datos.

Valor predeterminado: None
data_reference_name
str

Nombre de la referencia de datos.

Valor predeterminado: None

Devoluciones

Tipo Description

Objeto de referencia de datos.

to_config

Convierta el objeto DataReference en el objeto DataReferenceConfiguration.

to_config()

Devoluciones

Tipo Description

Nuevo objeto DataReferenceConfiguration.