DataReference Clase
Representa una referencia a los datos de un almacén de datos.
DataReference representa una ruta de acceso en un almacén de datos y se puede usar para describir cómo y dónde deben estar disponibles los datos en una ejecución. Ya no es el enfoque recomendado para el acceso a datos y la entrega en Azure Machine Learning. El conjunto de datos admite el acceso a datos desde Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database y Azure Database for PostgreSQL mediante una interfaz unificada con funcionalidades de administración de datos agregadas. Se recomienda usar el conjunto de datos para leer datos en los proyectos de aprendizaje automático.
Para más información sobre cómo usar el conjunto de datos de Azure ML en dos escenarios comunes, consulte los artículos:
- Creación y ejecución de canalizaciones de aprendizaje automático
- Creación de estimadores en el entrenamiento
Constructor Class DataReference.
Constructor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parámetros
| Nombre | Description |
|---|---|
|
datastore
Requerido
|
El almacén de datos al que se hace referencia. |
|
data_reference_name
|
Nombre de la referencia de datos. Valor predeterminado: None
|
|
path_on_datastore
|
La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos. Valor predeterminado: None
|
|
mode
|
Operación en la referencia de datos. Los valores admitidos son "mount" (el valor predeterminado) y "download". Use el modo "descargar" cuando el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) para los datos de entrada.
En este caso, especifique la ruta de acceso con el Con el modo "montaje", se crea un directorio temporal con los datos montados y una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> se establece con la ruta de acceso al directorio temporal. Si pasa dataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución. Valor predeterminado: mount
|
|
path_on_compute
|
Ruta de acceso en el destino de proceso para la referencia de datos. Valor predeterminado: None
|
|
overwrite
|
Indica si se deben sobrescribir los datos existentes. Valor predeterminado: False
|
|
datastore
Requerido
|
El almacén de datos al que se hace referencia. |
|
data_reference_name
Requerido
|
Nombre de la referencia de datos. |
|
path_on_datastore
Requerido
|
La ruta de acceso relativa del almacenamiento de seguridad para la referencia de datos. |
|
mode
Requerido
|
Operación en la referencia de datos. Valores admitidos 'mount' (el valor predeterminado) y 'download'. Use el modo "descargar" cuando el script espera una ruta de acceso específica (por ejemplo, codificada de forma rígida) para los datos de entrada.
En este caso, especifique la ruta de acceso con el Con el modo "montaje", se crea un directorio temporal con los datos montados y una variable de entorno $AZUREML_DATAREFERENCE_<data_reference_name> se establece con la ruta de acceso al directorio temporal. Si pasa dataReference a la lista de argumentos de un paso de canalización (por ejemplo, PythonScriptStep), la referencia se expandirá a la ruta de acceso de datos local en tiempo de ejecución. |
|
path_on_compute
Requerido
|
Ruta de acceso en el destino de proceso para la referencia de datos. |
|
overwrite
Requerido
|
Indica si se deben sobrescribir los datos existentes. |
Comentarios
DataReference define la ubicación de los datos y cómo se usan los datos en el enlace de proceso de destino (montaje o carga). La ruta de acceso a los datos del almacén de datos puede ser la raíz /, un directorio dentro del almacén de datos o un archivo del almacén de datos.
Métodos
| as_download |
Cambie la operación de referencia de datos para descargar. La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
| as_mount |
Cambie la operación de referencia de datos al montaje. El montaje de DataReference solo admite Azure Blob. Para montar datos en azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2 se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
| as_upload |
Cambie la operación de referencia de datos para cargar. Para obtener más información sobre qué procesos y almacenes de datos admiten la carga de los datos, vea: https://aka.ms/datastore-matrix. |
| create |
Cree una dataReference mediante DataPath y DataPathComputeBinding. |
| path |
Cree una instancia de DataReference basada en la ruta de acceso especificada. |
| to_config |
Convierta el objeto DataReference en el objeto DataReferenceConfiguration. |
as_download
Cambie la operación de referencia de datos para descargar.
La descarga de DataReference solo admite Azure Blob y Azure File Share. Para descargar datos de Azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2, se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_download(path_on_compute=None, overwrite=False)
Parámetros
| Nombre | Description |
|---|---|
|
path_on_compute
|
Ruta de acceso del proceso para la referencia de datos. Valor predeterminado: None
|
|
overwrite
|
Indica si se deben sobrescribir los datos existentes. Valor predeterminado: False
|
Devoluciones
| Tipo | Description |
|---|---|
|
Nuevo objeto de referencia de datos. |
as_mount
Cambie la operación de referencia de datos al montaje.
El montaje de DataReference solo admite Azure Blob. Para montar datos en azure Blob, Azure File Share, Azure Data Lake Gen1 y Azure Data Lake Gen2 se recomienda usar el conjunto de datos de Azure Machine Learning. Para obtener más información sobre cómo crear y usar el conjunto de datos, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount()
Devoluciones
| Tipo | Description |
|---|---|
|
Nuevo objeto de referencia de datos. |
as_upload
Cambie la operación de referencia de datos para cargar.
Para obtener más información sobre qué procesos y almacenes de datos admiten la carga de los datos, vea: https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parámetros
| Nombre | Description |
|---|---|
|
path_on_compute
|
Ruta de acceso del proceso para la referencia de datos. Valor predeterminado: None
|
|
overwrite
|
Indica si se deben sobrescribir los datos existentes. Valor predeterminado: False
|
Devoluciones
| Tipo | Description |
|---|---|
|
Nuevo objeto de referencia de datos. |
create
Cree una dataReference mediante DataPath y DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parámetros
| Nombre | Description |
|---|---|
|
data_reference_name
|
Nombre de la referencia de datos que se va a crear. Valor predeterminado: None
|
|
datapath
|
[Obligatorio] Ruta de acceso a datos que se va a usar. Valor predeterminado: None
|
|
datapath_compute_binding
|
[Obligatorio] Enlace de proceso de ruta de datos que se va a usar. Valor predeterminado: None
|
Devoluciones
| Tipo | Description |
|---|---|
|
Objeto DataReference. |
path
Cree una instancia de DataReference basada en la ruta de acceso especificada.
path(path=None, data_reference_name=None)
Parámetros
| Nombre | Description |
|---|---|
|
path
|
Ruta de acceso en el almacén de datos. Valor predeterminado: None
|
|
data_reference_name
|
Nombre de la referencia de datos. Valor predeterminado: None
|
Devoluciones
| Tipo | Description |
|---|---|
|
Objeto de referencia de datos. |
to_config
Convierta el objeto DataReference en el objeto DataReferenceConfiguration.
to_config()
Devoluciones
| Tipo | Description |
|---|---|
|
Nuevo objeto DataReferenceConfiguration. |