OutputPortBinding Clase
Define una salida con nombre de un paso de canalización.
OutputPortBinding se puede usar para especificar el tipo de datos que se producirán paso a paso y cómo se generarán los datos. Se puede usar con InputPortBinding para especificar que la salida del paso es una entrada necesaria de otro paso.
Inicialice OutputPortBinding.
Constructor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parámetros
| Nombre | Description |
|---|---|
|
name
Requerido
|
Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado. |
|
datastore
|
Almacén de datos en el que residirá PipelineData. Valor predeterminado: None
|
|
output_name
|
Nombre de la salida, si se usa Ninguno. Solo puede contener letras, dígitos y caracteres de subrayado. Valor predeterminado: None
|
|
bind_mode
|
Especifica si el paso de producción usará el método "upload" o "mount" o "hdfs" para acceder a los datos. Valor predeterminado: mount
|
|
path_on_compute
|
Para el modo de "carga", la ruta de acceso en la que el módulo escribe la salida. Valor predeterminado: None
|
|
is_directory
|
Si la salida es un directorio o un único archivo. Valor predeterminado: None
|
|
overwrite
|
Para el modo de "carga", si se van a sobrescribir los datos existentes. Valor predeterminado: None
|
|
data_type
|
Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo usar los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario. Valor predeterminado: None
|
|
pipeline_output_name
|
Si se proporciona esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización. Valor predeterminado: None
|
|
training_output
|
Define la salida para el resultado de entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como Métricas y Modelo. Por ejemplo, AutoMLStep da como resultado métricas y modelo. También puede definir una iteración o métrica de entrenamiento específica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida. Valor predeterminado: None
|
|
dataset_registration
|
Opcional. Se trata de un parámetro interno. Debe usar PipelineData.as_dataset en su lugar. Valor predeterminado: None
|
|
dataset_output
|
Opcional. Se trata de un parámetro interno. Debe usar OutputFileDatasetConfig intead. Valor predeterminado: None
|
|
name
Requerido
|
Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado. |
|
datastore
Requerido
|
Almacén de datos en el que residirá PipelineData. |
|
output_name
Requerido
|
Nombre de la salida, si se usa Ninguno. Solo puede contener letras, dígitos y caracteres de subrayado. |
|
bind_mode
Requerido
|
Especifica si el paso de producción usará el método "upload" o "mount" o "hdfs" para acceder a los datos. |
|
path_on_compute
Requerido
|
Para el modo de "carga", la ruta de acceso en la que el módulo escribe la salida. |
|
is_directory
Requerido
|
si la salida es un directorio |
|
overwrite
Requerido
|
Para el modo de "carga", si se van a sobrescribir los datos existentes. |
|
data_type
Requerido
|
Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo usar los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario. |
|
pipeline_output_name
Requerido
|
Si se proporciona esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización. |
|
training_output
Requerido
|
Define la salida para el resultado de entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como Métricas y Modelo. Por ejemplo, AutoMLStep da como resultado métricas y modelo. También puede definir una iteración o métrica de entrenamiento específica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida. |
|
dataset_registration
Requerido
|
Opcional. Se trata de un parámetro interno. Debe usar PipelineData.as_dataset en su lugar. |
|
dataset_output
Requerido
|
Opcional. Se trata de un parámetro interno. Debe usar OutputFileDatasetConfig intead. |
Comentarios
OutputPortBinding se puede usar de forma similar PipelineData a al compilar una canalización para especificar entradas y salidas de paso. La diferencia es OutputPortBinding con el fin de consumirse InputPortBinding como entrada en otro paso.
Un ejemplo para construir una canalización con OutputPortBinding es el siguiente:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Esto creará una canalización con dos pasos. El paso de proceso se ejecutará primero y, después de que se haya completado, se ejecutará el paso de entrenamiento. Azure ML proporcionará la salida generada por el paso de proceso, tal como se describe en el objeto OutputPortBinding, en el paso de entrenamiento.
Atributos
bind_mode
Obtenga el modo ("cargar" o "montar" o "hdfs") que usará el paso de producción para crear los datos.
Devoluciones
| Tipo | Description |
|---|---|
|
Modo de enlace. |
data_type
Obtenga el tipo de datos que se producirán.
Devoluciones
| Tipo | Description |
|---|---|
|
Nombre del tipo de datos. |
dataset_registration
Obtenga la información de registro del conjunto de datos.
Devoluciones
| Tipo | Description |
|---|---|
|
Información de registro del conjunto de datos. |
datastore
Almacén de datos en el que residirá PipelineData.
Devoluciones
| Tipo | Description |
|---|---|
|
Objeto Almacén de datos. |
is_directory
name
overwrite
Para el modo de "carga", indique si se van a sobrescribir los datos existentes.
Devoluciones
| Tipo | Description |
|---|---|
|
_sobrescribir |
path_on_compute
Para el modo de "carga", la ruta de acceso en la que el módulo escribe la salida.
Devoluciones
| Tipo | Description |
|---|---|
|
path_on_compute |
pipeline_output_name
Obtenga el nombre de la salida de canalización correspondiente a outputPortBinding.
Devoluciones
| Tipo | Description |
|---|---|
|
Nombre de salida de la canalización. |
training_output
Obtenga la salida del entrenamiento.
Devoluciones
| Tipo | Description |
|---|---|
|
Salida de entrenamiento |