AksServiceDeploymentConfiguration Clase
Representa una información de configuración de implementación para un servicio implementado en Azure Kubernetes Service.
Cree un objeto AksServiceDeploymentConfiguration mediante el deploy_configuration método de la AksWebservice clase .
Inicialice un objeto de configuración para implementarlo en un destino de proceso de AKS.
Constructor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parámetros
| Nombre | Description |
|---|---|
|
cpu_cores_limit
Requerido
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. |
|
memory_gb_limit
Requerido
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. |
|
autoscale_enabled
Requerido
|
Indica si se va a habilitar el escalado automático para este servicio web.
El valor predeterminado es True si |
|
autoscale_min_replicas
Requerido
|
El número mínimo de contenedores que se van a usar al escalar automáticamente este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_max_replicas
Requerido
|
Número máximo de contenedores que se van a usar al escalar automáticamente este servicio web. El valor predeterminado es 10 |
|
autoscale_refresh_seconds
Requerido
|
Con qué frecuencia el escalador automático debe intentar escalar este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_target_utilization
Requerido
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para este servicio web. El valor predeterminado es 70. |
|
collect_model_data
Requerido
|
Si se va a habilitar o no la recopilación de datos del modelo para este servicio web. El valor predeterminado es False. |
|
auth_enabled
Requerido
|
Si se va a habilitar o no la autenticación para este servicio web. El valor predeterminado es True. |
|
cpu_cores
Requerido
|
Número de núcleos de CPU que se van a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0.1 |
|
memory_gb
Requerido
|
Cantidad de memoria (en GB) que se va a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0,5 |
|
enable_app_insights
Requerido
|
Si se va a habilitar o no el registro de Application Insights para este servicio web. El valor predeterminado es False. |
|
scoring_timeout_ms
Requerido
|
Tiempo de espera para exigir llamadas de puntuación a este servicio web. El valor predeterminado es 60000. |
|
replica_max_concurrent_requests
Requerido
|
Número de solicitudes simultáneas máximas por réplica que permiten este servicio web. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. |
|
max_request_wait_time
Requerido
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. |
|
num_replicas
Requerido
|
Número de contenedores que se van a asignar para este servicio web. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. |
|
primary_key
Requerido
|
Clave de autenticación principal que se va a usar para este servicio web. |
|
secondary_key
Requerido
|
Clave de autenticación secundaria que se va a usar para este servicio web. |
|
tags
Requerido
|
Diccionario de etiquetas de valor de clave para proporcionar este servicio web. |
|
properties
Requerido
|
Diccionario de propiedades de valor de clave para proporcionar este servicio web. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. |
|
description
Requerido
|
Descripción para proporcionar este servicio web. |
|
gpu_cores
Requerido
|
Número de núcleos de GPU que se van a asignar para este servicio web. El valor predeterminado es 0. |
|
period_seconds
Requerido
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. |
|
initial_delay_seconds
Requerido
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. |
|
timeout_seconds
Requerido
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. |
|
success_threshold
Requerido
|
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. |
|
failure_threshold
Requerido
|
Cuando se inicia un pod y se produce un error en el sondeo de ejecución, Kubernetes intentará |
|
namespace
Requerido
|
Espacio de nombres de Kubernetes en el que se va a implementar este servicio web: hasta 63 caracteres alfanuméricos en minúsculas ('a'-'z', '0'-'9') y guiones ('-'). Los caracteres primero y último no pueden ser guiones. |
|
token_auth_enabled
Requerido
|
Si se va a habilitar o no la autenticación de Azure Active Directory para este servicio web. Si esto está habilitado, los usuarios pueden acceder a este servicio web mediante la captura del token de acceso mediante sus credenciales de Azure Active Directory. El valor predeterminado es False. |
|
cpu_cores_limit
Requerido
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. |
|
memory_gb_limit
Requerido
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. |
|
blobfuse_enabled
|
Si se va a habilitar blobfuse para la descarga de modelos para este servicio web. El valor predeterminado es True Valor predeterminado: None
|
|
autoscale_enabled
Requerido
|
Indica si se va a habilitar el escalado automático para este servicio web.
El valor predeterminado es True si |
|
autoscale_min_replicas
Requerido
|
El número mínimo de contenedores que se van a usar al escalar automáticamente este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_max_replicas
Requerido
|
Número máximo de contenedores que se van a usar al escalar automáticamente este servicio web. El valor predeterminado es 10 |
|
autoscale_refresh_seconds
Requerido
|
Con qué frecuencia el escalador automático debe intentar escalar este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_target_utilization
Requerido
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para este servicio web. El valor predeterminado es 70. |
|
collect_model_data
Requerido
|
Si se va a habilitar o no la recopilación de datos del modelo para este servicio web. El valor predeterminado es False. |
|
auth_enabled
Requerido
|
Si se va a habilitar o no la autenticación para este servicio web. El valor predeterminado es True. |
|
cpu_cores
Requerido
|
Número de núcleos de CPU que se van a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0.1 |
|
memory_gb
Requerido
|
Cantidad de memoria (en GB) que se va a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0,5 |
|
enable_app_insights
Requerido
|
Si se va a habilitar o no el registro de Application Insights para este servicio web. El valor predeterminado es False. |
|
scoring_timeout_ms
Requerido
|
Tiempo de espera para exigir llamadas de puntuación a este servicio web. El valor predeterminado es 60000. |
|
replica_max_concurrent_requests
Requerido
|
Número de solicitudes simultáneas máximas por réplica que permiten este servicio web. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. |
|
max_request_wait_time
Requerido
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. |
|
num_replicas
Requerido
|
Número de contenedores que se van a asignar para este servicio web. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. |
|
primary_key
Requerido
|
Clave de autenticación principal que se va a usar para este servicio web. |
|
secondary_key
Requerido
|
Clave de autenticación secundaria que se va a usar para este servicio web. |
|
tags
Requerido
|
Diccionario de etiquetas de valor de clave para proporcionar este servicio web. |
|
properties
Requerido
|
Diccionario de propiedades de valor de clave para proporcionar este servicio web. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. |
|
description
Requerido
|
Descripción para proporcionar este servicio web. |
|
gpu_cores
Requerido
|
Número de núcleos de GPU que se van a asignar para este servicio web. El valor predeterminado es 0. |
|
period_seconds
Requerido
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. |
|
initial_delay_seconds
Requerido
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. |
|
timeout_seconds
Requerido
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. |
|
success_threshold
Requerido
|
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. |
|
failure_threshold
Requerido
|
Cuando se inicia un pod y se produce un error en el sondeo de ejecución, Kubernetes intentará |
|
namespace
Requerido
|
Espacio de nombres de Kubernetes en el que se va a implementar este servicio web: hasta 63 caracteres alfanuméricos en minúsculas ('a'-'z', '0'-'9') y guiones ('-'). Los caracteres primero y último no pueden ser guiones. |
|
token_auth_enabled
Requerido
|
Si se va a habilitar o no la autenticación de Azure Active Directory para este servicio web. Si esto está habilitado, los usuarios pueden acceder a este servicio web mediante la captura del token de acceso mediante sus credenciales de Azure Active Directory. El valor predeterminado es False. |
|
compute_target_name
Requerido
|
Nombre del destino de proceso en el que se va a realizar la implementación |
|
cpu_cores_limit
Requerido
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. |
|
memory_gb_limit
Requerido
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. |
|
blobfuse_enabled
Requerido
|
Si se va a habilitar blobfuse para la descarga de modelos para este servicio web. El valor predeterminado es True |
Variables
| Nombre | Description |
|---|---|
|
autoscale_enabled
|
Indica si se va a habilitar el escalado automático para este servicio web.
El valor predeterminado es True si |
|
autoscale_min_replicas
|
El número mínimo de contenedores que se van a usar al escalar automáticamente este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_max_replicas
|
Número máximo de contenedores que se van a usar al escalar automáticamente este servicio web. El valor predeterminado es 10 |
|
autoscale_refresh_seconds
|
Con qué frecuencia el escalador automático debe intentar escalar este servicio web. De manera predeterminada, su valor es 1. |
|
autoscale_target_utilization
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para este servicio web. El valor predeterminado es 70. |
|
collect_model_data
|
Si se va a habilitar o no la recopilación de datos del modelo para este servicio web. El valor predeterminado es False. |
|
auth_enabled
|
Si se va a habilitar o no la autenticación para este servicio web. El valor predeterminado es True. |
|
cpu_cores
|
Número de núcleos de CPU que se van a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0.1 |
|
memory_gb
|
Cantidad de memoria (en GB) que se va a asignar para este servicio web. Puede ser un decimal. El valor predeterminado es 0,5 |
|
enable_app_insights
|
Si se va a habilitar o no el registro de Application Insights para este servicio web. El valor predeterminado es False. |
|
scoring_timeout_ms
|
Tiempo de espera para exigir llamadas de puntuación a este servicio web. El valor predeterminado es 60000. |
|
replica_max_concurrent_requests
|
Número de solicitudes simultáneas máximas por réplica que permiten este servicio web. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. |
|
max_request_wait_time
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. |
|
num_replicas
|
Número de contenedores que se van a asignar para este servicio web. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. |
|
primary_key
|
Clave de autenticación principal que se va a usar para este servicio web. |
|
secondary_key
|
Clave de autenticación secundaria que se va a usar para este servicio web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Diccionario de etiquetas de valor de clave para proporcionar este servicio web. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Diccionario de propiedades de valor de clave para proporcionar este servicio web. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Descripción para proporcionar este servicio web. |
|
gpu_cores
|
Número de núcleos de GPU que se van a asignar para este servicio web. El valor predeterminado es 0. |
|
period_seconds
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. |
|
initial_delay_seconds
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. |
|
timeout_seconds
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. |
|
success_threshold
|
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. |
|
failure_threshold
|
Cuando se inicia un pod y se produce un error en el sondeo de ejecución, Kubernetes intentará |
|
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Espacio de nombres de Kubernetes en el que se va a implementar este servicio web: hasta 63 caracteres alfanuméricos en minúsculas ('a'-'z', '0'-'9') y guiones ('-'). Los caracteres primero y último no pueden ser guiones. |
|
token_auth_enabled
|
Si se va a habilitar o no la autenticación de Azure Active Directory para este servicio web. Si esto está habilitado, los usuarios pueden acceder a este servicio web mediante la captura del token de acceso mediante sus credenciales de Azure Active Directory. El valor predeterminado es False. |
Métodos
| print_deploy_configuration |
Imprima la configuración de implementación. |
| validate_configuration |
Compruebe que los valores de configuración especificados son válidos. Generará una excepción WebserviceException si se produce un error en la validación. |
print_deploy_configuration
Imprima la configuración de implementación.
print_deploy_configuration()
validate_configuration
Compruebe que los valores de configuración especificados son válidos.
Generará una excepción WebserviceException si se produce un error en la validación.
validate_configuration()
Excepciones
| Tipo | Description |
|---|---|