AksEndpoint Clase
Nota:
Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para obtener más información.
Representa una colección de versiones de servicio web detrás del mismo punto de conexión que se ejecuta en Azure Kubernetes Service.
Mientras que un AksWebservice implementa un único servicio con un único punto de conexión de puntuación, la clase AksEndpoint permite implementar varias versiones de servicio web detrás del mismo punto de conexión de puntuación. Cada versión del servicio web se puede configurar para proporcionar un porcentaje del tráfico para que pueda implementar modelos de forma controlada, por ejemplo, para las pruebas A/B. AksEndpoint permite la implementación desde un objeto de modelo similar a AksWebservice.
Inicialice la instancia del servicio web.
El constructor de servicios web recupera una representación en la nube de un objeto de servicio web asociado al área de trabajo proporcionada. Devolverá una instancia de una clase secundaria correspondiente al tipo específico del objeto Webservice recuperado.
Constructor
AksEndpoint(workspace, name)
Parámetros
| Nombre | Description |
|---|---|
|
workspace
Requerido
|
Objeto de área de trabajo que contiene el objeto Webservice que se va a recuperar. |
|
name
Requerido
|
Nombre del objeto web que se va a recuperar. |
Variables
| Nombre | Description |
|---|---|
|
versions
|
Diccionario de nombre de versión para el objeto de versión. Contiene todas las versiones implementadas como parte de este punto de conexión. |
Métodos
| create_version |
Agregue una nueva versión en un punto de conexión con las propiedades proporcionadas. |
| delete_version |
Elimine una versión en un punto de conexión. |
| deploy_configuration |
Cree un objeto de configuración para implementar en un destino de proceso de AKS. |
| serialize |
Convierta este servicio web en un diccionario serializado JSON. |
| update |
Actualice el punto de conexión con las propiedades proporcionadas. Los valores dejados como None permanecerán sin cambios en este punto de conexión. |
| update_version |
Actualice una versión existente en un punto de conexión con las propiedades proporcionadas. Los valores dejados como None permanecerán sin cambios en esta versión. |
create_version
Agregue una nueva versión en un punto de conexión con las propiedades proporcionadas.
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parámetros
| Nombre | Description |
|---|---|
|
version_name
Requerido
|
Nombre de la versión que se va a agregar en un punto de conexión. |
|
autoscale_enabled
|
Si se va a habilitar o no el escalado automático para esta versión en un punto de conexión.
El valor predeterminado es True si Valor predeterminado: None
|
|
autoscale_min_replicas
|
Número mínimo de contenedores que se usarán al escalar automáticamente esta versión en un punto de conexión. El valor predeterminado es 1 Valor predeterminado: None
|
|
autoscale_max_replicas
|
Número máximo de contenedores que se van a usar al escalar automáticamente esta versión en un punto de conexión. El valor predeterminado es 10 Valor predeterminado: None
|
|
autoscale_refresh_seconds
|
Frecuencia con la que el escalador automático debe intentar escalar esta versión en un punto de conexión. El valor predeterminado es 1 Valor predeterminado: None
|
|
autoscale_target_utilization
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para esta versión en un punto de conexión. El valor predeterminado es 70 Valor predeterminado: None
|
|
collect_model_data
|
Si se va a habilitar o no la recopilación de datos del modelo para esta versión en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
cpu_cores
|
Número de núcleos de CPU que se van a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0.1 Valor predeterminado: None
|
|
memory_gb
|
Cantidad de memoria (en GB) que se va a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0,5 Valor predeterminado: None
|
|
scoring_timeout_ms
|
Tiempo de espera para exigir llamadas de puntuación a esta versión en un punto de conexión. El valor predeterminado es 60000. Valor predeterminado: None
|
|
replica_max_concurrent_requests
|
Número de solicitudes simultáneas máximas por réplica que permiten esta versión en un punto de conexión. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. Valor predeterminado: None
|
|
max_request_wait_time
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. Valor predeterminado: None
|
|
num_replicas
|
Número de contenedores que se van a asignar para esta versión en un punto de conexión. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. Valor predeterminado: None
|
|
tags
|
Diccionario de etiquetas de valor de clave para proporcionar este punto de conexión. Valor predeterminado: None
|
|
properties
|
Diccionario de propiedades de valor clave para proporcionar este punto de conexión. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. Valor predeterminado: None
|
|
description
|
Descripción para proporcionar este punto de conexión. Valor predeterminado: None
|
|
models
|
Lista de objetos Model que se van a empaquetar con el servicio actualizado. Valor predeterminado: None
|
|
inference_config
|
Objeto InferenceConfig usado para proporcionar las propiedades de implementación del modelo necesarias. Valor predeterminado: None
|
|
gpu_cores
|
Número de núcleos de GPU que se van a asignar para esta versión en un punto de conexión. El valor predeterminado es 0. Valor predeterminado: None
|
|
period_seconds
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
initial_delay_seconds
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. Valor predeterminado: None
|
|
timeout_seconds
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
success_threshold
|
Los éxitos consecutivos mínimos para el sondeo de ejecución que se deben considerar correctos después de haber producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. Valor predeterminado: None
|
|
failure_threshold
|
Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará las veces especificadas en failureThreshold antes de abandonarlo. El valor predeterminado es 3. El valor mínimo es 1. Valor predeterminado: None
|
|
traffic_percentile
|
Cantidad de tráfico que toma la versión en un punto de conexión. Valor predeterminado: None
|
|
is_default
|
Si se va a convertir o no esta versión como versión predeterminada en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
is_control_version_type
|
Si se va a convertir o no esta versión como versión de control en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
cpu_cores_limit
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. Valor predeterminado: None
|
|
memory_gb_limit
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. Valor predeterminado: None
|
Excepciones
| Tipo | Description |
|---|---|
delete_version
Elimine una versión en un punto de conexión.
delete_version(version_name)
Parámetros
| Nombre | Description |
|---|---|
|
version_name
Requerido
|
Nombre de la versión de un punto de conexión que se va a eliminar. |
Excepciones
| Tipo | Description |
|---|---|
deploy_configuration
Cree un objeto de configuración para implementar en un destino de proceso de AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
Parámetros
| Nombre | Description |
|---|---|
|
autoscale_enabled
|
Si se va a habilitar o no el escalado automático para esta versión en un punto de conexión.
El valor predeterminado es True si Valor predeterminado: None
|
|
autoscale_min_replicas
|
Número mínimo de contenedores que se usarán al escalar automáticamente esta versión en un punto de conexión. De manera predeterminada, su valor es 1. Valor predeterminado: None
|
|
autoscale_max_replicas
|
Número máximo de contenedores que se van a usar al escalar automáticamente esta versión en un punto de conexión. El valor predeterminado es 10. Valor predeterminado: None
|
|
autoscale_refresh_seconds
|
Frecuencia con la que el escalador automático debe intentar escalar esta versión en un punto de conexión. De manera predeterminada, su valor es 1. Valor predeterminado: None
|
|
autoscale_target_utilization
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para esta versión en un punto de conexión. El valor predeterminado es 70. Valor predeterminado: None
|
|
collect_model_data
|
Si se va a habilitar o no la recopilación de datos del modelo para esta versión en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
auth_enabled
|
Si se va a habilitar o no la autenticación de clave para esta versión en un punto de conexión. El valor predeterminado es True. Valor predeterminado: None
|
|
cpu_cores
|
Número de núcleos de CPU que se van a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0.1 Valor predeterminado: None
|
|
memory_gb
|
Cantidad de memoria (en GB) que se va a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0,5 Valor predeterminado: None
|
|
enable_app_insights
|
Si se va a habilitar o no el registro de ApplicationInsights para esta versión en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
scoring_timeout_ms
|
Tiempo de espera para aplicar llamadas de puntuación a esta versión en un punto de conexión. El valor predeterminado es 60000 Valor predeterminado: None
|
|
replica_max_concurrent_requests
|
Número de solicitudes simultáneas máximas por réplica que permiten esta versión en un punto de conexión. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. Valor predeterminado: None
|
|
max_request_wait_time
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. Valor predeterminado: None
|
|
num_replicas
|
Número de contenedores que se van a asignar para esta versión en un punto de conexión. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. Valor predeterminado: None
|
|
primary_key
|
Clave de autenticación principal que se va a usar para este punto de conexión. Valor predeterminado: None
|
|
secondary_key
|
Clave de autenticación secundaria que se va a usar para este punto de conexión. Valor predeterminado: None
|
|
tags
|
Diccionario de etiquetas de valor de clave para proporcionar este punto de conexión. Valor predeterminado: None
|
|
properties
|
Diccionario de propiedades de valor clave para proporcionar este punto de conexión. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valores de clave. Valor predeterminado: None
|
|
description
|
Descripción para proporcionar este punto de conexión. Valor predeterminado: None
|
|
gpu_cores
|
Número de núcleos de GPU que se van a asignar para esta versión en un punto de conexión. El valor predeterminado es 0. Valor predeterminado: None
|
|
period_seconds
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
initial_delay_seconds
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. Valor predeterminado: None
|
|
timeout_seconds
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
success_threshold
|
Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. Valor predeterminado: None
|
|
failure_threshold
|
Cuando se inicia un pod y se produce un error en el sondeo de ejecución, Kubernetes intentará Valor predeterminado: None
|
|
namespace
|
Espacio de nombres de Kubernetes en el que se va a implementar este punto de conexión: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0-"9") y guiones ("-". Los caracteres primero y último no pueden ser guiones. Valor predeterminado: None
|
|
token_auth_enabled
|
Si se va a habilitar o no la autenticación del token para este punto de conexión. Si esto está habilitado, los usuarios pueden acceder a este punto de conexión mediante la captura del token de acceso mediante sus credenciales de Azure Active Directory. El valor predeterminado es False. Valor predeterminado: None
|
|
version_name
|
Nombre de la versión en un punto de conexión. Valor predeterminado: None
|
|
traffic_percentile
|
la cantidad de tráfico que toma la versión en un punto de conexión. Valor predeterminado: None
|
|
compute_target_name
|
Nombre del destino de proceso en el que se va a realizar la implementación Valor predeterminado: None
|
|
cpu_cores_limit
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. Valor predeterminado: None
|
|
memory_gb_limit
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. Valor predeterminado: None
|
Devoluciones
| Tipo | Description |
|---|---|
Excepciones
| Tipo | Description |
|---|---|
serialize
Convierta este servicio web en un diccionario serializado JSON.
serialize()
Devoluciones
| Tipo | Description |
|---|---|
|
Representación JSON de este servicio web. |
update
Actualice el punto de conexión con las propiedades proporcionadas.
Los valores dejados como None permanecerán sin cambios en este punto de conexión.
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
Parámetros
| Nombre | Description |
|---|---|
|
auth_enabled
|
Si se va a habilitar o no la autenticación de clave para esta versión en un punto de conexión. El valor predeterminado es True. Valor predeterminado: None
|
|
token_auth_enabled
|
Si se va a habilitar o no la autenticación del token para este punto de conexión. Si esto está habilitado, los usuarios pueden acceder a este punto de conexión mediante la captura del token de acceso mediante sus credenciales de Azure Active Directory. El valor predeterminado es False. Valor predeterminado: None
|
|
enable_app_insights
|
Si se va a habilitar o no el registro de Application Insights para esta versión en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
description
|
Descripción para proporcionar este punto de conexión. Valor predeterminado: None
|
|
tags
|
Diccionario de etiquetas de valor de clave para proporcionar este punto de conexión. Valor predeterminado: None
|
|
properties
|
Diccionario de propiedades de valor clave para proporcionar este punto de conexión. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. Valor predeterminado: None
|
Excepciones
| Tipo | Description |
|---|---|
update_version
Actualice una versión existente en un punto de conexión con las propiedades proporcionadas.
Los valores dejados como None permanecerán sin cambios en esta versión.
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parámetros
| Nombre | Description |
|---|---|
|
version_name
Requerido
|
Nombre de la versión en un punto de conexión. |
|
autoscale_enabled
|
Si se va a habilitar o no el escalado automático para esta versión en un punto de conexión. El valor predeterminado es True si num_replicas es Ninguno. Valor predeterminado: None
|
|
autoscale_min_replicas
|
Número mínimo de contenedores que se usarán al escalar automáticamente esta versión en un punto de conexión. De manera predeterminada, su valor es 1. Valor predeterminado: None
|
|
autoscale_max_replicas
|
Número máximo de contenedores que se van a usar al escalar automáticamente esta versión en un punto de conexión. El valor predeterminado es 10. Valor predeterminado: None
|
|
autoscale_refresh_seconds
|
Frecuencia con la que el escalador automático debe intentar escalar esta versión en un punto de conexión. El valor predeterminado es 1 Valor predeterminado: None
|
|
autoscale_target_utilization
|
El uso de destino (en porcentaje de 100) que el escalador automático debe intentar mantener para esta versión en un punto de conexión. El valor predeterminado es 70. Valor predeterminado: None
|
|
collect_model_data
|
Si se va a habilitar o no la recopilación de datos del modelo para esta versión en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
cpu_cores
|
Número de núcleos de CPU que se van a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0.1 Valor predeterminado: None
|
|
memory_gb
|
Cantidad de memoria (en GB) que se va a asignar para esta versión en un punto de conexión. Puede ser un decimal. El valor predeterminado es 0,5 Valor predeterminado: None
|
|
scoring_timeout_ms
|
Tiempo de espera para exigir llamadas de puntuación a esta versión en un punto de conexión. El valor predeterminado es 60000. Valor predeterminado: None
|
|
replica_max_concurrent_requests
|
Número de solicitudes simultáneas máximas por réplica que permiten esta versión en un punto de conexión. De manera predeterminada, su valor es 1. No cambie esta configuración del valor predeterminado de 1 a menos que lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning. Valor predeterminado: None
|
|
max_request_wait_time
|
La cantidad máxima de tiempo que una solicitud permanecerá en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500. Valor predeterminado: None
|
|
num_replicas
|
Número de contenedores que se van a asignar para esta versión en un punto de conexión. No hay ningún valor predeterminado, si este parámetro no está establecido, el escalador automático está habilitado de forma predeterminada. Valor predeterminado: None
|
|
tags
|
Diccionario de etiquetas de valor de clave para proporcionar este punto de conexión. Valor predeterminado: None
|
|
properties
|
Diccionario de propiedades de valor clave para proporcionar este punto de conexión. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares de valor de clave. Valor predeterminado: None
|
|
description
|
Descripción para proporcionar este punto de conexión Valor predeterminado: None
|
|
models
|
Lista de objetos Model que se van a empaquetar con el servicio actualizado Valor predeterminado: None
|
|
inference_config
|
Objeto InferenceConfig usado para proporcionar las propiedades de implementación del modelo necesarias. Valor predeterminado: None
|
|
gpu_cores
|
Número de núcleos de GPU que se van a asignar para esta versión en un punto de conexión. El valor predeterminado es 0. Valor predeterminado: None
|
|
period_seconds
|
Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
initial_delay_seconds
|
Número de segundos después de que se haya iniciado el contenedor antes de iniciar los sondeos de ejecución. El valor predeterminado es 310. Valor predeterminado: None
|
|
timeout_seconds
|
Número de segundos después del cual se agota el tiempo de espera del sondeo de ejecución. El valor predeterminado es 2 segundos. El valor mínimo es 1. Valor predeterminado: None
|
|
success_threshold
|
Los éxitos consecutivos mínimos para el sondeo de ejecución que se deben considerar correctos después de haber producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1. Valor predeterminado: None
|
|
failure_threshold
|
Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará las veces especificadas en failureThreshold antes de abandonarlo. El valor predeterminado es 3. El valor mínimo es 1. Valor predeterminado: None
|
|
traffic_percentile
|
Cantidad de tráfico que toma la versión en un punto de conexión. Valor predeterminado: None
|
|
is_default
|
Si se va a convertir o no esta versión como versión predeterminada en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
is_control_version_type
|
Si se va a convertir o no esta versión como versión de control en un punto de conexión. El valor predeterminado es False. Valor predeterminado: None
|
|
cpu_cores_limit
|
El número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal. Valor predeterminado: None
|
|
memory_gb_limit
|
La cantidad máxima de memoria (en GB) que este servicio web puede usar. Puede ser un decimal. Valor predeterminado: None
|
Excepciones
| Tipo | Description |
|---|---|