Compartir a través de


Implementación de un modelo optimizado para pruebas

Nota:

Este documento hace referencia al portal de Microsoft Foundry (clásico).

🔍 Consulte la documentación de Microsoft Foundry (nuevo) para obtener información sobre el nuevo portal.

Después de ajustar un modelo, podría querer probar su calidad a través de la API de Completaciones de Chat o el servicio Evaluaciones.

Una implementación de nivel de desarrollador le permite implementar el nuevo modelo sin la tarifa de hospedaje por hora en la que incurren las implementaciones estándar o globales. Los únicos cargos que se generan son por cada token. Consulte la página de precios para obtener los precios más actualizados.

Importante

El nivel de desarrollador no ofrece ningún Acuerdo de Nivel de Servicio de disponibilidad y ninguna garantía de residencia de datos. Si necesita un Acuerdo de Nivel de Servicio o una residencia de datos, elija un tipo de implementación alternativo para probar el modelo.

Las implementaciones de nivel de desarrollador tienen una duración fija de 24 horas. Obtenga más información sobre el ciclo de vida de la implementación.

Implementación del modelo optimizado

Para implementar el candidato del modelo, seleccione el modelo optimizado para implementar y, a continuación, seleccione Implementar.

Se abre el cuadro de diálogo Implementar modelo. En el cuadro de diálogo, escriba el nombre de la implementación y, a continuación, seleccione Desarrollador en la lista desplegable Tipo de implementación. Seleccione Crear para iniciar la implementación del modelo personalizado.

Captura de pantalla que muestra la selección de Implementación para desarrolladores en Foundry.

Puede supervisar el progreso de la nueva implementación en el panel Implementaciones del portal de Microsoft Foundry.

Uso del modelo optimizado implementado

Cuando su modelo personalizado se implemente, puede usarlo como cualquier otro modelo implementado. Puede usar el área de juegos en el portal de Foundry para experimentar con la nueva implementación. Puede seguir usando los mismos parámetros con el modelo personalizado, como temperature y max_tokens, como puede hacer con otros modelos implementados.

Captura de pantalla del panel Parque infantil en el portal de Foundry, con secciones resaltadas.

También puede usar el servicio Evaluations para crear y ejecutar evaluaciones del modelo en el candidato del modelo implementado, así como otras versiones del modelo.

Limpieza de la implementación

Las implementaciones de los desarrolladores se eliminarán automáticamente independientemente de la actividad. Cada implementación tiene una duración fija de 24 horas después de la cual está sujeta a eliminación. La eliminación de una implementación no elimina ni afecta al modelo personalizado subyacente y el modelo personalizado se puede volver a implementar en cualquier momento.

Para eliminar una implementación manualmente, puede usar el portal de Foundry o usar la CLI de Azure.

Para usar Deployments - Delete REST API envía un HTTP DELETE al recurso de implementación. Al igual que con la creación de implementaciones, debe incluir los parámetros siguientes:

  • Identificador de suscripción de Azure
  • Nombre del grupo de recursos de Azure
  • El nombre del recurso de Azure OpenAI
  • Nombre de la implementación que se va a eliminar

A continuación se muestra el ejemplo de la API REST para eliminar una implementación:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
  -H "Authorization: Bearer <TOKEN>"

Pasos siguientes