Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo descreve o processo organizacional para a criação de cargas de trabalho de IA em Azure. O artigo contém recomendações de tomada de decisões importantes sobre design e processo na adoção de cargas de trabalho de IA em escala. Ele se concentra em diretrizes específicas de IA para a organização e conectividade de recursos.
Estabelecer governança de IA
A governança de IA requer a organização de recursos adequada e o gerenciamento de políticas para garantir operações seguras, compatíveis e econômicas. Você deve criar limites claros de governança para proteger dados confidenciais e controlar o acesso a recursos de IA com eficiência. Veja como:
Crie grupos de gerenciamento separados para cargas de trabalho de IA internas e voltadas para a Internet. A separação de grupo de gerenciamento estabelece limites críticos de governança de dados entre aplicativos de IA externos ("online") e somente internos ("corporativos"). Essa separação impede que usuários externos acessem dados comerciais internos confidenciais enquanto você mantém os controles de acesso apropriados. A abordagem se alinha aos princípios de arquitetura do grupo de gerenciamento de Landing Zone do Azure e dá suporte à herança de política entre tipos de carga de trabalho.
Aplique políticas específicas de IA a cada grupo de gerenciamento. Comece com políticas de linha de base de Azure zonas de destino e adicione definições de Azure Policy para Foundry, Foundry Tools, Pesquisa de IA do Azure e Máquinas Virtuais do Azure. A imposição de política garante uma governança uniforme de IA em sua plataforma e reduz a supervisão de conformidade manual.
Implantar recursos de IA em assinaturas específicas da carga de trabalho. Os recursos de IA devem herdar políticas de governança de seu grupo de gerenciamento de carga de trabalho em vez de assinaturas de plataforma. Essa separação impede gargalos de desenvolvimento que os controles da equipe de plataforma criam e permitem que as equipes de carga de trabalho operem com a autonomia apropriada. Implante cargas de trabalho de IA em assinaturas da zona de destino do aplicativo em ambientes de zona de destino Azure.
Estabelecer rede de IA
A rede de IA abrange design de infraestrutura de rede, medidas de segurança e padrões eficientes de transferência de dados para cargas de trabalho de IA. Você deve implementar controles de segurança adequados e opções de conectividade para evitar interrupções baseadas em rede e manter um desempenho consistente. Veja como:
Ative a Proteção DDoS do Azure para cargas de trabalho de IA voltadas para a internet.A Proteção DDoS do Azure protege seus serviços de IA contra possíveis interrupções e indisponibilidade causadas por ataques de negação de serviço distribuído. A proteção contra DDoS no nível da rede virtual defende contra inundações de tráfego direcionadas a aplicativos voltados para a Internet e mantém a disponibilidade do serviço durante os ataques.
Proteger o acesso operacional a cargas de trabalho de IA com Azure Bastion. Use uma jumpbox e o Azure Bastion para proteger o acesso operacional às cargas de trabalho de IA e evitar a exposição direta à Internet das interfaces de gerenciamento. Essa abordagem cria um gateway seguro para tarefas administrativas, mantendo o isolamento de rede para recursos de IA.
Escolha a conectividade apropriada para fontes de dados locais. As organizações que transferem grandes quantidades de dados de fontes locais para ambientes de nuvem precisam de conexões de alta largura de banda para dar suporte aos requisitos de desempenho da carga de trabalho de IA.
Use Azure ExpressRoute para transferência de dados de alto volume.Azure ExpressRoute fornece conectividade dedicada para grandes volumes de dados, processamento em tempo real ou cargas de trabalho que exigem desempenho consistente. O ExpressRoute inclui um recurso FastPath que melhora o desempenho do caminho de dados ignorando o gateway do ExpressRoute para fluxos de tráfego específicos.
Use Gateway de VPN do Azure para transferência de dados moderada.Gateway de VPN do Azure funciona bem para volumes de dados moderados, transferência de dados pouco frequentes ou quando o acesso público à Internet é necessário. Gateway de VPN oferece configuração mais simples e operação econômica para conjuntos de dados menores em comparação com o ExpressRoute. Use a topologia e o design apropriados para suas cargas de trabalho de IA, incluindo VPN site a site para conectividade entre locais e VPN ponto a site para acesso seguro ao dispositivo.
Estabelecer confiabilidade da IA
A confiabilidade da IA requer o posicionamento estratégico da região e o planejamento de redundância para garantir um desempenho consistente e alta disponibilidade. As organizações devem abordar a hospedagem de modelos, a localidade de dados e a recuperação de desastre para manter serviços de IA confiáveis. Você precisa planejar sua estratégia de implantação regional para evitar interrupções de serviço e otimizar o desempenho. Veja como:
Implante pontos de extremidade de IA em várias regiões para cargas de trabalho de produção. Cargas de trabalho de IA de produção exigem hospedagem em pelo menos duas regiões para fornecer redundância e garantir alta disponibilidade. As implantações de várias regiões permitem failover e recuperação mais rápidos durante falhas regionais. Para o Azure OpenAI no Foundry, use implantações globais que automaticamente roteiam as solicitações para regiões com capacidade disponível. Para implantações regionais, implemente Gerenciamento de API do Azure para balancear a carga de solicitações de API entre pontos de extremidade de IA.
Verifique a disponibilidade do serviço de IA em regiões de destino antes da implantação. Regiões diferentes fornecem diferentes níveis de disponibilidade do serviço de IA e suporte a recursos. Verifique Azure disponibilidade do serviço por região para confirmar se os serviços de IA necessários estão disponíveis. Modelos de implantação do Azure OpenAI incluem opções padrão global, provisionadas globalmente, padrão regional e provisionadas regionalmente, cada uma com diferentes padrões de disponibilidade regional.
Avalie os limites de cota regional e os requisitos de capacidade. As Ferramentas de Fundação têm limites de assinatura regionais que afetam implantações de modelo em larga escala e cargas de trabalho de inferência. Entre em contato com Suporte do Azure proativamente quando você prevê necessidades de capacidade que excedem as cotas padrão para evitar interrupções de serviço durante o dimensionamento.
Otimize o posicionamento de dados para aplicativos de geração aumentada de recuperação. O local de armazenamento de dados afeta significativamente o desempenho do aplicativo em cenários RAG. A localização conjunta de dados com modelos de IA na mesma região reduz a latência e melhora a eficiência de recuperação de dados, embora as configurações entre regiões permaneçam viáveis para requisitos de negócios específicos.
Replique ativos críticos de IA para regiões secundárias para continuidade dos negócios. A continuidade dos negócios requer a replicação de modelos ajustados, conjuntos de dados RAG, modelos treinados e dados de treinamento para regiões secundárias. A replicação de ativos permite uma recuperação mais rápida durante interrupções e mantém a disponibilidade do serviço em diferentes cenários de falha.
Estabelecer uma base de IA
Uma base de IA fornece a infraestrutura principal e a hierarquia de recursos que dão suporte a cargas de trabalho de IA em Azure. Inclui a criação de ambientes escaláveis e seguros que se alinham às necessidades operacionais e de governança. Uma base sólida de IA permite a implantação e o gerenciamento eficientes de cargas de trabalho de IA. Também garante segurança e flexibilidade para o crescimento futuro.
Usar uma zona de destino do Azure
Uma zona de destino Azure é o ponto de partida recomendado que prepara seu ambiente Azure. Ela fornece uma configuração predefinida para recursos de plataformas e aplicativos. Depois que a plataforma é implementada, você pode implantar cargas de trabalho de IA em zonas de destino de aplicativos dedicados.
Se sua organização usar Azure zonas de destino para cargas de trabalho, continue a usá-las para cargas de trabalho que usam IA. Você implanta suas cargas de trabalho de IA em zonas de destino regulares do aplicativo, como faria com qualquer outra carga de trabalho. Consulte Zonas de Aterrissagem de AI no Azure. A Figura 2 abaixo ilustra como as cargas de trabalho de IA se integram em uma zona de destino Azure.
Figure 2. Carga de trabalho de IA em uma zona de destino Azure.
Criar um ambiente de IA
Se você não usar uma zona de destino Azure, siga as recomendações neste artigo para criar seu ambiente de IA. O diagrama a seguir mostra uma hierarquia de recursos de referência. Ele segmenta cargas de trabalho internas de IA e cargas de trabalho de IA voltadas para a Internet. As cargas de trabalho internas usam a política para negar o acesso online dos clientes. Essa separação protege os dados internos da exposição a usuários externos. O desenvolvimento de IA deve usar um jumpbox para gerenciar dados e recursos de IA.
Figura 3. Hierarquia de recursos básica para cargas de trabalho de IA.
Próximas Etapas
A próxima etapa é criar e implantar cargas de trabalho de IA em seu ambiente de IA. Use os links a seguir para encontrar as diretrizes de arquitetura de acordo com as suas necessidades. Comece com arquiteturas da Plataforma como serviço (PaaS). PaaS é a abordagem recomendada da Microsoft para adoção da IA.