Partilhar via


Implantar um aplicativo Databricks

Depois de criar e desenvolver a sua aplicação Azure Databricks, implemente-a para a tornar acessível no espaço de trabalho do Azure Databricks. O deployment constrói a sua aplicação, instala dependências e executa-a usando a configuração definida nos ficheiros do seu projeto. Pode implementar aplicações usando a interface do Azure Databricks ou a interface de comando do Databricks.

Observação

Se criar uma aplicação a partir de um modelo, o Azure Databricks implementa-a automaticamente quando a cria pela primeira vez. No entanto, você ainda pode reimplantá-lo mais tarde depois de fazer alterações. Consulte Criar um aplicativo Databricks a partir de um modelo.

Lógica de implantação

O Databricks Apps suporta a implementação de aplicações que utilizam Python, Node.js, ou uma combinação de ambos. Isto permite arquiteturas flexíveis, como um frontend Node.js com um backend Python.

Durante a implantação, o processo de compilação verifica se há um package.json arquivo na raiz do diretório do aplicativo para determinar se Node.js é usado. Se existir, inclui passos de construção específicos de nós juntamente com passos em Python. A lógica de implantação segue este padrão:

Se package.json estiver presente:

  1. Executar npm install
  2. Instalar dependências em Python:
    • Se requirements.txt existir, executar pip install -r requirements.txt
    • Se requirements.txt não existe e ambos pyproject.toml e uv.lock existem, execute uv sync para instalar dependências
  3. Executar npm run build (se um build script estiver definido em package.json)
  4. Execute o comando especificado no app.yaml, ou npm run start se nenhum comando for especificado

Observação

Se não for especificado nenhum comando em app.yaml, Azure Databricks executa npm run start, mesmo que a aplicação inclua Python código. Para executar tanto Python como Node.js processos, defina um script personalizado start que use uma ferramenta como concurrently para lançar ambos. Por exemplo: concurrently "npm run start:node" "python my_app.py".

Se package.json não estiver presente:

  1. Instalar dependências em Python:
    • Se requirements.txt existir, executar pip install -r requirements.txt
    • Se requirements.txt não existe e ambos pyproject.toml e uv.lock existem, execute uv sync para instalar dependências
  2. Execute o comando especificado no app.yaml, ou python <my-app>.py se nenhum comando for especificado

Preparar-se para a implantação

Antes de implantar seu aplicativo, verifique se seu projeto inclui os componentes necessários:

Além disso, verifique se o principal de serviço do aplicativo tem acesso à pasta de código-fonte.

Escolha uma fonte de implementação

Pode implementar aplicações Databricks a partir das seguintes fontes:

  • Pasta do espaço de trabalho - Carregar ficheiros da aplicação para uma pasta do espaço de trabalho e implementar a partir daí. Este é o método padrão de implementação.
  • Repositório Git - Configure um repositório Git para uma aplicação e implemente diretamente sem carregar ficheiros para o espaço de trabalho. A aplicação lê código da referência Git configurada (branch, tag ou commit) cada vez que implementas. Também pode especificar um caminho de código-fonte para implementar a partir de um diretório específico dentro do repositório. Todos os principais fornecedores Git são suportados, incluindo GitHub, GitLab e Bitbucket. Para uma lista completa de fornecedores suportados, consulte Ligar o seu fornecedor Git ao Databricks.

Podes alternar entre o workspace e as fontes Git para a mesma aplicação a qualquer momento, a menos que um administrador de workspace impeça implementações apenas no Git. Veja implementações apenas no Enforce Git.

Impor implementações apenas no Git

Os administradores de espaços de trabalho podem exigir que todas as aplicações de um espaço de trabalho sejam implementadas a partir de repositórios Git. Para ativar esta definição, vá a Definições>Desenvolvimento>Aplicações e ative Permitir apenas implementações de aplicações através do Git. Esta definição está desativada por predefinição.

Quando ativar esta definição:

  • Os utilizadores devem configurar um repositório Git antes de criar uma aplicação.
  • Os utilizadores só podem fazer deploy a partir do Git, não das pastas do workspace.
  • O Databricks desativa modelos de aplicações no espaço de trabalho.
  • Os utilizadores não podem remover um repositório Git de aplicações que o têm.
  • As aplicações existentes continuam a correr, mas os utilizadores não podem implementá-las ou reiniciá-las a menos que a aplicação tenha um repositório Git.

Implementar a aplicação

As secções seguintes descrevem como implementar a partir de uma pasta workspace ou diretamente a partir de um repositório Git.

Implementar a partir de um diretório de área de trabalho

Interface do usuário do Databricks

Para implementar uma aplicação a partir da interface do Azure Databricks:

  1. Carregue os ficheiros da aplicação para o seu espaço de trabalho Azure Databricks. Para obter instruções, consulte Importar um arquivo.
  2. Clique em ícone de computaçãoCalcular na barra lateral.
  3. Vá para a guia Aplicativos e clique no link para seu aplicativo na coluna Nome .
  4. Clique em Implantar e selecione a pasta em seu espaço de trabalho onde você carregou os arquivos do aplicativo.
  5. Clique em Selecionar e, em seguida, em Implantar.
  6. Revise a configuração e clique em Implantar.

CLI do Databricks

Para implantar um aplicativo usando a CLI:

  1. Abre um terminal e navega até ao diretório que contém os ficheiros da tua app.

  2. Carregue os ficheiros da sua aplicação para o espaço de trabalho Azure Databricks usando o comando sync. Substitua o caminho pelo local do espaço de trabalho onde você deseja carregar os arquivos.

    databricks sync --watch . /Workspace/Users/my-email@org.com/my-app
    

    A --watch flag mantém o processo de sincronização a correr e carrega automaticamente as alterações quando modificas ficheiros localmente. Para excluir ficheiros ou diretórios específicos da sincronização, adicione-os a um .gitignore ficheiro no diretório local da sua aplicação. Ficheiros comuns a excluir são node_modules/, .env, __pycache__/, .DS_Store, e quaisquer ficheiros de dados grandes ou artefactos de construção.

  3. Verifique o carregamento visualizando os ficheiros no seu espaço de trabalho. Clique em Ícone de Espaço de Trabalho na barra lateral e navegue até ao diretório que criou para a sua aplicação.

  4. Implemente a aplicação executando o seguinte comando. Substitui o nome da aplicação e o caminho do código-fonte pelos teus valores.

    databricks apps deploy my-app-name \
       --source-code-path /Workspace/Users/my-email@org.com/my-app
    

    A CLI mostra o progresso da implementação e confirma quando a aplicação está a funcionar.

Deployar a partir de um repositório Git

Para implementar uma aplicação a partir de um repositório Git, adicione o repositório ao nível da aplicação e depois especifique a referência Git quando a implementar. O seu repositório Git deve conter os ficheiros da aplicação, incluindo app.yaml, dependências e ponto de entrada. Todos os principais fornecedores Git são suportados, incluindo GitHub, GitLab e Bitbucket. Também pode implementar aplicações suportadas pelo Git usando os pacotes UI, CLI, API ou Declarative Automation Bundles.

Para configurar e implementar uma aplicação a partir do Git:

  1. Carregue os ficheiros da sua aplicação para um repositório Git.
  2. A partir do seu espaço de trabalho Azure Databricks, clique em ícone de computaçãoComputar na barra lateral.
  3. Vai ao separador Apps e seleciona uma app existente para editar ou clica em Criar app.
  4. No passo Configurar repositório Git , introduza a URL do repositório Git (por exemplo, https://github.com/org/repo) e selecione um fornecedor Git.
  5. Clique em Criar aplicação ou Guardar para voltar à página de detalhes da aplicação.
  6. Para repositórios privados, o principal de serviço da aplicação deve ter uma credencial Git configurada. Na página de detalhes da aplicação, clique em Configurar credencial Git, ou edite a aplicação e adicione a credencial na etapa Configurar repositório Git . Tens de ter CAN MANAGE permissões na aplicação para adicionar uma credencial Git. Repositórios públicos não exigem credencial Git. Para instruções de cada fornecedor, consulte Ligar o seu fornecedor Git ao Databricks.

Depois, implemente a aplicação:

  1. Na página de detalhes da aplicação, clique em Implementar.
  2. Selecione a opção "From Git".
  3. Para referência do Git, insira o nome do branch, tag ou commit SHA (por exemplo, main, v1.0.0, ou um commit hash).
  4. Para o tipo de referência, especifique o tipo de referência, como uma ramificação, etiqueta ou commit.
  5. (Opcional) Para o caminho do código-fonte, introduza um caminho para um diretório específico dentro do repositório. A aplicação trata esse diretório como o diretório de topo e não pode aceder a ficheiros fora dele. Se não especificares um caminho, o Databricks usa a raiz do repositório.
  6. Clique em Implementar.

Para referências a branch ou tags, o Azure Databricks implementa o commit mais recente desse branch ou tag. Para referências SHA de commit, o Azure Databricks implementa sempre esse commit específico. Se a credencial Git do principal de serviço for inválida ou expirada, a implementação falha.

Observação

As aplicações criadas antes da implementação do Git se tornar geralmente disponível não concedem automaticamente permissões aos CAN MANAGE criadores no principal de serviço da aplicação. Se precisares de adicionar uma credencial Git a uma aplicação mais antiga, pede a um administrador de espaço de trabalho que te CAN MANAGE conceda permissões no principal do serviço.

Os principais de serviço suportam uma credencial Git por fornecedor. Se atualizar a credencial noutro local, como através da consola da conta, isso substituirá a credencial existente para esse fornecedor.

Comportamento pós-implantação

Após a implementação concluída, Azure Databricks inicia a aplicação com base no command definido no ficheiro app.yaml ou por defeito executa python app.py. A página de detalhes da aplicação mostra o estado atual e fornece acesso a registos, histórico de implementação e informações do ambiente.

Exibir a página de detalhes do aplicativo após a implantação do aplicativo

Para exibir a saída do aplicativo implantado, clique no link do aplicativo.

Vá para a guia Logs para depuração e monitoramento de tempo de execução. Consulte Registro e monitoramento de aplicativos Databricks.

Atualize ou volte a implementar a aplicação

Reimplemente a sua aplicação depois de fazer alterações ao código-fonte ou à configuração. A redistribuição aplica as suas últimas atualizações sem recriar a aplicação. Podes redistribuir a partir do workspace ou do repositório Git a qualquer momento.

Reimplantar a partir de uma pasta de workspace

Para redistribuir a partir de uma pasta do espaço de trabalho:

  1. Atualiza os ficheiros da tua aplicação na pasta do espaço de trabalho.
  2. Selecione a aplicação e clique em Implementar.
  3. Se o caminho do código-fonte mudou ou estiveres a mudar de uma fonte Git, clica na seta ao lado de Deploy e seleciona Deploy usando uma fonte diferente.

Reimplantar a partir de um repositório Git

Para redistribuir a partir de um repositório Git:

  1. Empurra as tuas alterações para o repositório Git.
  2. No seu espaço de trabalho Azure Databricks, selecione a sua aplicação e clique em Deploy.
  3. Se a referência Git mudou ou estiver a mudar de uma fonte de workspace, clique na seta ao lado de Deploy e selecione Deploy usando uma fonte diferente.

Para alterar o repositório Git ou credencial, edite a configuração da aplicação. Para atualizar o repositório Git usando a CLI ou API, utilize o comando create-update . Remover o repositório Git da aplicação obriga a implementação a partir do espaço de trabalho.

Importante

Alterar o repositório Git ou alternar entre fontes de implementação (Git e workspace) elimina todas as credenciais Git do principal de serviço da aplicação. Mudar apenas a referência Git não apaga as credenciais. Tens de reconfigurar as credenciais antes de implementar novamente a partir do Git.

Resolução de problemas de implementação

Se a sua aplicação falhar ao implementar ou não correr como esperado, experimente os seguintes passos de resolução de problemas:

  • Verifique os logs para mensagens de erro ou saída em tempo de execução.
  • Valida app.yaml a sintaxe e as definições.
  • Verifique se os segredos e as variáveis de ambiente na env secção são resolvidas corretamente.
  • Confirme que todas as dependências necessárias estão incluídas ou instaladas.

Para implementações de repositórios Git:

  • Para repositórios privados, verifique se o principal de serviço da aplicação tem uma credencial Git configurada.
  • Verifique se a URL do repositório Git está correta e se a referência Git (branch, tag ou commit) existe no repositório.
  • Se um administrador de espaço de trabalho impõe implementações apenas no Git, não pode implementar ou iniciar uma aplicação a menos que ela tenha um repositório Git configurado.
  • Se implementares a partir do CLI, API ou Declarative Automation Bundles, cria primeiro a aplicação e depois adiciona a credencial Git ao principal de serviço da aplicação.

Próximos passos