Compartir a través de


Instalar Databricks Connect para Python

Nota

Este artículo describe Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores.

En este artículo se describe cómo instalar Databricks Connect para Python. Consulte ¿Qué es Databricks Connect?.

Requisitos

Antes de instalar Databricks Connect, asegúrese de que el área de trabajo y el entorno local cumplen los requisitos. Consulte Requisitos de uso de Databricks Connect.

Activación de un entorno virtual de Python

Databricks recomienda que tenga un entorno virtual de Python activado para cada versión de Python que use con Databricks Connect. Los entornos virtuales de Python ayudan a garantizar que usa las versiones correctas de Python y Databricks Connect juntas. Para obtener más información sobre estas herramientas y cómo activarlas, consulte venv o Poetry.

Instale el cliente de Databricks Connect

En esta sección se describe cómo instalar el cliente de Databricks Connect con venv o Poetry.

Nota

Si ya tiene instalada la extensión Databricks para Visual Studio Code, puede instalar Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores mediante la extensión . Consulte Depurar código mediante Databricks Connect en la extensión de Databricks para Visual Studio Code.

Instalación del cliente de Databricks Connect con venv

  1. Con el entorno virtual activado, desinstale PySpark, si ya está instalado, ejecutando el comando uninstall. Esto es necesario porque el paquete databricks-connect entra en conflicto con PySpark. Para información detallada, consulte Instalaciones de PySpark en conflicto. Para comprobar si PySpark ya está instalado, ejecute el comando show.

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. Con el entorno virtual aún activado, instale el cliente de Databricks Connect mediante la ejecución del comando install. Use la opción --upgrade para actualizar cualquier instalación de cliente existente a la versión especificada.

    pip3 install --upgrade "databricks-connect==16.4.*"  # Or X.Y.* to match your cluster version.
    

    Nota

    Databricks recomienda anexar la notación "dot-asterisk" para especificar databricks-connect==X.Y.* en lugar de databricks-connect=X.Y, para asegurarse de que está instalado el paquete más reciente. Aunque esto no es un requisito, permite asegurarse de que puede usar las características más recientes que admite ese clúster.

Instalación del cliente de Databricks Connect con Poetry

  1. Con el entorno virtual activado, desinstale PySpark, si ya está instalado, ejecutando el comando remove. Esto es necesario porque el paquete databricks-connect entra en conflicto con PySpark. Para información detallada, consulte Instalaciones de PySpark en conflicto. Para comprobar si PySpark ya está instalado, ejecute el comando show.

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. Con el entorno virtual aún activado, instale el cliente de Databricks Connect mediante la ejecución del comando add.

    poetry add databricks-connect@~16.4  # Or X.Y to match your cluster version.
    

    Nota

    Databricks recomienda usar la “notación at-tilde” para especificar databricks-connect@~16.4 en lugar de databricks-connect==16.4, para asegurarse de que el paquete más reciente está instalado. Aunque esto no es un requisito, permite asegurarse de que puede usar las características más recientes que admite ese clúster.