Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Nota
Este artículo describe Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores.
En este artículo se describe cómo instalar Databricks Connect para Python. Consulte ¿Qué es Databricks Connect?.
Requisitos
Antes de instalar Databricks Connect, asegúrese de que el área de trabajo y el entorno local cumplen los requisitos. Consulte Requisitos de uso de Databricks Connect.
Activación de un entorno virtual de Python
Databricks recomienda que tenga un entorno virtual de Python activado para cada versión de Python que use con Databricks Connect. Los entornos virtuales de Python ayudan a garantizar que usa las versiones correctas de Python y Databricks Connect juntas. Para obtener más información sobre estas herramientas y cómo activarlas, consulte venv o Poetry.
Instale el cliente de Databricks Connect
En esta sección se describe cómo instalar el cliente de Databricks Connect con venv o Poetry.
Nota
Si ya tiene instalada la extensión Databricks para Visual Studio Code, puede instalar Databricks Connect para Databricks Runtime 13.3 LTS y versiones posteriores mediante la extensión . Consulte Depurar código mediante Databricks Connect en la extensión de Databricks para Visual Studio Code.
Instalación del cliente de Databricks Connect con venv
Con el entorno virtual activado, desinstale PySpark, si ya está instalado, ejecutando el comando
uninstall. Esto es necesario porque el paquetedatabricks-connectentra en conflicto con PySpark. Para información detallada, consulte Instalaciones de PySpark en conflicto. Para comprobar si PySpark ya está instalado, ejecute el comandoshow.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkCon el entorno virtual aún activado, instale el cliente de Databricks Connect mediante la ejecución del comando
install. Use la opción--upgradepara actualizar cualquier instalación de cliente existente a la versión especificada.pip3 install --upgrade "databricks-connect==16.4.*" # Or X.Y.* to match your cluster version.Nota
Databricks recomienda anexar la notación "dot-asterisk" para especificar
databricks-connect==X.Y.*en lugar dedatabricks-connect=X.Y, para asegurarse de que está instalado el paquete más reciente. Aunque esto no es un requisito, permite asegurarse de que puede usar las características más recientes que admite ese clúster.
Instalación del cliente de Databricks Connect con Poetry
Con el entorno virtual activado, desinstale PySpark, si ya está instalado, ejecutando el comando
remove. Esto es necesario porque el paquetedatabricks-connectentra en conflicto con PySpark. Para información detallada, consulte Instalaciones de PySpark en conflicto. Para comprobar si PySpark ya está instalado, ejecute el comandoshow.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkCon el entorno virtual aún activado, instale el cliente de Databricks Connect mediante la ejecución del comando
add.poetry add databricks-connect@~16.4 # Or X.Y to match your cluster version.Nota
Databricks recomienda usar la “notación at-tilde” para especificar
databricks-connect@~16.4en lugar dedatabricks-connect==16.4, para asegurarse de que el paquete más reciente está instalado. Aunque esto no es un requisito, permite asegurarse de que puede usar las características más recientes que admite ese clúster.