Databricks

Заметка

Этот соединитель принадлежит и предоставляется Databricks.

Сводка

Пункт Описание
Статус релиза Общая доступность
Продукция Power BI (семантические модели)
Power BI (потоки данных)
Fabric (Dataflow 2-го поколения)
Поддерживаемые типы проверки подлинности Имя пользователя и пароль
Персональный токен доступа
OAuth (OIDC)

Заметка

Некоторые возможности могут присутствовать в одном продукте, но не другие из-за расписаний развертывания и возможностей для конкретного узла.

Заметка

Соединитель Databricks для Power BI теперь поддерживает драйвер Arrow Database Connectivity (ADBC). Эта функция доступна как предварительная версия. Подробнее см. здесь.

Необходимые условия

Этот соединитель предназначен только для использования с хранилищем SQL Databricks, работающим в AWS и с помощью OAuth. Если вы используете Azure Databricks, используйте соединитель Azure Databricks. Если вы не используете OAuth с хранилищем SQL Databricks (в AWS или GCP), используйте соединитель Azure Databricks. Databricks Community Edition не поддерживается.

Поддерживаемые возможности

  • Импорт
  • DirectQuery (семантические модели Power BI)

Подключение к Databricks из Power Query Desktop

Чтобы подключиться к Databricks из Power Query Desktop, сделайте следующее:

  1. В среде получения данных выполните поиск по Databricks, чтобы отобрать соединитель Databricks. Вы должны использовать только соединитель Databricks здесь для данных хранилища SQL Databricks (работает в AWS), если вы используете OAuth для проверки подлинности.

    получить данные из Облака Databricks.

  2. Укажите имя узла сервера и путь HTTP для хранилища SQL Databricks. Обратитесь к разделу Настройка драйверов ODBC и JDBC Databricks за инструкциями по нахождению вашего "имени узла сервера" и "HTTP Path". Введите эти сведения соответствующим образом. При необходимости можно указать каталог по умолчанию и (или) базу данных в разделе Дополнительные параметры. Нажмите кнопку ОК, чтобы продолжить.

    Укажите ваше хранилище SQL Databricks.

  3. Предоставьте учетные данные для проверки подлинности в хранилище SQL Databricks. У вас есть три варианта учетных данных:

    • Учетные данные клиента Databricks. См. раздел Databricks OAuth M2M для получения инструкций по генерации учетных данных клиента Databricks OAuth M2M.

    • Личный маркер доступа. См. в персональных маркерах доступа инструкцию по созданию персонального маркера доступа (PAT).

    • OAuth (OIDC). Войдите в учетную запись организации с помощью всплывающего окна браузера.

      Укажите соответствующий маркер.

    Заметка

    После ввода учетных данных для определенного хранилища SQL Databricks Power BI кэширует и повторно использует те же учетные данные при последующих попытках подключения. Эти учетные данные можно изменить, перейдя в Файл > Параметры и настройки > Настройки источника данных. Дополнительные сведения: Изменение метода проверки подлинности

  4. После успешного подключения, навигатор показывает данные, доступные вам в кластере. Вы можете выбрать Transform Data для преобразования данных с помощью Power Query или Load для загрузки данных в Power Query Desktop.

    Изображение навигатора Power Query, загружающего данные Databricks Cloud в настольное приложение.

Подключение к данным Databricks из Power Query Online

Чтобы подключиться к Databricks из Power Query Online, сделайте следующее:

  1. Выберите параметр Databricks в интерфейсе получения данных. Различные приложения имеют различные способы получения данных в Power Query Online. Дополнительные сведения о том, как получить доступ к возможности получения данных в Power Query Online из вашего приложения, смотрите в разделе Где получить данные.

    Отфильтруйте доступные соединители Databricks с помощью поля поиска. Выберите коннектор Databricks для вашего SQL хранилища Databricks.

    Снимок экрана вариантов соединителей Databricks в Power Query.

  2. Введите имя узла сервера и путь HTTP для хранилища SQL Databricks. Обратитесь к разделу Настройка драйверов ODBC и JDBC Databricks за инструкциями по нахождению вашего "имени узла сервера" и "HTTP Path". При необходимости можно указать каталог по умолчанию и (или) базу данных в разделе Дополнительные параметры.

    Скриншот с параметрами подключения и учетными данными для онлайн-сервисов Databricks.

  3. Предоставьте учетные данные для проверки подлинности в хранилище SQL Databricks. Существует три варианта учетных данных:

    • Базовый. Используйте этот параметр при проверке подлинности с помощью имени пользователя и пароля. Этот параметр недоступен, если ваша организация или учетная запись использует 2FA/MFA.
    • Ключ учетной записи. Используйте этот параметр при проверке подлинности с помощью личного токена доступа. См. в персональных маркерах доступа инструкцию по созданию персонального маркера доступа (PAT).
    • Учетная запись организации. Используйте этот параметр при проверке подлинности с помощью OAuth. Войдите в учетную запись организации с помощью всплывающего окна браузера.
  4. После успешного подключения навигатор появляется и отображает данные, доступные на сервере. Выберите данные в навигаторе. Затем выберите Next для преобразования данных в Power Query.

    Скриншот навигатора Power Query, загружающего данные Databricks Cloud в онлайн-приложение.

Заметка

Соединитель Power BI Service Databricks не поддерживает нативный запрос.

Реализация соединителя драйвера подключения к базе данных Arrow (предварительная версия)

Драйвер Arrow Database Connectivity (ADBC) для соединителя Databricks можно использовать в Power BI. Так как мы продолжаем улучшать и добавлять новые возможности в этот соединитель, рекомендуется обновить до последней версии, чтобы попробовать ее и отправить отзыв о продукте.

Чтобы переключиться на драйвер ADBC, выполните следующие действия.

  1. Откройте нужную панель мониторинга в Power BI.

  2. Выберите Преобразование данных.

  3. Выберите Advanced Editor в разделе параметра Query.

  4. Укажите Implementation="2.0" для ADBC.

    let
        Source = DatabricksMultiCloud.Catalogs("<instance-name>.cloud.databricks.net", "/sql/1.0/warehouses/<sql-warehouse-id>",
            [Catalog=null, Database=null, EnableAutomaticProxyDiscovery=null, Implementation="2.0"]),
        powerbi_Database = Source{[Name="powerbi",Kind="Database"]}[Data],
        default_Schema = powerbi_Database{[Name="default",Kind="Schema"]}[Data],
        dashboard_data_Table = default_Schema{[Name="dashboard_data",Kind="Table"]}[Data]
    in
        dashboard_data_Table