Поделиться через


Запуск кода Python в конструкторе Машинного обучения Azure

Внимание

В этой статье содержатся сведения об использовании пакета SDK машинного обучения Azure версии 1. Пакет SDK версии 1 устарел с 31 марта 2025 г. Поддержка будет завершена 30 июня 2026 г. Вы можете установить и использовать пакет SDK версии 1 до этой даты. Существующие рабочие процессы, использующие пакет SDK версии 1, будут продолжать работать после даты окончания поддержки. Однако они могут быть подвержены рискам безопасности или критическим изменениям в случае изменений архитектуры в продукте.

Рекомендуется перейти на пакет SDK версии 2 до 30 июня 2026 г. Дополнительные сведения о пакете SDK версии 2 см. в статье "Что такое ИНТЕРФЕЙС командной строки Машинного обучения Azure" и пакет SDK для Python версии 2 исправочник по пакету SDK версии 2.

В этой статье объясняется, как использовать компонент выполнения скрипта Python для добавления пользовательской логики в конструктор Azure Machine Learning. В этом руководстве вы используете библиотеку Pandas для простого проектирования функций.

Можно использовать встроенный редактор кода для быстрого добавления простой логики Python. Для добавления более сложного кода или отправки дополнительных библиотек Python следует использовать метод ZIP-файла.

Среда выполнения по умолчанию использует дистрибутив Python от Anaconda. Полный список предварительно установленных пакетов см. в справочнике по компоненту Execute Python Script.

Схема, показывющая входную карту для выполнения скрипта Python.

Внимание

Если графические элементы, упомянутые в этом документе, например кнопки в студии или конструкторе, не отображаются, возможно, у вас нет правильного уровня разрешений для рабочей области. Обратитесь к администратору подписки Azure, чтобы убедиться, что вам предоставлен правильный уровень доступа. Дополнительные сведения см. в статье Управление доступом к рабочей области Машинного обучения Azure.

Выполнение кода Python в конструкторе

Добавление компонента выполнения скрипта Python

  1. Войдите в студию машинного обучения Azure и выберите рабочую область, которую вы хотите использовать.

  2. Выберите конструктор в меню боковой панели. В разделе "Классическая предварительная версия" выберите "Создать новый конвейер" с помощью классических предварительно созданных компонентов.

  3. Слева от холста конвейера выберите компонент.

  4. В разделе Язык Python найдите компонент Выполнить скрипт Python. Перетащите компонент на холст конвейера.

Подключение входных наборов данных

  1. Найдите пример набора данных цен на автомобили (необработанный) в разделе "Пример данных ". Перетащите набор данных на холст конвейера.

  2. Подключите выходной порт набора данных к верхнему левому порту ввода компонента Выполнение сценария Python. Конструктор предоставляет входные данные в качестве параметра для сценария точки входа.

    Порт ввода справа зарезервирован для библиотек Python в формате ZIP.

    Снимок экрана, показывающий, как соединить узлы набора данных.

  3. Внимательно обратите внимание на используемый порт ввода. Конструктор назначает левый входной порт переменной dataset1и средний входной порт dataset2.

Входные компоненты являются необязательными, так как вы можете создавать или импортировать данные непосредственно в компоненте скрипта Python.

Написание кода Python

Конструктор предоставляет сценарий начальной точки входа для редактирования и ввода собственного кода Python.

В этом примере вы используете Pandas для объединения двух столбцов набора данных автомобилей, Price и Horsepower, чтобы создать новый столбец с именем "Доллары на лошади". Этот столбец представляет, сколько вы платите за каждую единицу лошадиных сил, которая может стать полезной точкой информации, чтобы решить, является ли конкретный автомобиль хорошей сделкой по его цене.

  1. Дважды щелкните компонент Выполнить скрипт Python.

  2. В области, расположенной справа от холста, выберите текстовое поле Сценарий Python.

  3. Скопируйте и вставьте следующий код в текстовое поле:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Конвейер должен выглядеть следующим образом:

    Снимок экрана: конвейер Execute Python.

    Сценарий точки входа должен содержать функцию azureml_main. Функция имеет два параметра функции, которые сопоставляют два входных порта для компонента "Выполнение скрипта Python".

    Возвращаемое значение должно быть объектом Pandas DataFrame. В качестве выходных данных можно вернуть не более двух кадров данных.

  4. Отправьте конвейер.

Теперь у вас есть набор данных, который имеет новую функцию $/HP . Эта новая функция может помочь обучить рекомендуемого автомобиля. В этом примере показано извлечение признаков и уменьшение размерности.

Следующий шаг