Поделиться через


Быстрый старт: Создание задания по копированию файлов

Задачи копирования в Data Factory загружают данные без необходимости создания конвейера Fabric. Он объединяет различные шаблоны копирования, такие как массовая или пакетная, добавочная или непрерывная копия в унифицированном интерфейсе. Если вам нужно копировать данные только без преобразований, используйте задание копирования.

В этом кратком руководстве описано, как постепенно копировать данные из таблицы хранилища Fabric в таблицу Fabric Lakehouse с помощью задания копирования.

Дополнительные сведения о заданиях копирования в целом см. в следующем разделе:

Предпосылки

Перед началом работы выполните следующие предварительные требования:

  • Клиент Microsoft Fabric с активной подпиской. Вы можете создать бесплатную учетную запись.

  • Рабочая область Microsoft Fabric..

  • Склад ткани.

  • Таблица на складе, включающая инкрементный столбец, например, отметка времени или увеличивающийся целый столбец, который может служить меткой для обнаружения изменений. Этот скрипт можно также использовать для создания примера таблицы Employee:

    CREATE TABLE dbo.Employee 
    
    ( 
        EmployeeID INT NOT NULL, 
        FirstName VARCHAR(40), 
        LastName VARCHAR(40), 
        Position VARCHAR(60), 
        ModifiedDate DATETIME2(3) 
    ); 
    

    Вставка примеров данных:

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) 
    VALUES  
    (1, 'Alice', 'Smith', 'Data Analyst', SYSDATETIME()), 
    (2, 'Bob', 'Johnson', 'Engineer', SYSDATETIME()), 
    (3, 'Carol', 'Lee', 'Manager', SYSDATETIME()), 
    (4, 'David', 'Wong', 'Data Scientist', SYSDATETIME()), 
    (5, 'Eve', 'Garcia', 'Product Owner', SYSDATETIME());
    

    Снимок экрана: созданная таблица сотрудников.

Создание задания копирования

  1. В рабочей области Microsoft Fabric выберите +Создать элемент и в разделе "Получить данные " выберите "Копировать задание".

    Снимок экрана: рабочая область Fabric с выбранной кнопкой нового элемента и задание копирования, выделенное в разделе получения данных.

  2. Присвойте заданию копирования имя и нажмите кнопку "Создать".

    Снимок экрана: именованное задание копирования с выделенной кнопкой создания.

Настройка добавочного копирования

  1. На странице "Выбор источника данных " мастера задания копирования выберите хранилище Fabric.

    Снимок экрана: страница выбора источника данных мастера создания задания копирования с выбранным хранилищем.

  2. На странице "Выбор данных" выберите исходную таблицу Хранилища, содержащую добавочный столбец. Нажмите кнопку Далее.

    Снимок экрана: страница выбора данных с выбранной таблицей SQL сотрудника.

  3. На странице "Выбор назначения данных " выберите Lakehouse в разделе New Fabric.

    Снимок экрана страницы выбора назначения данных, где выбрано Lakehouse.

  4. Укажите имя нового Lakehouse и нажмите кнопку "Создать" и подключиться.

    Снимок экрана окна именования нового озерного дома с выбранными опциями создания и подключения.

  5. На странице "Карта с назначением " выберите "Таблицы", при необходимости переименуйте целевую таблицу и нажмите кнопку "Далее".

    Снимок экрана карты к странице назначения с выбранной таблицей сотрудников.

  6. На шаге "Параметры" выберите добавочное копирование в качестве режима задания копирования. Выберите столбец, который служит добавочным столбцом. Для примера таблицы это ДатаИзменения.

    Снимок экрана страницы параметров с выбранным режимом добавочного копирования и добавочным столбцом, установленным на ModifiedDate.

Запуск и мониторинг задания копирования

  1. На странице проверки и сохранения проверьте параметры. Оставьте параметр по умолчанию для немедленного запуска передачи данных и при необходимости установите задание копирования каждые 1 минуту для ускорения отслеживания изменений.

  2. Сохраните задание копирования и запустите первое выполнение, нажав кнопку "Сохранить и запустить ".

    Снимок экрана: страница проверки и сохранения с параметрами выполнения, установленными для выполнения по расписанию каждые одну минуту.

  3. После успешного сохранения элемента задания копирования он запускает первый запуск, чтобы перенести исходные данные из исходной таблицы.

  4. Используйте панель "Копирование задания " или "Центр мониторинга ", чтобы отслеживать ход выполнения. Узнайте больше о мониторинге заданий копирования.

    Снимок экрана концентратора мониторинга, показывающий успешное задание с пятью считанными строками и пятью записанными строками.

Имитация изменений с новыми данными

  1. Если вы использовали пример таблицы, используйте следующий SQL-запрос для вставки новых строк в таблицу хранилища Source Fabric.

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (6, 'John', 'Miller', 'QA Engineer', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (7, 'Emily', 'Clark', 'Business Analyst', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (8, 'Michael', 'Brown', 'UX Designer', SYSDATETIME()); 
    
  2. Задание копирования использует добавочный столбец для обнаружения этих строк во время следующего запланированного выполнения.

    Снимок экрана страницы мониторинга, показывающий успешную операцию с тремя строками, считанными и тремя строками, записанными.

  3. После следующего запуска запросите целевую таблицу Fabric Lakehouse, чтобы убедиться, что таблица была перемещена.

    Снимок экрана: таблица Fabric Lakehouse со всеми строками, записанными в таблицу.