Задача 3. Создание и запуск проекта качества данных для сопоставления

В этой задаче вы создадите проект обеспечения качества данных для операции сопоставления и запустите процесс сопоставления на очищенных данных поставщика, чтобы удалить все дубликаты.

  1. На главной странице клиента DQS щелкните новый проект качества данных.

  2. Введите «Удаление дубликатов поставщиков» в поле Название проекта.

  3. Выберите поставщиков из списка ключевых показателей эффективности для поля "Использование базы знаний ". Вы создали политику сопоставления в этой базе знаний на предыдущем занятии.

  4. Выберите "Сопоставление" из списка действий в нижней правой области.

    Новый проект качества данных — выбранное сопоставление

  5. Нажмите кнопку Далее.

  6. На странице Сопоставление выберите Файл Excel как Источник данных.

  7. Нажмите «Обзор» и выберите «Очищенный поставщик List.xls», который является выходным файлом после выполнения процесса очистки.

  8. Сопоставьте исходный столбец SupplierID с доменом Идентификатор поставщика, столбец Имя поставщика с доменом Имя поставщика, и столбец ContactEmailAddress с доменом Контактный адрес электронной почты.

  9. Нажмите кнопку "Далее ", чтобы перейти на страницу сопоставления .

  10. Нажмите кнопку "Пуск" , чтобы начать соответствующий процесс. Вы должны увидеть результаты, аналогичные результатам предыдущей задачи, так как вы использовали тот же входной файл для определения политики сопоставления.

  11. Просмотрите все соответствующие записи и их оценку совпадения в поле списка. Результаты должны совпадать с результатами, которые вы видели в предыдущей задаче. См. шаги, описанные в предыдущей задаче, чтобы проанализировать результаты из этого соответствующего действия.

  12. Нажмите кнопку "Далее ", чтобы перейти на страницу экспорта .

Следующий шаг

Задача 4. Экспорт результатов из соответствующего действия в файл Excel