Задача 1. Определение политики соответствия

В этой задаче будет создана политика проверки соответствия с одним правилом. Правило будет иметь одно предварительное условие — Идентификатор поставщика, то есть идентификаторы поставщика должны совпадать перед использованием других доменов в правиле. Правило использует два других домена: Имя поставщика со значением Подобие, равным 70 %, и Адрес электронной почты со значением Подобие, равным 30 %.

  1. На главной странице Клиент DQS щелкните СТРЕЛКУ ВПРАВО рядом с базой знаний Поставщики и выберите Политика проверки соответствия.

    Меню «Политика сопоставления» на главной странице

  2. На странице Сопоставление выберите Файл Excel как Источник данных.

  3. Нажмите кнопку Обзор, чтобы фильтр имел значение Книга Excel и выберите файл Cleansed Supplier List.xls, который был экспортирован после выполнения операций очистки.

    ПримечаниеПримечание

    После выполнения этих действий нельзя экспортировать результаты, поскольку действие в основном ориентировано на определение политики проверки соответствия. Вы создадите проект качества данных для действия сопоставления и выполните его для удаления повторений из списка поставщиков с помощью политики проверки соответствия на следующем занятии.

  4. Сопоставьте столбец SupplierID с доменом Идентификатор поставщика, столбец Имя поставщика с доменом Имя поставщика, столбец ContactEmailAddress с доменом Адрес электронной почты.. Необходимо сопоставить исходные столбцы лишь с доменами, которые должны использоваться при определении политики проверки соответствия. В этом случае пользователь задает домены идентификатора поставщика, имени поставщика и электронной почты контактного лица как доступные для политики проверки соответствия.

    Страница сопоставления процесса определения политики сопоставления

  5. Нажмите кнопку Далее, чтобы перейти к странице Политика проверки соответствия, на которой будет определена политика проверки соответствия с одним правилом.

  6. Нажмите кнопку Создать правило сопоставления на панели инструментов для создания правила в политике.

    Кнопка панели инструментов «Создать правило сопоставления»

  7. На панели Сведения о правиле справа введите Удаление повторяющихся поставщиков в параметре Имя правила.

  8. Нажмите кнопку Добавить новый элемент домена на панели инструментов на правой панели.

    Подробности правила — кнопка «Добавить новый элемент домена»

  9. Выберите Идентификатор поставщика для параметра домен и установите флажок Необходимое условие. Обратите внимание, что Подобие автоматически принимает значение Точное. Назначая параметру Идентификатор поставщика значение Обязательное условие, можно указать, что значения для этого поля в двух разных записях должны возвращать 100-процентное совпадение, иначе эти записи не рассматриваются как совпадающие и другие предложения в правиле не учитываются.

    Определение правила удаления дублирующихся поставщиков

  10. Повторно нажмите кнопку Добавить новый элемент домена на панели инструментов.

  11. Выберите домен Имя поставщика, выберите значение Подобный для параметра Подобие и введите значение 70 для параметра Вес. Здесь указывается, что имена поставщика не обязательно должны быть одинаковыми, но могут быть похожими, чтобы считать записи соответствующими. Вес отражает вклад показателя этого поля в общий показатель сопоставления.

  12. Повторите два предыдущих шага, чтобы добавить домен Адрес электронной почты со значением 30 в поле Вес.

  13. Обратите внимание, что параметру минимальная оценка совпадения присвоено значение 80 %, которое отображается на вкладке Общие страницы Конфигурация в Администрирование служб DQS. Можно только увеличить эту оценку сверх указанного порогового значения.

  14. Обратите внимание, что выбран режим Перекрывающиеся кластеры. Если выбран этот параметр, запись может отображаться в нескольких кластерах. Если изменить значение параметра на неперекрывающиеся кластеры, то кластеры, которые имеют общие записи, объединяются в один кластер.

  15. Кнопка Пуск на этой странице позволяет проверить каждое правило в политике отдельно, а кнопка «Пуск» на следующей странице позволяет проверить политику целиком (все правила в политике).

  16. Нажмите кнопку Далее, чтобы перейти на страницу Результаты сопоставления.

Следующий шаг

Задача 2. Тестирование и публикация сопоставления