Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой задаче будет создана политика проверки соответствия с одним правилом. Правило будет иметь одно предварительное условие — Идентификатор поставщика, то есть идентификаторы поставщика должны совпадать перед использованием других доменов в правиле. Правило использует два других домена: Имя поставщика со значением Подобие, равным 70 %, и Адрес электронной почты со значением Подобие, равным 30 %.
На главной странице Клиент DQS щелкните СТРЕЛКУ ВПРАВО рядом с базой знаний Поставщики и выберите Политика проверки соответствия.
.jpg)
На странице Сопоставление выберите Файл Excel как Источник данных.
Нажмите кнопку Обзор, чтобы фильтр имел значение Книга Excel и выберите файл Cleansed Supplier List.xls, который был экспортирован после выполнения операций очистки.
ПримечаниеПосле выполнения этих действий нельзя экспортировать результаты, поскольку действие в основном ориентировано на определение политики проверки соответствия. Вы создадите проект качества данных для действия сопоставления и выполните его для удаления повторений из списка поставщиков с помощью политики проверки соответствия на следующем занятии.
Сопоставьте столбец SupplierID с доменом Идентификатор поставщика, столбец Имя поставщика с доменом Имя поставщика, столбец ContactEmailAddress с доменом Адрес электронной почты.. Необходимо сопоставить исходные столбцы лишь с доменами, которые должны использоваться при определении политики проверки соответствия. В этом случае пользователь задает домены идентификатора поставщика, имени поставщика и электронной почты контактного лица как доступные для политики проверки соответствия.
.jpg)
Нажмите кнопку Далее, чтобы перейти к странице Политика проверки соответствия, на которой будет определена политика проверки соответствия с одним правилом.
Нажмите кнопку Создать правило сопоставления на панели инструментов для создания правила в политике.
.jpg)
На панели Сведения о правиле справа введите Удаление повторяющихся поставщиков в параметре Имя правила.
Нажмите кнопку Добавить новый элемент домена на панели инструментов на правой панели.
.jpg)
Выберите Идентификатор поставщика для параметра домен и установите флажок Необходимое условие. Обратите внимание, что Подобие автоматически принимает значение Точное. Назначая параметру Идентификатор поставщика значение Обязательное условие, можно указать, что значения для этого поля в двух разных записях должны возвращать 100-процентное совпадение, иначе эти записи не рассматриваются как совпадающие и другие предложения в правиле не учитываются.
.jpg)
Повторно нажмите кнопку Добавить новый элемент домена на панели инструментов.
Выберите домен Имя поставщика, выберите значение Подобный для параметра Подобие и введите значение 70 для параметра Вес. Здесь указывается, что имена поставщика не обязательно должны быть одинаковыми, но могут быть похожими, чтобы считать записи соответствующими. Вес отражает вклад показателя этого поля в общий показатель сопоставления.
Повторите два предыдущих шага, чтобы добавить домен Адрес электронной почты со значением 30 в поле Вес.
Обратите внимание, что параметру минимальная оценка совпадения присвоено значение 80 %, которое отображается на вкладке Общие страницы Конфигурация в Администрирование служб DQS. Можно только увеличить эту оценку сверх указанного порогового значения.
Обратите внимание, что выбран режим Перекрывающиеся кластеры. Если выбран этот параметр, запись может отображаться в нескольких кластерах. Если изменить значение параметра на неперекрывающиеся кластеры, то кластеры, которые имеют общие записи, объединяются в один кластер.
Кнопка Пуск на этой странице позволяет проверить каждое правило в политике отдельно, а кнопка «Пуск» на следующей странице позволяет проверить политику целиком (все правила в политике).
Нажмите кнопку Далее, чтобы перейти на страницу Результаты сопоставления.