Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой задаче вы создаете политику сопоставления с одним правилом. Правило будет иметь одно обязательное условие: идентификатор поставщика, что означает, что идентификаторы поставщика должны соответствовать перед использованием других доменов в правиле. Правило использует два других домена: имя поставщика со значением сходства , равное 70% , и контактная почта со значением сходства имеет значение 30%.
На главной странице клиента DQS щелкните правой кнопкой мыши рядом с базой знаний "Поставщики " и выберите "Политика сопоставления".
На странице "Карта" выберите файл Excel для источника данных.
Нажмите кнопку "Обзор", убедитесь, что фильтр имеет значение "Книга Excel" и выберите "Очищенный поставщик" List.xlsфайл, экспортированный после выполнения действия очистки.
Замечание
В конце этого действия невозможно экспортировать результаты, так как это действие в основном сосредоточено на определении политики сопоставления. Вы создадите проект качества данных для действия сопоставления и запустите его, чтобы удалить дубликаты из списка поставщиков с помощью этой политики сопоставления в следующем занятии.
Сопоставьте столбец SupplierID с доменом Supplier ID, столбец Supplier Name с доменом Supplier Name, столбец ContactEmailAddress с доменом Contact Email. Необходимо сопоставить только исходные столбцы с доменами, которые необходимо использовать при определении политики сопоставления. В этом случае вы делаете идентификатор поставщика, имя поставщика и контактный email доступными для активности политики сопоставления.
Нажмите кнопку "Далее ", чтобы перейти на страницу политики сопоставления, в которой вы определите политику сопоставления с одним правилом в нем.
Нажмите кнопку "Создать соответствующее правило " на панели инструментов, чтобы создать правило в политике.
В области сведений о правиле справа введите "Удалить повторяющихся поставщиков " для имени правила.
Нажмите кнопку "Добавить новый элемент домена " на панели инструментов справа.
Выберите идентификатор поставщика для домена и установите флажок "Предварительные требования ". Обратите внимание, что сходство автоматически задано как "Точное". При задании идентификатора поставщика в качестве необходимого условия необходимо указать, что значения для этого поля в двух записях должны обеспечивать 100% совпадения, иначе записи не считаются совпадением, и остальные предложения в правиле не рассматриваются.
Снова нажмите кнопку "Добавить новый элемент домена " на панели инструментов.
Выберите домен Имя поставщика, выберите Сходное для Сходства и введите 70 для веса. Здесь вы указываете, что имена поставщиков не должны совпадать, но могут быть похожими для записей, которые следует рассматривать как совпадение. Вес указывает на вклад оценки этого поля в общую оценку соответствия.
Повторите предыдущие два шага, чтобы добавить домен контактной электронной почты с 30 для веса.
Обратите внимание, что для минимальной оценки сопоставления задано значение 80%, которое отображается на вкладке "Общие" страницы "Конфигурация" администрирования DQS. Вы можете увеличить эту оценку только выше этого порогового значения.
Обратите внимание, что выбран параметр "Перекрывающиеся кластеры ". С помощью этого параметра запись может отображаться в нескольких кластерах. Если изменить параметр на неперекрытые кластеры, кластеры с общими записями объединяются в один кластер.
Кнопка "Пуск " на этой странице позволяет протестировать каждое правило в политике отдельно, а кнопка "Пуск" на следующей странице позволяет протестировать всю политику (все правила в политике).
Нажмите кнопку "Далее", чтобы перейти на страницу "Результаты сопоставления ".