Задача 2. Тестирование и публикация политики сопоставления

В этой задаче вы протестируете и опубликуете политику сопоставления "Удалить повторяющиеся поставщики ".

  1. На странице "Результаты сопоставления " нажмите кнопку "Пуск ", чтобы проверить всю политику. В вашем случае в политике есть только правило, поэтому результаты тестирования правила и политики должны совпадать.

  2. Просмотрите все соответствующие записи и их оценку совпадения в поле списка. Запись с зеленым значком, связанным с ней, является дубликатом опорной записи, предшествующей ей. Ниже приведено несколько примеров.

    1. Запись с идентификатором записи: 1000005 соответствует записи с идентификатором записи: 1000004 с показателем: 100% , так как обе записи имеют одинаковые значения для столбцов SupplierID (предварительные требования),имени поставщика и ContactEmailAddress. DQS случайным образом выбирает запись в качестве сводной записи для кластера.

    2. Запись 1000023 соответствует 1000022 записи с оценкой сопоставления: 93%, так как две записи имеют одинаковые значения для столбцов "ПоставщикID( предварительные требования) и имени поставщика , но разные значения для столбца ContactEmailAddress .

    3. Прокрутите страницу до нижней части списка, чтобы просмотреть две записи с идентификаторами записей: 1000051 и 1000052. Запись 1000052 считается совпадением со оценкой 91% , так как две записи имеют одинаковые значения для столбцов SupplierID и ContactEmailAddress , но разные значения для столбца "Имя поставщика ".

    Определение политики — определение политики результатов политики

  3. Щелкните правой кнопкой мыши любую соответствующую запись (с зеленым значком) и щелкните "Просмотреть сведения ", чтобы просмотреть дополнительные сведения о сопоставлении, например о вкладе каждой оценки полей в общую оценку сопоставления.

    Диалоговое окно "Соответствие "

  4. Нажмите кнопку "Закрыть", чтобы закрыть диалоговое окно "Сведения о оценке соответствия ".

  5. Щелкните вкладку "Результаты сопоставления" в нижней части страницы. Эта вкладка содержит сведения, такие как количество сопоставленных записей, количество несовпаденных записей, количество кластеров с соответствующими записями, средний размер кластера, минимальный размер кластера и максимальный размер кластера. Дополнительные сведения см. в статье "Создание политики сопоставления ". Вы не можете экспортировать результаты из этого действия. Вы просто определяете политику сопоставления, используя выборочные данные для тестирования правил и политики на этих данных.

    Вкладка сопоставления результатов

  6. Нажмите кнопку "Готово ", чтобы завершить создание политики сопоставления.

    Замечание

    Вы определили политику сопоставления здесь; поэтому вы не можете экспортировать результаты в выходной файл. В основном вы использовали образец входного файла, созданные правила и проверили правила и политику для выборки данных с целью определения политики.

  7. В диалоговом окне "Службы качества данных SQL Server" нажмите кнопку "Опубликовать " и нажмите кнопку "ОК " в поле сообщения. Теперь определенная политика сопоставления публикуется в базе знаний поставщиков . Базу знаний можно использовать для выполнения процесса сопоставления с входным файлом для выявления и удаления дубликатов.

Следующий шаг

Задача 3. Создание и запуск проекта качества данных для сопоставления