Задача 4 (дополнительно). Объединение, сопоставление и публикация нового набора данных

Со временем в репозиторий MDS потребуется добавить дополнительные данные. Перед добавлением может быть полезно сравнить новые данные с данными, которые уже управляются в MDS, чтобы избежать повторения или добавления неточных данных. В надстройке служб Master Data Services для Excel можно объединять данные из двух листов, а также сравнивать данные для обнаружения и удаления повторений перед публикацией данных в MDS. Функция сопоставления надстройки MDS для Excel использует функциональность сопоставления служб DQS для выявления совпадений в данных. В этой задаче будет выполнено объединение данных из двух листов в один, а затем будет выполнено действие для выявления и удаления повторений перед публикацией в MDS. Дополнительные сведения см. в разделах Сопоставление качества данных в надстройке MDS для Excel разделы и Объединение данных.

  1. Запустите новый экземпляр Excel. Щелкните Пуск, затем Выполнить, введите Excel и нажмите кнопку ОК.

  2. Переключитесь на вкладку Основные данные, нажав кнопку Основные данные в строке меню.

  3. Нажмите кнопку Подключиться на ленте в группе Подключение и загрузка для подключения к серверу MDS. Это соединение было настроено ранее на этом занятии.

    Excel — кнопка отображения обозревателя на вкладке основных данных

  4. Справа должна появиться панель Обозреватель основных данных. Если обозреватель основных данных не отображается, нажмите на ленте кнопку Показать обозреватель.

  5. В окне Обозреватель основных данных выберите Suppliers в раскрывающемся списке поля Модель. Убедитесь, что модель имеет одну сущность: Supplier.

    Excel — окно обозревателя основных данных

  6. Дважды щелкните сущность Supplier в списке сущностей, чтобы загрузить ее элементы в лист Excel.

  7. Нажмите кнопку Лист2 в нижней части, чтобы перейти на вкладку Лист2. Если кнопка Лист2 не отображается, добавьте новый лист.

  8. Откройте файл Suppliers.xls (исходный входной файл, включенный в файлы учебника) и скопируйте все строки (3) из листа CombineAndCleanse на Лист2.

  9. Перейдите на лист Supplier в книге 1 — Microsoft Excel (а не Cleansed and Matched Supplier List Excel), подключенной к MDS.

  10. В строке меню выберите пункт Основные данные.

  11. Нажмите кнопку Объединить данные на ленте. Появится диалоговое окно Объединение данных.

  12. В диалоговом окне Объединение данных нажмите кнопку напротив текстового поля Диапазон для объединения с данными MDS, как показано на следующем изображении.

    Excel — диалоговое окно «Объединение данных»

  13. Теперь должно отобразиться свернутое диалоговое окно. Теперь нажмите кнопку Лист2, чтобы перейти на вкладку Лист2, в которой появятся новые данные поставщика (четыре строки, включая одну строку заголовков).

  14. На вкладке Лист2выберите все строки, включая строку заголовков (даже в случае если кажется, что уже выделены). Диапазон для объединения с данными MDS должен автоматически обновиться.

    Excel — диалоговое окно «Объединение данных» — минимизировано

  15. Перейдите на вкладку Suppliers, не закрывая диалоговое окно Объединение данных.

  16. Нажмите кнопку напротив текстового поля. Убедитесь, что диалоговое окно развернуто. Убедитесь, что все сопоставления столбцов сущности MDS Supplier со столбцами Excel были автоматически заполнены.

    Excel — диалоговое окно «Объединение данных» с данными

  17. Убедитесь, что столбец сущности Code сопоставлен со столбцом SupplierID в листе, а столбец сущности Zip Code сопоставлен со столбцом Zip Code в листе.

  18. В диалоговом окне Объединение данных нажмите кнопку Объединить.

  19. Убедитесь, что 3 строки данных были помещены в конец листа. Они должны быть выделены цветом.

    Excel — новые элементы после объединения

  20. Нажмите на ленте кнопку Сопоставить данные для обнаружения повторений. Эта функция использует функции сопоставления служб DQS.

  21. В диалоговом окне Сопоставить данные выберите Suppliers в качестве базы знаний служб DQS.

    Excel — диалоговое окно «Сопоставление данных»

  22. Сопоставьте столбцы листа с доменами, как показано в следующей таблице.

    Столбец листа

    Домен

    Code (Supplier ID был загружен как Code для сущности Supplier в MDS)

    Supplier ID

    Name (Supplier Name было загружено как Name для сущности Supplier в MDS)

    Имя поставщика

    ContactEmailAddress

    ContactEmail

  23. Выберите Необходимое условие для сопоставления столбца Code.

  24. Введите 70 % в качестве значения параметра вес для столбца Supplier Name, а также введите 30 % в качестве значения параметра вес для столбца Contact Email, как показано на рисунке.

  25. Нажмите кнопку ОК.

  26. Процесс сопоставления должен определить одно повторение для поставщика с кодом S1.

    Excel — результаты сопоставления

  27. Выберите повторяющуюся строку (выделена оранжевым цветом), щелкните ее правой кнопкой мыши и нажмите кнопку Удалить, чтобы удалить строку.

  28. Удалите столбец CLUSTER_ID, так как он больше не нужен.

  29. Нажмите кнопку Опубликовать, чтобы опубликовать две новые записи с кодами S66 и S57 в MDS.

  30. В диалоговом окне Публикация и заметки добавьте примечание и нажмите кнопку Опубликовать.

  31. Переключитесь в веб-приложение диспетчера основных данных.

  32. На домашней странице убедитесь, что выбрано значение Suppliers для параметра Модель и нажмите кнопку Обозреватель. Если имеется открытый Обозреватель, обновите интернет-браузер.

  33. Сортируйте список по столбцу код и найдите записи с кодами S57 и S66. Также можно использовать кнопку Фильтр на панели инструментов для поиска конкретной записи в списке.

  34. Теперь закройте окно Книга1 — Microsoft Excel без сохранения файла.

Следующий шаг

Задача 5. Создание атрибута на основе домена из Excel