Задача 4 (необязательно): объединение, сопоставление и публикация нового набора данных

Со временем вы захотите добавить дополнительные данные в репозиторий MDS. Перед добавлением данных можно сравнить новые данные с данными, уже управляемыми в MDS, чтобы убедиться, что вы не добавляете повторяющиеся или неточные данные. В надстройке Master Data Services для Excel можно объединить данные из двух листов и сравнить данные для выявления и удаления дубликатов перед публикацией данных в MDS. Функция сопоставления надстройки MDS Excel использует функциональность сопоставления DQS для идентификации совпадений в данных. В этой задаче вы объедините данные из двух листов в один, а затем выполните соответствующее действие, чтобы определить и удалить дубликаты перед публикацией в MDS. См. разделы Качественное соответствие данных в надстройке MDS для Excel и Объединение данных для получения более подробной информации.

  1. Запустите новый экземпляр Excel. Нажмите кнопку "Пуск", наведите указатель на запуск, введите Excel и нажмите кнопку "ОК".

  2. Перейдите на вкладку "Основные данные" , щелкнув "Основные данные " в строке меню.

  3. Нажмите кнопку "Подключиться" на ленте в группе "Подключение и загрузка ", чтобы подключиться к серверу MDS. Вы уже настроили это подключение ранее в этом уроке.

    Excel — кнопка

  4. Вы должны видеть панель "Обозреватель основных данных" справа. Если обозреватель основных данных не отображается, нажмите кнопку "Показать обозреватель " на ленте.

  5. В окне обозревателя основных данных выберите "Поставщики " в раскрывающемся списке для модели. Вы увидите, что модель имеет одну сущность: поставщик.

    Excel — окно

  6. Дважды щелкните "Поставщик" в списке сущностей, чтобы загрузить элементы сущности на лист Excel.

  7. Щелкните Лист2 внизу, чтобы перейти на вкладку "Лист2 ". Если лист 2 не отображается, добавьте новый лист.

  8. Откройте файлSuppliers.xls (исходный входной файл, включенный в файлы учебника) и скопируйте все (три) строки из листа CombineAndCleanse на Лист 2.

  9. Вернитесь к листу Поставщик в Книге 1 — Microsoft Excel (а не в Excel-списке Очищенный и Соответствующий список поставщиков), подключенном к MDS.

  10. Щелкните "Основные данные" в строке меню.

  11. Нажмите кнопку "Объединить данные " на ленте. Откроется диалоговое окно "Объединение данных ".

  12. В диалоговом окне «Объединение данных» нажмите кнопку рядом с текстовым полем «Диапазон для объединения с данными MDS», как показано на следующем рисунке.

    Excel — диалоговое окно

  13. Теперь вы должны увидеть свернувшееся диалоговое окно. Теперь щелкните Лист2 , чтобы перейти на вкладку Sheet2 с новыми данными поставщика с 4 строками (включая одну строку заголовка).

  14. В листе 2 выберите все строки, включая строку заголовка (даже если они уже выбраны). Вы должны увидеть, что диапазон для объединения с данными MDS автоматически обновляется.

    Excel — диалоговое окно

  15. Вернитесь на вкладку "Поставщики" , не закрывая диалоговое окно "Объединить данные ".

  16. Нажмите кнопку рядом с текстовым полем. Вы увидите, что диалоговое окно развернуто сейчас. Вы должны увидеть, что все сопоставления между столбцами Поставщика сущности MDS и столбцами Excel заполняются автоматически.

    Excel — диалоговое окно

  17. Убедитесь, что столбец сущности Code сопоставляется со столбцом SupplierID в листе и столбце сущности Zip Code сопоставляется со столбцом Zip Code на листе.

  18. В диалоговом окне "Объединение данных " нажмите кнопку "Объединить".

  19. Убедитесь, что три строки данных добавляются в нижней части листа, и они должны быть закодированы цветом.

    Excel — новые элементы после объединения

  20. Щелкните математические данные на ленте, чтобы определить повторяющиеся данные. Эта функция использует соответствующие функции DQS.

  21. В диалоговом окне "Данные сопоставления " выберите "Поставщики " для базы знаний DQS.

    Excel — диалоговое окно

  22. Сопоставьте столбцы рабочего листа с доменами, как показано в следующей таблице.

    Столбец рабочего листа Домен
    Код (вы добавили идентификатор поставщика в качестве кода для сущности поставщика в MDS) Идентификатор поставщика
    Имя (вы загрузили название поставщика как имя сущности поставщика в MDS) Имя поставщика
    Контактный адрес электронной почты ContactEmail
  23. Выберите необходимые условия для сопоставления столбцов кода .

  24. Введите 70% в качестве веса для имени поставщика и 30% в качестве веса для электронной почты контакта , как показано на рисунке.

  25. Нажмите кнопку ОК.

  26. Процесс сопоставления должен определить один дубликат поставщика с кодом: S1.

    Excel — результаты сопоставления

  27. Выберите дубликат строки (оранжевый), щелкните правой кнопкой мыши и нажмите кнопку "Удалить ", чтобы удалить строку.

  28. Удалите столбец CLUSTER_ID , так как он больше не нужен.

  29. Нажмите кнопку "Опубликовать" , чтобы опубликовать две другие новые записи с кодами S66 и S57 в MDS.

  30. В диалоговом окне "Публикация и заметка" добавьте заметку и нажмите кнопку "Опубликовать".

  31. Перейдите в веб-приложение Master Data Manager.

  32. На домашней странице убедитесь, что Поставщики выбрано для Модели и нажмите Обозреватель. Если у вас уже открыт обозреватель , обновите браузер в Интернете.

  33. Отсортируйте список по коду и найдите записи с помощью S57 и S66 в виде кодов. Вы также можете использовать кнопку "Фильтр " на панели инструментов для поиска определенной записи в списке.

  34. Теперь закройте окно Book1 — Microsoft Excel без сохранения файла.

Следующий шаг

Задача 5. Создание атрибута Domain-Based из Excel