Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
На этом занятии вы создадите базу знаний DQS с именем "Поставщики " с знаниями (метаданными) о данных поставщика. Вы используете базу знаний для выполнения действий по очистке и сопоставлению данных поставщика входных данных. Действие очистки определяет неверные или недопустимые данные, исправляет неверные данные, предлагает исправления или предложения, стандартизирует данные и расширяет данные с дополнительными сведениями. Действие сопоставления сравнивает данные и идентифицирует похожие, но немного отличающиеся записи, что помогает устранить дубликаты в данных.
Вы можете использовать интерактивные и компьютерные процессы для создания, сборки и управления базой знаний. Знания в базе знаний хранятся в доменах, каждый из которых зависит от поля данных в данных, которые требуется очистить и/или сопоставить.
На этом занятии вы выполните следующие задачи, чтобы создать базу знаний поставщиков :
Создайте базу знаний DQS с именем "Поставщики". Вы можете создать базу знаний несколькими способами. Вы можете создать базу знаний с нуля или создать ее на основе существующей базы знаний или импорта файла DQS (DQS), содержащего предварительно созданную и экспортированную базу знаний, или выполнив действие обнаружения знаний на основе примеров данных. В этом руководстве вы создадите базу знаний с нуля.
Создайте домены в базе знаний поставщиков , которая используется для очистки данных и сопоставления данных для идентификации дубликатов. создайте домены для полей данных, которые вы хотите использовать при очистке и сопоставлении действий, а не для всех полей данных.
Добавьте значения в домен, вручную добавив значения, импортируя их из файла Excel, выполняя анализ данных для обнаружения новой информации на примере данных и импортируя значения из проекта очистки. Вы также можете импортировать значения домена, импортируя файл DQS, содержащий свойства и значения домена, которые не выполняются в руководстве.
Задайте правила для домена. Правило домена — это условие, используемое DQS для проверки, исправления и стандартизации значений домена.
Задайте отношения на основе терминов для домена. Связь, основанная на терминах, позволяет вам внести исправление в термин, который является частью значения в определённой области. Например, значение Contoso Inc., Inc. — это термин, который можно определить как Инкорпорейтед. Это помогает стандартизированию данных, а также выявлению дубликатов. Например, Contoso Inc. и Contoso Incorporated можно считать дубликатами.
Укажите синонимы в значениях домена. Можно задать два или более значений в качестве синонимов и задать одно из них в качестве ведущего значения, которое заменяет его значения синонимов во время действия очистки для стандартизации данных.
Создайте составной домен с именем "Проверка адресов", включающую строку адреса, город, штат и zip-домены. Составной домен — это домен, состоящий из одного или нескольких отдельных доменов. Это позволяет создать правило, включающее несколько доменов. Например, можно определить правило: если город — Лос-Анджелес, то штат должен быть Калифорния, где город и штат являются двумя отдельными доменами.
Настройте и используйте службу ссылочных данных. Функция службы ссылочных данных в службах качества данных (DQS) позволяет подписываться на сторонних поставщиков ссылочных данных, а также очищать и обогащать бизнес-данные, проверяя их на соответствие их высококачественным данным. Вы можете использовать службы от ведущих поставщиков DQS из DQS для стандартизации, исправления или обогащения данных во время процесса очистки. Из этого руководства вы узнаете, как настроить среду DQS для использования эталонной службы данных в Azure Marketplace и использовать службу, связанную с составным доменом проверки адресов, для очистки данных адресов.
Опубликуйте базу знаний, чтобы база знаний использовалась при очистке и сопоставлении действий.