Урок 2. Очистка данных поставщика с помощью базы знаний поставщиков

На этом занятии вы очищаете данные поставщика в файле Excel с помощью базы знаний поставщиков , созданной на первом занятии. Очистка данных в DQS включает в себя компьютерный процесс , который анализирует соответствие данных знаниям в базе знаний, а также интерактивный процесс , позволяющий просматривать и изменять результаты из компьютерного процесса. Функция очистки данных идентифицирует неправильные данные в источнике данных, а затем исправляет или предлагает исправления неправильных данных. Он также стандартизирован и обогащает данные клиента с помощью значений домена, ведущих значений синонимов, правил домена, отношений на основе терминов и ссылочных данных. Вы можете интерактивно утвердить или отклонить изменения, предлагаемые компьютерным процессом. Дополнительные сведения см. в разделе "Очистка данных ".

Компьютерный процесс использует следующие пороговые значения, которые можно настроить с помощью параметра конфигурации на главной странице клиента DQS.

  • Минимальная оценка предложений: Минимальный уровень оценки или достоверности, используемый DQS для предложения замены значения.

  • Минимальная оценка автоматических исправлений: Минимальный уровень оценки или достоверности, используемый DQS для автоматического исправления значения.

Дополнительные сведения о настройке этих параметров см. в разделе "Настройка пороговых значений для очистки и сопоставления ".

На этом занятии вы выполняете следующие задачи, чтобы очистить входные данные с помощью базы знаний "Поставщики".

  1. Создайте проект качества данных для очистки, выберите базу знаний "Поставщики" в качестве базы знаний для анализа и очистки исходных данных в файле Excel и выберите действие "Очистка".

  2. Сопоставляйте столбцы Excel, которые необходимо очистить с соответствующими доменами DQS или составными доменами в базе знаний.

  3. Запустите действие очистки с помощью компьютера. Компьютерный процесс отображает сведения о качестве данных в клиенте качества данных, который можно использовать для интерактивного очистки данных.

  4. Просмотр результатов действия очистки и управление ими. Вы можете просмотреть значения, которые компьютерный процесс находит правильным, неправильным, но исправленным, неправильным, с предлагаемым изменением или недопустимым. Вы можете интерактивно утвердить или отклонить изменения, исправить или переопределить предложение из компьютерного процесса с помощью поля "Правильное значение".

  5. Экспортируйте результаты процесса очистки в файл Excel.

  6. Импортируйте значения из проекта очистки в домены, чтобы расширить знания в базе знаний с новыми правилами, значениями, исправлениями и т. д.

Следующий шаг

Задача 1. Создание проекта качества данных