Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом разделе описываются способы добавления знаний в базу знаний в службах качества данных (DQS). Прежде чем выполнять операции качества данных, необходимо иметь знания о данных. Вы получаете эти знания путем создания и обслуживания базы знаний по качеству данных и добавления в него знаний, связанных с определенным типом источника данных. База знаний — это репозиторий знаний о данных, которые позволяют понять данные и сохранить его целостность.
База знаний содержит домены данных, относящиеся к источнику данных. Для каждого домена данных DQKB хранит все определенные термины, ошибки орфографии, проверки и бизнес-правила, а также справочные данные, которые можно использовать для выполнения действий по качеству данных в источнике данных. DQS использует эти знания для выявления неверных или недопустимых данных или выполнения сопоставления.
Вы можете добавить знания в базу знаний следующими компьютерными или интерактивными способами.
Осуществление обнаружения знаний
Обнаружение знаний анализирует образец данных для критериев качества данных, а затем добавляет знания, полученные в базу знаний. Это компьютерный процесс, который определяет несоответствия данных и синтаксические ошибки и предлагает изменения данных. Деятельность по обнаружению знаний представляет собой процесс, включающий страницу, на которой вы можете интерактивно управлять значениями домена.
Дополнительные сведения см. в документации по выполнению обнаружения знаний.
Для демонстрации того, как выполнять обнаружение знаний, щелкните здесь для просмотра видео.
Управление значениями данных в домене
DQS позволяет интерактивно изменять и расширять метаданные, создаваемые действием обнаружения знаний с помощью компьютера. Это можно сделать в действии управления доменами, где можно применить изменение к определенному значению данных.
Дополнительные сведения см. в документации по изменению значений домена.
Видео, демонстрирующее, как управлять доменами, щелкните здесь. Обратите внимание, что в этом видео вы изменяете значения домена на странице "Управление значениями домена" мастера обнаружения знаний. Эти действия также можно выполнить на странице "Значения домена" действия "Управление доменами".
Импорт знаний из DQS-файла
Вы можете импортировать домен из файла данных DQS в существующую базу знаний или импортировать всю базу знаний из DQS в новую базу знаний. Для этого сначала необходимо экспортировать существующий домен или базу знаний в DQS-файл. DQS-файл, содержащий домен, включает все данные домена; DQS-файл, содержащий базу знаний, будет содержать все сведения базы знаний, включая домены и политику сопоставления.
- Дополнительные сведения см. в документации по импорту домена из DQS-файла или импорта базы знаний из DQS-файла.
Импорт знаний из файла Excel
Значения домена можно импортировать из файла электронной таблицы Excel в существующий домен или базу знаний. Для этого необходимо сначала создать электронную таблицу Excel со значениями домена, которые требуется импортировать, и убедиться, что Excel установлен на клиентском компьютере клиента data Quality, чтобы вы могли импортировать значения с помощью клиента качества данных. Нельзя экспортировать значения домена из домена или базы знаний в файл Excel.
- Дополнительные сведения см. в документации по импорту значений из файла Excel в домен или импорт доменов из файла Excel в службе обнаружения знаний.
Импорт знаний из проекта обратно в базу знаний
После запуска проекта очистки или сопоставления данных с помощью базы знаний можно импортировать знания, созданные во время очистки или сопоставления, обратно в эту базу знаний. Это позволяет сохранять знания, созданные во время проекта, и непрерывно создавать знания в базе знаний.
- Дополнительные сведения см. в документации по импорту значений проекта очистки в домен.
Использование базы знаний DQS по умолчанию
DQS поставляется с предварительно созданной базой знаний под названием DQS Data, которая содержит домены для данных о компаниях и адресах в США. Эту базу знаний можно использовать для быстрого запуска проекта без создания новой базы знаний. База знаний DQS доступна только для чтения, но управляющий данными может создать новую базу знаний на основе нее.
- См. документацию по использованию базы знаний DQS по умолчанию для получения дополнительной информации.