Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Проект служб Службы Data Quality Services (DQS) предназначен для использования базы знаний для повышения качества источника данных путем выполнения операций очистки данных и сопоставления данных с последующим экспортом результирующих данных в базу данных SQL Server или файл .csv. Вы можете создать проект служб DQS как проект очистки или проект сопоставления для выполнения соответствующих операций. Проекты очистки и сопоставления вы можете выполнять с использованием одной базы знаний, так как знания для очистки и сопоставления данных могут быть встроены в ту же базу знаний.
Проект служб DQS имеет следующие преимущества.
Позволяет выполнять очистку данных в источнике данных, используя знания в базе знаний DQS.
Позволяет выполнять сопоставление данных в источнике данных, используя политику сопоставления в базе знаний.
Предоставляет мастер, помогающий выполнить операции очистки и сопоставления данных, и экспорт данных в базу данных SQL Server или файл CSV по выбору пользователя. Администратор данных использует проект служб DQS для запуска автоматических и интерактивных шагов очистки и сопоставления данных и для управления ими.
В этом разделе
Проект служб DQS: операция очистки
Проект служб DQS: операция сопоставления
Профилирование данных и уведомления
Проект служб DQS: операция очистки
Проект очистки данных позволяет очистить исходные данные на основе базы знаний. Операция очистки данных в службах DQS представляет собой двухэтапный процесс.
Автоматический процесс очистки данных, который анализирует исходные данные, сравнивая их со знаниями в базе знаний, и предлагает изменения. Обработанные данные разбиваются службами DQS на категории (предложенные, новые, недопустимые, исправленные и правильные) и выдаются пользователю для дальнейшей обработки.
В интерактивном процессе очистки диспетчер данных может одобрить, отвергнуть или изменить данные, предложенные автоматическим процессом очистки данных.
Дополнительные сведения об очистке данных в проекте служб DQS см. в разделе Очистка данных.
[Top]
Проект служб DQS: операция сопоставления
Проект сопоставления данных позволяет выполнить операцию сопоставления на основе политики сопоставления в базе знаний с целью предотвратить дублирование данных путем определения точных и приблизительных совпадений. Таким образом, пользователь может удалить дублированные данные. Рекомендуется очистить данные перед их сопоставлением. Для этого:
Создайте проект служб DQS, выберите операцию Очистка, выполните операцию очистки исходных данных, а затем экспортируйте их в таблицу в базе данных SQL Server.
Создайте другой проект служб DQS с использованием базы знаний, содержащей политику сопоставления, выберите операцию Сопоставление, а затем на странице Сопоставить выберите базу данных и таблицу, в которую экспортированы данные, очищенные на шаге 1.
Выполните операцию сопоставления над очищенными данными.
Подробные сведения об операции сопоставления в проекте служб DQS см. в разделе Сопоставление данных.
[Top]
Профилирование данных и уведомления
Во время операций очистки и сопоставления данных в проекте качества данных вы можете получать статистику и информацию о данных, обрабатываемых службами DQS, в реальном времени. Профилирование данных поможет оценить эффективность процессов очистки и сопоставления и определить, насколько очистка и сопоставление помогли улучшить качество данных. Профилирование служб DQS предоставляет два измерения качества данных: полнота (степень, в которой представлены данные) и точность (степень, в которой данные могут использоваться по намеченному назначению). Кроме того, на основе профилирования данных пользователю выдаются уведомления о действиях, которые можно предпринять для улучшения операций очистки и сопоставления данных. Дополнительные сведения о профилировании данных и уведомлениях см. в разделе Профилирование данных и уведомления в DQS.
[Top]
Связанные задачи
Описание задачи |
Раздел |
|---|---|
Описывает создание проекта служб DQS. |
|
Описывает, как управлять (открывать, разблокировать, переименовывать и удалять) проектом служб DQS. |
Управление проектом служб DQS (открытие, разблокировка, переименование и удаление) |
Описывает, как открыть проект служб Integration Services в Клиент Data Quality. |