Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Модель интеллектуального анализа данных создается путем применения алгоритма к данным, но это больше алгоритма или контейнера метаданных: это набор данных, статистики и шаблонов, которые можно применить к новым данным для создания прогнозов и вывода о связях.
В этом разделе объясняется, что такое модель интеллектуального анализа данных и для чего она может использоваться: базовая архитектура моделей и структур, свойства моделей интеллектуального анализа данных и способы создания и работы с моделями интеллектуального анализа данных.
Определение моделей анализа данных
Свойства модели интеллектуального анализа данных
Столбцы модели интеллектуального анализа данных
Обработка моделей интеллектуального анализа данных
Просмотр и запрос моделей для анализа данных
Архитектура модели анализа данных
Модель интеллектуального анализа данных получает данные из структуры интеллектуального анализа данных, а затем анализирует эти данные с помощью алгоритма интеллектуального анализа данных. Структура добычи данных и модель добычи данных являются отдельными объектами. Структура данных хранит сведения, определяющие источник данных. Модель анализа данных хранит информацию, полученную от статистической обработки данных, таких как закономерности, найденные в результате анализа.
Модель интеллектуального анализа данных пуста до тех пор, пока данные, предоставленные структурой интеллектуального анализа данных, будут обработаны и проанализированы. После обработки модели интеллектуального анализа данных она содержит метаданные, результаты и привязки к структуре интеллектуального анализа данных.
модели
Метаданные указывают имя модели и сервера, в котором он хранится, а также определение модели, включая столбцы из структуры интеллектуального анализа данных, которые использовались при создании модели, определения любых фильтров, примененных при обработке модели, и алгоритм, используемый для анализа данных. Все эти варианты — столбцы данных и их типы данных, фильтры и алгоритмы имеют мощное влияние на результаты анализа.
Например, можно использовать одни и те же данные для создания нескольких моделей с помощью алгоритма кластеризации, алгоритма дерева принятия решений и наивного алгоритма Байеса. Каждый тип модели создает различные наборы шаблонов, наборов элементов, правил или формул, которые можно использовать для прогнозирования. Как правило, каждый алгоритм анализирует данные по-разному, поэтому содержимое результирующей модели также организовано в разных структурах. В одном типе модели данные и шаблоны могут группироваться в кластерах; В другом типе модели данные могут быть организованы в деревья, ветви и правила, которые разделяют и определяют их.
На модель также влияют данные, на которых она обучена: даже модели, обученные в одной и той же структуре интеллектуального анализа, могут дать разные результаты, если вы по-разному фильтруете данные или используете различные начальные значения во время анализа. Однако фактические данные не хранятся в модели - только сводная статистика хранится, а фактические данные находятся в структуре интеллектуального анализа данных. Если вы создали фильтры данных при подготовке модели, определения фильтров сохраняются вместе с объектом модели.
Модель содержит набор привязок, которые указывают на данные, кэшированные в структуре интеллектуального анализа данных. Если данные кэшируются в структуре и не были удалены после обработки, эти привязки позволяют детализировать результаты до тех случаев, которые поддерживают результаты. Однако фактические данные хранятся в кэше структуры, а не в модели.
Архитектура модели интеллектуального анализа данных
Определение моделей интеллектуального анализа данных
Создайте модель интеллектуального анализа данных, выполнив следующие общие действия.
Создайте основную структуру для извлечения данных и добавьте столбцы данных, которые могут потребоваться.
Выберите алгоритм, который лучше всего подходит для аналитической задачи.
Выберите столбцы из структуры для использования в модели и укажите, как они должны использоваться: какой столбец содержит ожидаемый результат, какие столбцы предназначены только для входных данных и т. д.
При необходимости задайте параметры для точной настройки обработки алгоритмом.
Заполните модель данными, обрабатывая структуру и модель.
Службы "Analysis Services" предоставляют следующие средства для управления моделями анализа данных:
Мастер интеллектуального анализа данных помогает создать структуру и связанную модель интеллектуального анализа данных. Это самый простой метод для использования. Мастер автоматически создает необходимую структуру для майнинга данных и помогает вам с настройкой важных параметров.
Инструкцию DMX CREATE MODEL можно использовать для определения модели. Требуемая структура автоматически создается в процессе; Таким образом, нельзя повторно использовать существующую структуру с этим методом. Используйте этот метод, если вы уже точно знаете, какую модель хотите создать, или если хотите программировать модели.
Оператор DMX ALTER STRUCTURE ADD MODEL можно использовать для добавления новой модели майнинга данных в существующую структуру. Используйте этот метод, если вы хотите экспериментировать с разными моделями, основанными на одном наборе данных.
Вы также можете создавать модели интеллектуального анализа данных программным способом с помощью AMO или XML/A или с помощью других клиентов, таких как клиент интеллектуального анализа данных для Excel. Дополнительные сведения см. в следующих разделах:
Архитектура модели интеллектуального анализа данных
Свойства модели данных
Каждая модель анализа данных имеет свойства, определяющие модель и ее метаданные. К ним относятся имя, описание, дата последнего обработки модели, разрешения на модель и все фильтры данных, используемых для обучения.
Каждая модель интеллектуального анализа данных также имеет свойства, производные от структуры интеллектуального анализа данных, и описывающие столбцы данных, используемых моделью. Если любой столбец, используемый моделью, является вложенной таблицей, столбец также может применять отдельный фильтр.
Кроме того, каждая модель интеллектуального анализа данных содержит два специальных свойства: Algorithm и Usage.
Свойство Алгоритма Задает алгоритм, используемый для создания модели. Доступные алгоритмы зависят от используемого поставщика. Список алгоритмов, включенных в службы SQL Server Analysis Services, см. в разделе "Алгоритмы интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных). Свойство
Algorithmприменяется к модели анализа данных и может быть задано только один раз для каждой модели. Вы можете изменить алгоритм позже, но некоторые столбцы в модели данных могут стать недействительными, если они не поддерживаются выбранным алгоритмом. Необходимо всегда повторно обработать модель после изменения этого свойства.Свойство Usage Определяет, как каждый столбец используется моделью. Вы можете определить использование столбца как
Input,PredictилиPredict OnlyKey. СвойствоUsageприменяется к отдельным столбцам модели интеллектуального анализа данных и должно быть задано отдельно для каждого столбца, включенного в модель. Если структура содержит столбец, который не используется в модели, используется значениеIgnore. Примеры данных, которые можно включить в структуру анализа данных, но не использовать в анализе, могут быть имена клиентов или адреса электронной почты. Таким образом, вы можете запросить их позже, не включив их во время этапа анализа.
После создания модели интеллектуального анализа данных можно изменить значение свойств модели интеллектуального анализа данных. Однако любое изменение, даже изменение имени модели майнинга, требует повторной обработки модели. После повторной обработки модели могут появиться различные результаты.
Архитектура модели интеллектуального анализа данных
Столбцы модели анализа данных
Модель построения содержит столбцы данных, полученные из столбцов, определенных в структуре построения. Вы можете выбрать столбцы из структуры интеллектуального анализа данных, которые следует использовать в модели, и создать копии столбцов структуры интеллектуального анализа данных, а затем переименовать их или изменить их использование. В рамках процесса построения модели необходимо также определить использование столбца моделью. Включает информацию о том, является ли столбец ключом, используется ли он для прогнозирования, или может ли он быть проигнорирован алгоритмом.
При создании модели вместо автоматического добавления каждого столбца данных, доступных, рекомендуется внимательно просматривать данные в структуре и включать в модель только те столбцы, которые имеют смысл для анализа. Например, следует избегать включения нескольких столбцов, повторяющих одни и те же данные, и следует избегать использования столбцов, имеющих в основном уникальные значения. Если вы считаете, что столбец не должен использоваться, его не нужно удалять из структуры для добычи данных или модели; вместо этого можно просто задать флаг в столбце, который указывает, что его следует игнорировать при создании модели. Это означает, что столбец останется в структуре интеллектуального анализа данных, но не будет использоваться в модели интеллектуального анализа данных. Если вы включили переход из модели в структуру для интеллектуального анализа данных, вы можете получить сведения из столбца позже.
В зависимости от выбранного алгоритма некоторые столбцы в структуре интеллектуального анализа данных могут быть несовместимы с определенными типами моделей или могут дать плохие результаты. Например, если данные содержат непрерывные числовые данные, например столбец "Доход", а для модели требуются дискретные значения, может потребоваться преобразовать данные в дискретные диапазоны или удалить их из модели. В некоторых случаях алгоритм автоматически преобразует или сопоставляет данные, но результаты могут не всегда быть нужными или ожидаемыми. Рассмотрите возможность создания дополнительных копий столбца и пробных моделей. Вы также можете задать флаги для отдельных столбцов, чтобы указать, где требуется специальная обработка. Например, если данные содержат значения NULL, можно использовать флаг моделирования для управления обработкой. Если вы хотите, чтобы определенный столбец считался регрессией в модели, это можно сделать с помощью флага моделирования.
После создания модели можно внести изменения, такие как добавление или удаление столбцов, или изменение имени модели. Однако любое изменение, даже только для метаданных модели, требует повторной обработки модели.
Архитектура модели интеллектуального анализа данных
Обработка моделей майнинга
Модель интеллектуального анализа данных — это пустой объект, пока он не будет обработан. При обработке модели данные, кэшированные структурой, передаются через фильтр, если он определен в модели, и анализируется алгоритмом. Алгоритм вычисляет набор сводной статистики, описывающей данные, идентифицирует правила и шаблоны в данных, а затем использует эти правила и шаблоны для заполнения модели.
После обработки модель интеллектуального анализа данных содержит множество сведений о данных и шаблонах, найденных с помощью анализа, включая статистику, правила и формулы регрессии. Вы можете использовать пользовательские средства просмотра для просмотра этих сведений или создать запросы интеллектуального анализа данных для получения этих сведений и их использования для анализа и представления.
Архитектура модели интеллектуального анализа данных
Просмотр и запрос моделей интеллектуального анализа данных
После обработки модели его можно изучить с помощью пользовательских средств просмотра, предоставляемых в SQL Server Data Tools (SSDT) и SQL Server Management Studio. Для
Вы также можете создавать запросы к модели интеллектуального анализа данных либо для прогнозирования, либо для получения метаданных модели или шаблонов, созданных моделью. Создавайте запросы с помощью расширений интеллектуального анализа данных (DMX).
Связанные материалы
| Темы | Ссылки. |
|---|---|
| Узнайте, как создавать структуры интеллектуального анализа данных, которые могут поддерживать несколько моделей интеллектуального анализа данных. Узнайте об использовании столбцов в моделях. |
Столбцы структуры майнинга Столбцы модели интеллектуального анализа данных Типы контента (интеллектуальный анализ данных) |
| Узнайте о различных алгоритмах и о том, как выбор алгоритма влияет на содержимое модели. |
Содержимое модели майнинга данных (службы Analysis Services — интеллектуальный анализ данных) Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных) |
| Теперь вы можете задать свойства модели, влияющие на ее состав и поведение. |
Свойства модели интеллектуального анализа данных Флаги моделирования (интеллектуальный анализ данных) |
| Узнайте о программируемых интерфейсах интеллектуального анализа данных. |
Разработка с помощью объектов управления анализом (AMO) Справочник по расширениям интеллектуального анализа данных (DMX) |
| Узнайте, как использовать пользовательские средства просмотра интеллектуального анализа данных в службах Analysis Services. | Средства просмотра моделей интеллектуального анализа данных |
| Ознакомьтесь с примерами различных типов запросов, которые можно использовать для моделей интеллектуального анализа данных. | Запросы интеллектуального анализа данных |
Связанные задачи
Используйте следующие ссылки, чтобы получить более конкретные сведения о работе с моделями интеллектуального анализа данных