Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Мастер интеллектуального анализа данных в Службах Microsoft SQL Server Analysis Services запускается каждый раз, когда вы добавляете новую структуру в проект интеллектуального анализа данных. Мастер помогает выбрать источник данных и настроить представление источника данных, определяющее данные для анализа, а затем помогает создать начальную модель.
На последнем этапе мастера можно разделить данные на наборы обучения и тестирования, а также включить такие функции, как детализация.
Что знать перед началом работы
Ниже приведены сведения, которые необходимо знать перед запуском мастера.
Вы создадите структуру и модели интеллектуального анализа данных из реляционной базы данных или из существующего куба в базе данных OLAP?
Какие столбцы содержат ключи, уникально идентифицирующие запись дела?
Какие столбцы или атрибуты вы хотите использовать для прогнозирования? Какие столбцы или атрибуты хорошо использовать в качестве входных данных для анализа?
Какой алгоритм следует использовать? Алгоритмы, предоставляемые в службах SQL Server Analysis Services, имеют разные характеристики и создают разные результаты. К счастью, вы не ограничиваетесь одной моделью для каждого набора данных, поэтому можно поэкспериментировать, добавив разные модели.
Необходимо ли протестировать модели в едином наборе данных? В этом случае рекомендуется использовать опцию, чтобы выделить некоторые данные для тестирования. Вы можете выбрать процент и ограничить его указанным количеством строк, если это необходимо.
Запуск мастера интеллектуального анализа данных
Чтобы использовать мастер интеллектуального анализа данных, необходимо открыть решение в SQL Server Data Tools (SSDT), которое содержит по крайней мере один интеллектуальный анализ данных или проект OLAP.
Если решение готово к интеллектуальному анализу данных, вы можете просто щелкнуть правой кнопкой мыши узел "Структуры интеллектуального анализа данных" в обозревателе решений и выбрать новую структуру интеллектуального анализа данных, чтобы запустить мастер.
Если решение не содержит существующих проектов, можно добавить новый проект интеллектуального анализа данных. В меню "Файл" выберите "Создать" и выберите "Проект". Обязательно выберите шаблон, многомерный проект интеллектуального анализа данных служб Analysis Services.
Вы также можете использовать Мастер импорта служб Analysis Services для получения метаданных из существующего решения по дата-майнингу. Однако вы не можете выбрать отдельные объекты для импорта; Вся база данных импортируется, включая все куби, представления источников данных и т. д. Кроме того, обратите внимание, что новое решение, созданное с помощью импорта, автоматически настроено для использования локальной базы данных по умолчанию. Вам может потребоваться изменить это на другой экземпляр, прежде чем можно будет обработать или просмотреть объекты, и если вы импортируете из предыдущей версии Analysis Services, может потребоваться обновить ссылки на поставщиков.
Затем вы создадите структуру интеллектуального анализа данных и одну связанную модель интеллектуального анализа данных. Вы также можете создать исключительно структуру данных для майнинга и добавить модели позже, но обычно проще всего сначала создать тестовую модель.
Реляционные модели против моделей интеллектуального анализа данных OLAP
Следующий важный вариант заключается в том, следует ли использовать реляционный источник данных или базировать модель на многомерных данных (OLAP).
Мастер интеллектуального анализа данных разделяется на два направления в этот момент, в зависимости от того, является ли источник данных реляционным или представлен в OLAP-кубе. Все остальное — выбор алгоритма, возможность добавления контрольного набора данных и т. д. — остается неизменным, но выбор данных для куба немного сложнее, чем использование реляционных данных. ** (Если вы создаете модель на основе куба, в конце вы также получите дополнительные параметры.)
Для получения подробного описания каждого варианта ознакомьтесь со следующими темами:
Создание реляционной структуры интеллектуального анализа данных
Помогает вам принять решения при создании реляционной модели интеллектуального анализа данных.
Создание структуры интеллектуального анализа данных OLAP
Описание дополнительных параметров и выборов для выбора данных из куба OLAP.
Замечание
Для интеллектуального анализа данных не требуется куб или база данных OLAP. За исключением случаев, когда ваши данные уже хранятся в кубе, или если вы хотите анализировать измерения OLAP или результаты агрегирования и вычислений OLAP, мы рекомендуем использовать реляционную таблицу или источник данных для интеллектуального анализа данных.
Выбор алгоритма
Затем необходимо решить, какой алгоритм следует использовать при обработке данных. Это решение может быть трудно принять. Каждый алгоритм, предоставляемый в службах Analysis Services, имеет разные функции и создает различные результаты, поэтому можно экспериментировать и попробовать несколько различных моделей перед определением наиболее подходящих для ваших данных и бизнес-проблем. Дополнительные сведения о задачах, для которых лучше всего подходит каждый алгоритм, см. в следующем разделе:
Опять же, можно создать несколько моделей с помощью различных алгоритмов или изменить параметры для алгоритмов для создания различных моделей. Вы не заблокированы в выборе алгоритма, и рекомендуется создать несколько различных моделей на одних и том же данных.
Определение данных, используемых для моделирования
Помимо выбора данных из источника, необходимо указать, которая из таблиц в представлении источника данных содержит данные случаев. Таблица случаев будет использоваться для обучения модели интеллектуального анализа данных и, следовательно, должна содержать сущности, которые необходимо проанализировать: например, клиентов и их демографическую информацию. Каждый случай должен быть уникальным и должен быть идентифицирован ключом дела.
Помимо указания таблицы случаев, можно включить вложенные таблицы в ваши данные. Вложенная таблица обычно содержит дополнительные сведения о сущностях в таблице случаев, таких как транзакции, выполняемые клиентом, или атрибуты, имеющие связь "многие ко одному" с сущностью. Например, вложенная таблица, присоединенная к таблице " Клиенты" , может включать список продуктов, приобретенных каждым клиентом. В модели, которая анализирует трафик на веб-сайт, вложенная таблица может включать последовательности страниц, которые пользователь посетил. Для получения дополнительной информации см. Вложенные таблицы (Analysis Services - интеллектуальный анализ данных)
Дополнительные функции
Чтобы помочь вам выбрать нужные данные и правильно настроить источники данных, мастер интеллектуального анализа данных предоставляет следующие дополнительные функции:
Автоматическое -detection типов данных: мастер проверяет уникальность и распределение значений столбцов, а затем рекомендует лучший тип данных и предлагает тип использования для данных. Эти предложения можно переопределить, выбрав значения из списка.
Предложения переменных. Вы можете щелкнуть диалоговое окно и запустить анализатор, вычисляющий корреляции между столбцами, включенными в модель, и определяет, являются ли любые столбцы прогнозаторами атрибута результата, учитывая конфигурацию модели до сих пор. Эти предложения можно переопределить, введя разные значения.
Выбор признаков: большинство алгоритмов автоматически обнаруживает столбцы, которые являются хорошими прогнозаторами и используют эти функции предпочтительно. В столбцах, содержащих слишком много значений, будет применен выбор признаков , чтобы уменьшить кратность данных и повысить вероятность поиска понятного шаблона. Вы можете повлиять на поведение выбора компонентов с помощью параметров модели.
Автоматическое разбиение кубов: если ваша модель интеллектуального анализа данных основана на источнике данных OLAP, возможность автоматически разбиения модели по атрибутам куба предоставляется. Это удобно для моделей обрезки на основе подмножества данных куба.
Завершение работы мастера
Последним шагом мастера является присвоение названия структуре интеллектуального анализа данных и связанной модели. В зависимости от типа созданной модели можно также использовать следующие важные параметры:
Если выбрать "Разрешить детализацию", возможность детализации включена в модели. С помощью дриллдауна пользователи с соответствующими разрешениями могут исследовать исходные данные, используемые для создания модели.
При создании модели OLAP можно выбрать параметры, создать новый куб интеллектуального анализа данныхили создать измерение интеллектуального анализа данных. Оба этих параметра упрощают просмотр завершенной модели и детализацию базовых данных.
После завершения работы мастера интеллектуального анализа данных используйте конструктор интеллектуального анализа данных для изменения структуры и моделей интеллектуального анализа данных, просмотра характеристик структуры и моделей или прогнозирования с помощью моделей.
Связанные материалы
Дополнительные сведения о решениях, которые необходимо принять при создании модели интеллектуального анализа данных, см. по следующим ссылкам:
Типы контента (интеллектуальный анализ данных)
Типы данных (интеллектуальный анализ данных)
Выбор компонентов (интеллектуальный анализ данных)
Отсутствующие значения (Службы Analysis Services — анализ данных)
Детализация моделей интеллектуального анализа данных
См. также
Средства интеллектуального анализа данных
Решения интеллектуального анализа данных