Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Алгоритм ассоциации Майкрософт — это алгоритм сопоставления, предоставляемый службами Analysis Services, который полезен для обработчиков рекомендаций. Подсистема рекомендаций рекомендует клиентам продукты на основе уже приобретенных товаров или в которых они указали интерес. Алгоритм ассоциации Майкрософт также полезен для анализа рыночной корзины. Пример анализа корзины рынка см. в уроке 3. Создание сценария корзины рынка (учебник по промежуточному интеллектуальному анализу данных) в учебнике по интеллектуальному анализу данных .
Модели ассоциаций основаны на наборах данных, содержащих идентификаторы как для отдельных случаев, так и для элементов, содержащихся в них. Группа элементов в корпусе называется набором элементов. Модель сопоставления состоит из ряда наборов элементов и правил, описывающих группирование этих элементов в пределах случаев. Правила, которые идентифицирует алгоритм, можно использовать для прогнозирования вероятных будущих покупок клиента на основе элементов, которые уже существуют в корзине покупок клиента. На следующей схеме показан ряд правил в наборе элементов.
Как показано на схеме, алгоритм ассоциации Майкрософт может найти множество правил в наборе данных. Алгоритм использует два параметра, поддержку и вероятность, чтобы описать наборы элементов и правила, которые он создает. Например, если X и Y представляют два элемента, которые могут находиться в корзине для покупок, параметр поддержки — это количество случаев в наборе данных, содержащего сочетание элементов, X и Y. Используя параметр поддержки в сочетании с пользовательскими параметрами , MINIMUM_SUPPORT и MAXIMUM_SUPPORT алгоритм управляет количеством созданных наборов элементов. Параметр вероятности, также названный достоверность, представляет долю вариантов в наборе данных, содержащего X, а также содержащий Y. Используя параметр вероятности в сочетании с параметром MINIMUM_PROBABILITY , алгоритм управляет числом созданных правил.
Пример
Компания Adventure Works Cycle перепроектирует функциональные возможности своего веб-сайта. Цель редизайна — увеличить продажи продуктов. Так как компания записывает каждую продажу в транзакционной базе данных, они могут использовать алгоритм ассоциации Майкрософт для идентификации наборов продуктов, которые, как правило, будут приобретены вместе. Затем они могут предсказать дополнительные элементы, которые может быть заинтересован клиент, на основе элементов, которые уже находятся в корзине покупок клиента.
Принцип работы алгоритма
Алгоритм ассоциации Майкрософт проходит набор данных для поиска элементов, которые отображаются вместе в случае. Затем алгоритм группирует в наборы элементов все связанные элементы, которые отображаются как минимум в количестве случаев, указанных параметром MINIMUM_SUPPORT . Например, набор элементов может быть "Mountain 200=Existing, Sport 100=Existing", и может иметь поддержку 710. Затем алгоритм создает правила из наборов элементов. Эти правила используются для прогнозирования присутствия элемента в базе данных на основе наличия других определенных элементов, которые алгоритм определяет как важные. Например, правило может быть "если Туринг 1000=в наличии и Держатель для велосипедной бутылки=в наличии, тогда бутылка с водой=в наличии", и вероятность может составлять 0,812. В этом примере алгоритм определяет, что присутствие в корзине шины Touring 1000 и клетки бутылки воды предсказывает, что бутылка воды также, скорее всего, будет находиться в корзине.
Для более подробного описания алгоритма, а также списка параметров для настройки его поведения и управления результатами модели данных, см. технический справочник по алгоритму ассоциаций Майкрософт.
Данные, необходимые для моделей ассоциаций
При подготовке данных для использования в модели правил сопоставления необходимо понимать требования для конкретного алгоритма, включая необходимые данные и способ использования данных.
Ниже приведены требования к модели правил ассоциации.
Один ключевой столбец Каждая модель должна содержать один числовый или текстовый столбец, который однозначно идентифицирует каждую запись. составные ключи не разрешены.
Один прогнозируемый столбец Модель сопоставления может иметь только один прогнозируемый столбец. Как правило, это ключевой столбец вложенной таблицы, такой как столбец, который перечисляет приобретенные продукты. Значения должны быть дискретными или дискретизированными.
Входные столбцы . Входные столбцы должны быть дискретными. Входные данные для модели сопоставления часто содержатся в двух таблицах. Например, одна таблица может содержать сведения о клиенте, а другая таблица содержит покупки клиентов. Эти данные можно ввести в модель с помощью вложенной таблицы. Дополнительные сведения о вложенных таблицах см. в статье Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).
Дополнительные сведения о типах контента и типах данных, поддерживаемых для моделей ассоциаций, см. в разделе "Требования" технического справочника по алгоритму ассоциаций Майкрософт.
Просмотр модели ассоциаций
Для изучения модели можно использовать средство просмотра ассоциаций Майкрософт. При просмотре модели сопоставления службы Analysis Services представляют корреляции с разных углов, чтобы лучше понять связи и правила, найденные в данных. Область "Набор элементов " в средстве просмотра содержит подробные сведения о наиболее распространенных сочетаниях или наборах элементов. В области правил представлен список правил, которые были обобщены из данных, добавляет вычисления вероятности и ранжирует правила по относительной важности. Средство просмотра зависимостей позволяет визуально изучить способ подключения отдельных различных элементов. Дополнительные сведения см. в статье "Обзор модели с помощью средства просмотра кластеров Майкрософт".
Если вы хотите узнать больше о любом из наборов элементов и правил, можно просмотреть модель в средстве просмотра дерева универсального содержимого Майкрософт. Содержимое, хранящееся для модели, включает поддержку каждого набора элементов, оценку для каждого правила и другую статистику. Дополнительные сведения см. в разделе "Содержимое модели интеллектуального анализа данных" для моделей ассоциаций (службы Analysis Services — интеллектуальный анализ данных).
Создание прогнозов
После обработки модели можно использовать правила и наборы элементов для прогнозирования. В модели ассоциации прогноз указывает, какой элемент, скорее всего, возникает, учитывая наличие указанного элемента, и прогноз может включать такие сведения, как вероятность, поддержка или важность. Примеры создания запросов к модели ассоциации см. в примерах запросов модели сопоставления.
Общие сведения о создании запроса к модели интеллектуального анализа данных см. в разделе "Запросы интеллектуального анализа данных".
Производительность
Процесс создания наборов элементов и подсчета корреляций может занять много времени. Хотя алгоритм правил ассоциаций Майкрософт использует методы оптимизации для экономии места и ускорения обработки, следует знать, что проблемы с производительностью могут возникнуть в таких условиях, как:
Набор данных большой с большим количеством отдельных элементов.
Минимальный размер набора элементов установлен слишком низко.
Чтобы свести к минимуму время обработки и уменьшить сложность наборов элементов, попробуйте сгруппировать связанные элементы по категориям перед анализом данных.
Замечания
Не поддерживает использование языка разметки прогнозной модели (PMML) для создания моделей анализа данных.
Поддерживает детализацию.
Поддерживает использование OLAP-моделей для интеллектуального анализа данных.
Поддерживает создание измерений добычи данных.
См. также
Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)Обзор модели с использованием средства просмотра ассоциативных правил MicrosoftСодержимое модели интеллектуального анализа для ассоциативных моделей (службы Analysis Services — интеллектуальный анализ данных)Техническая справка по алгоритму ассоциации MicrosoftПримеры запросов для ассоциативной модели