Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Алгоритм Microsoft Naive Bayes — это алгоритм классификации, предоставляемый службами Microsoft SQL Server Analysis Services для использования в прогнозном моделировании. Алгоритм вычисляет условную вероятность между входными и прогнозируемыми столбцами и предполагает, что столбцы независимы. Это предположение о независимости приводит к названию Наив Байес.
Реализация алгоритма Microsoft Naive Bayes
Этот алгоритм является менее вычислительным, чем другие алгоритмы Майкрософт, поэтому он полезен для быстрого создания моделей интеллектуального анализа данных для обнаружения связей между входными столбцами и прогнозируемыми столбцами. Алгоритм рассматривает каждую пару входных значений атрибутов и выходных значений атрибутов.
Описание математических свойств Байеса Теорема выходит за рамки этой документации; Дополнительные сведения см. в документе Microsoft Research под названием Learning Bayesian Networks: Сочетание знаний и статистических данных.
Для описания того, как вероятности во всех моделях корректируются с учетом потенциальных отсутствующих значений, см. раздел Отсутствующие значения (службы Analysis Services — интеллектуальный анализ данных).
Выбор признаков
Алгоритм Microsoft Naive Bayes выполняет автоматический выбор признаков, чтобы ограничить количество значений, которые учитываются при создании модели. Дополнительные сведения см. в разделе "Выбор компонентов" (интеллектуальный анализ данных).
| Алгоритм | Метод анализа | Комментарии |
|---|---|---|
| Наивный Байес | Энтропия Шеннона Байесовский с априорным распределением K2 Байесовский Дирихлеев с равномерным априорным распределением (по умолчанию) |
Наивный Байес принимает только дискретные или дискретизированные атрибуты; таким образом, он не может использовать оценку интересности. |
Алгоритм предназначен для минимизации времени обработки и эффективного выбора атрибутов, имеющих наибольшее значение; Однако вы можете управлять данными, которые используются алгоритмом, задав параметры следующим образом:
Чтобы ограничить значения, используемые в качестве входных данных, уменьшите значение MAXIMUM_INPUT_ATTRIBUTES.
Чтобы ограничить количество атрибутов, проанализированных моделью, уменьшите значение MAXIMUM_OUTPUT_ATTRIBUTES.
Чтобы ограничить количество значений, которые можно учитывать для любого атрибута, уменьшите значение MINIMUM_STATES.
Настройка наивного алгоритма Bayes
Алгоритм Microsoft Naive Bayes поддерживает несколько параметров, влияющих на поведение, производительность и точность результирующей модели интеллектуального анализа данных. Вы также можете задать флаги моделирования в столбцах модели, чтобы управлять обработкой данных или задавать флаги в структуре интеллектуального анализа данных, чтобы указать, как должны обрабатываться отсутствующие значения или значения NULL.
Настройка параметров алгоритма
Алгоритм Microsoft Naive Bayes поддерживает несколько параметров, влияющих на производительность и точность аналитической модели. В следующей таблице содержатся описания всех параметров.
МАКСИМАЛЬНОЕ_КОЛИЧЕСТВО_ВХОДНЫХ_АТРИБУТОВ
Указывает максимальное количество входных атрибутов, которые алгоритм может обрабатывать перед вызовом выбора компонентов. При установке этого значения значение равно 0 отключает выбор компонентов для входных атрибутов.
Значение по умолчанию — 255.
MAXIMUM_OUTPUT_ATTRIBUTES
Указывает максимальное количество выходных атрибутов, которые алгоритм может обрабатывать перед вызовом выделения компонентов. Установка этого значения на 0 отключает выбор выходных атрибутов.
Значение по умолчанию — 255.
Минимальная вероятность зависимости
Указывает минимальную вероятность зависимостей между входными и выходными атрибутами. Это значение используется для ограничения размера содержимого, создаваемого алгоритмом. Это свойство можно задать от 0 до 1. Более крупные значения снижают количество атрибутов в содержимом модели.
Значение по умолчанию — 0.5.
MAXIMUM_STATES
Указывает максимальное количество состояний атрибута, поддерживаемых алгоритмом. Если число состояний атрибута больше максимального числа состояний, алгоритм использует наиболее популярные состояния атрибута и обрабатывает остальные состояния как отсутствующие.
Значение по умолчанию равно 100.
Флаги моделирования
Алгоритм деревьев принятия решений Майкрософт поддерживает следующие флаги моделирования. При создании структуры интеллектуального анализа данных или модели интеллектуального анализа данных вы определяете флаги моделирования, которые указывают, как значения в каждом столбце обрабатываются во время анализа. Дополнительные сведения см. в разделе Флаги моделирования (интеллектуальный анализ данных).
| Флаг моделирования | Описание |
|---|---|
| MODEL_EXISTENCE_ONLY | Означает, что столбец будет рассматриваться как имеющий два возможных состояния: "Отсутствует" и "Существует". Значение NULL — это отсутствующее значение. Применяется к столбцу модели данных для майнинга. |
| НЕ ПУСТОЙ | Указывает, что столбец не может содержать значение NULL. Ошибка возникнет, если службы Analysis Services столкнутся с null'ом во время обучения модели. Применяется к столбцу структуры интеллектуального анализа данных. |
Требования
Наивная модель дерева Bayes должна содержать ключевой столбец, по крайней мере один прогнозируемый атрибут и по крайней мере один входной атрибут. Атрибут не может быть непрерывным; Если данные содержат непрерывные числовые данные, они будут игнорироваться или дискретизированы.
Входные и предсказуемые столбцы
Алгоритм Microsoft Naive Bayes поддерживает определенные входные столбцы и прогнозируемые столбцы, перечисленные в следующей таблице. Для получения дополнительных сведений о значении типов контента при их использовании в модели интеллектуального анализа данных см. раздел "Типы контента (интеллектуальный анализ данных)".
| колонна | Типы содержимого |
|---|---|
| Входной атрибут | Циклический, дискретный, дискретизированный, ключ, таблица и упорядочение |
| Прогнозируемый атрибут | Циклические, дискретные, дискретные, таблицы и упорядоченные |
Замечание
Поддерживаются циклические и упорядоченные типы контента, но алгоритм обрабатывает их как дискретные значения и не выполняет специальную обработку.
См. также
Алгоритм Microsoft Naive Bayes
Примеры наивных примеров запросов модели Bayes
Содержимое модели интеллектуального анализа для моделей Наивного Байеса (Analysis Services — интеллектуальный анализ)