Перекрестная проверка формул

При создании отчета о перекрестной проверке он содержит меры точности для каждой модели в зависимости от типа модели интеллектуального анализа данных (то есть алгоритма, используемого для создания модели), типа данных прогнозируемого атрибута и прогнозируемого значения атрибута, если таковые имеются.

В этом разделе перечислены меры, используемые в отчете о перекрестной проверке, и описываются метод вычисления.

Сведения о разбивке мер точности по типу модели см. в отчете о перекрестной проверке.

Формулы, используемые для мер перекрестной проверки

Замечание

Важный: Эти меры точности вычисляются для каждого целевого атрибута. Для каждого атрибута можно указать или опустить целевое значение. Если запись в наборе данных не имеет значения для целевого атрибута, этот случай рассматривается как имеющий специальное значение, называемое отсутствующим значением. Строки с отсутствующими значениями не учитываются при вычислении меры точности для определенного целевого атрибута. Обратите внимание, что, поскольку оценки вычисляются для каждого атрибута по отдельности, если значения присутствуют для целевого атрибута, но отсутствуют для других атрибутов, он не влияет на оценку целевого атрибута.

Мера Применимо к Внедрение
Истинноположительный результат Дискретный атрибут, указано значение Количество случаев, удовлетворяющих этим условиям:

Регистр содержит целевое значение.

Модель предсказала, что этот кейс содержит целевое значение.
Истинно отрицательное Дискретный атрибут, указано значение Количество случаев, удовлетворяющих этим условиям:

Случай не содержит целевое значение.

Модель предсказала, что этот случай не содержит целевое значение.
Ложное срабатывание Дискретный атрибут, указано значение Количество случаев, удовлетворяющих этим условиям:

Фактическое значение равно целевому значению.

Модель предсказала, что этот кейс содержит целевое значение.
Ложный отрицательный Дискретный атрибут, указано значение Количество случаев, удовлетворяющих этим условиям:

Фактическое значение не равно целевому значению.

Модель предсказала, что этот случай не содержит целевое значение.
Передача или сбой Дискретный атрибут, не указанный целевой объект Количество случаев, удовлетворяющих этим условиям:

Условие выполнено, если прогнозируемое состояние с наибольшей вероятностью совпадает с состоянием ввода, и вероятность больше значения порога состояния.

В противном случае завершится ошибкой.
Лифт Дискретный атрибут. Целевое значение можно указать, но не требуется. ** Средняя логарифмическая вероятность для всех строк со значениями для целевого атрибута, где логарифмическая вероятность для каждого случая вычисляется как Log(ФактическаяВероятность/МаргинальнаяВероятность). Чтобы вычислить среднее значение, сумма значений вероятности журнала делится на количество строк в входном наборе данных, за исключением строк с отсутствующими значениями для целевого атрибута.

Лифт может быть отрицательной или положительной величиной. Положительное значение означает эффективную модель, которая опережает случайное предположение.
Логарифмическая оценка Дискретный атрибут. Целевое значение можно указать, но не требуется. Журнал фактической вероятности для каждого случая, суммированный, а затем разделен на количество строк в входном наборе данных, за исключением строк с отсутствующими значениями для целевого атрибута.

Поскольку вероятность представлена в виде десятичной дроби, логарифмические оценки всегда являются отрицательными числами. Оценка, которая ближе к 0, является лучшей оценкой.
Вероятность случая Кластер Сумма показателей вероятности кластера для всех случаев, разделенная на количество случаев в секции, за исключением строк с отсутствующими значениями для целевого атрибута.
Средняя абсолютная ошибка Непрерывный атрибут Сумма абсолютной ошибки для всех случаев в секции, разделенная на количество случаев в секции.
Среднеквадратическая ошибка Непрерывный атрибут Квадратный корень среднеквадратической ошибки для раздела.
Среднеквадратичная ошибка Дискретный атрибут. Целевое значение можно указать, но не требуется. Квадратный корень среднего значения квадратов дополнения оценки вероятности, разделенный на число случаев в секции, за исключением строк с отсутствующими значениями для целевого атрибута.
Среднеквадратичная ошибка Дискретный атрибут, не указанный целевой объект. Квадратный корень среднего значения квадратов дополнения к вероятностному значению, разделенный на количество случаев в разделе, исключая случаи, где отсутствуют значения целевого атрибута.

См. также

Тестирование и проверка (интеллектуальный анализ данных)
Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных)