BinaryClassificationCatalog.CrossValidate Метод
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Выполните перекрестную проверку по numberOfFolds сверткам data, установив estimatorи уважая samplingKeyColumnName при условии.
Затем оцените каждую вложенную модель labelColumnName и верните CalibratedBinaryClassificationMetrics объект, который включает метрики на основе вероятностей для каждой под модели. Каждая вложенная модель оценивается на свертывание перекрестной проверки, которую она не видела во время обучения.
public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.CalibratedBinaryClassificationMetrics>> CrossValidate(Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = "Label", string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.CalibratedBinaryClassificationMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = "Label", Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of CalibratedBinaryClassificationMetrics))
Параметры
- data
- IDataView
Данные для выполнения перекрестной проверки.
- estimator
- IEstimator<ITransformer>
Оценщик для соответствия.
- numberOfFolds
- Int32
Количество сверток перекрестной проверки.
- labelColumnName
- String
Столбец меток (для оценки).
- samplingKeyColumnName
- String
Имя столбца, используемого для группировки строк. Если два примера имеют одинаковое значение samplingKeyColumnName, они гарантированно будут отображаться в одном подмножестве (обучение или тестирование). Это можно использовать для обеспечения отсутствия утечки меток из поезда в тестовый набор.
Если null группирование строк не будет выполнено.
Начальное значение генератора случайных чисел, используемого для выбора строк для сверток перекрестной проверки.
Возвращаемое значение
Результаты по сверткам: метрики, модели, оцененные наборы данных.