К-кратная кросс-проверка: разница между контактом на StratifiedKFold и KFold

Ключ при обучении нейронного шага сети Для оценки обобщающей способности модели, модели, если производительность не хорошо, либо потому, что модель слишком сложна, чтобы быть более облегающим (высокая дисперсия), либо модель слишком проста, потому что свинец underfitting (высокой отклонение). Чтобы решить эту проблему, мы должны научиться как перемежении перекрестной проверки и проверке количество --holdout к-кратная кросс-проверка для оценки обобщающей способности модели.

К-кратные результаты проверки кросс рассчитывается как среднее значение модели оценки параметров, и, следовательно, использовать перекрестную проверку K-кратное, чтобы найти оптимальные параметры метода является более стабильным, чем затяжка. После того, как мы находим оптимальные параметры, этот набор параметров, которые будут использоваться для обучения модели на исходных данных, установленных в качестве конечной модели.

1 KFold 

класс sklearn.model_selection.KFold (n_splits = 'предостерегают', перетасовка = False, random_state = None)

Обеспечить поезд / Индекс тест

Обеспечить индекс обучения / тестирование , чтобы разбить данные на обучение / тестовый набор. Чтобы разделить набор данных K последовательного складывания (по умолчанию без перетасовки).

 

Предоставляет индексы поезд / тест, чтобы разделить данные на поезд / тестовых наборов. Разделить набор данных на к последовательным сгибам (без перетасовки по умолчанию).

 

Затем каждый сложенный в качестве проверки, к-1 остальные сложены, чтобы сформировать обучающий набор.

 n_splits  INT, по умолчанию = 3

Несколько раз. Вы должны быть по крайней мере 2.

Изменения в версии 0.20: n_splits дефолты v0.22 Изменения от 3 до 5.

В случайном порядке  логическое значение, опционально

Если данные перемешиваются, прежде чем разбить на группы.

не random_state  INT, или нет RandomState пример, необязательный, по умолчанию = None

Если Int, используется random_state семян генератора случайных чисел, в противном случае, ложь. Если , например RandomState, random_state генератор случайных чисел, если ни один генератор случайных чисел не используется экземпляр RandomState np.random. Когдаshuffle используется == True.

 

класс sklearn.model_selection.StratifiedKFold (n_splits = 'предостерегают', перетасовка = False, random_state = None)

 

 

 

 

Во-первых, они применяются к функции перекрестной проверки К.

Разница заключается в том, функции KFold только для

 

рекомендация

отwww.cnblogs.com/gengyi/p/11628730.html
рекомендация