K-кратная перекрестная проверка

K-кратная перекрестная проверка — это распространенный метод, используемый в машинном обучении для оценки производительности модели. Основная идея k-кратной перекрестной проверки состоит в том, чтобы разделить данные на k подмножеств одинакового размера или «складок». Затем модель обучается на k-1 сгибах и оценивается на оставшемся сгибе. Этот процесс повторяется k раз, так что каждая складка используется в качестве оценочного множества ровно один раз.

Вот пошаговый процесс k-кратной перекрестной проверки:

Разделите набор данных на k подмножеств или сгибов одинакового размера.
Для каждой складки i от 1 до k:

Обучить модель на всех складках, кроме i-й.
Оцените модель в i-й раз и запишите показатель оценки (например, точность или среднеквадратичную ошибку).

Вычислите среднее значение k показателей оценки, чтобы получить окончательную оценку производительности модели.

K-кратная перекрестная проверка — это мощный метод, поскольку он позволяет обучать и оценивать модель на всех данных, сохраняя при этом часть данных для оценки. Это помогает уменьшить переобучение, поскольку модель оценивается на данных, которых она раньше не видела. K-кратная перекрестная проверка также помогает гарантировать, что метрика оценки не слишком чувствительна к конкретному разделению данных.

Существует несколько вариаций перекрестной проверки k-кратности, например, стратифицированная перекрестная проверка k-кратности (которая гарантирует, что каждая кратность имеет примерно одинаковое распределение целевых значений) и перекрестная проверка исключения одного (использующая k равно количеству точек данных и не включает одну точку данных в качестве оценочного набора).

Таким образом, перекрестная проверка в k-кратном порядке является полезным методом оценки производительности моделей машинного обучения и может помочь уменьшить переоснащение и обеспечить надежность метрик оценки.

смотрите также:

Новые материалы

Обучение модели Keras с большим набором данных (пакетное обучение)

Привет народ!! В этом блоге я собираюсь обсудить очень интересную особенность Keras. При обучении любой модели глубокого обучения обязательным условием для получения хорошего результата..

Раскрытие возможностей сверточных нейронных сетей: обучение аутентификации изображений

1.0 ВВЕДЕНИЕ В области анализа цифровых изображений насущной необходимостью стала разработка надежных методов, позволяющих отличить подлинные изображения от поддельных. С появлением сложных..

Изучение основных библиотек Python для науки о данных

В эпоху больших данных и информационной перегрузки способность извлекать значимую информацию из огромных наборов данных стала важнейшим навыком. Именно здесь в игру вступает наука о данных...

Легко загружать в React элемент HTML в виде изображения

Много раз на наших сайтах нам нужно сделать кнопку доступной для пользователей, чтобы они могли загружать содержимое страницы. Иногда нам нужно загрузить таблицу, график или, в более общем..

Запуск кластера Stable Diffusion на GCP с обслуживанием tensorflow (часть 1)

Часть 1. Настройка инфраструктуры с помощью Terraform В первой части этого руководства, состоящего из двух частей, мы научимся создавать кластер Kubernetes, который развертывает модель Stable..

Внедрение человечности в машинное обучение

Иногда мне хочется, чтобы прогресс в кодировании был хоть немного более полезным. Если использовать баскетбол — еще одно хобби всей моей жизни — для сравнения: когда я забиваю мяч, это гораздо..

Обнаружение выражений лица и поз с помощью машинного обучения

От обнаружения лица человека до доступа к устройствам или распознавания человека с помощью камер видеонаблюдения или прогнозирования стратегий в спорте путем определения ключевых точек поз или..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Python Web Development Software Development Coding Deep Learning AI React Software Engineering Computer Science Android Development Python Programming Front End Development Java CSS Angular Startup HTML Data Algorithms Tech NLP Nodejs Programming Languages Learning Data Visualization Typescript Blockchain AWS Statistics Javascript Development Science Computer Vision Neural Networks