Qué es k fold
💎Si vamos a hacer un preciso género de modelo estadístico o econométrico con el propósito de realizar conjeturas o modelar el accionar de alguna variable, como por poner un ejemplo en el campo del trading, donde creamos tácticas para invertir, debemos comprender que no es suficiente con desarrollar el modelo, sino asimismo debemos investigar y revisar de qué forma se puede comportar más adelante en distintas ocasiones.
Exactamente en qué radica la validación cruzada
Antes de contestar a el interrogante de qué es el procedimiento de los K pliegues, debemos recordar de dónde viene este procedimiento del término general de validación cruzada, por el hecho de que pertence a los modelos que sale de ahí.
Como te contamos en el producto sobre la validación cruzada, este es un procedimiento que te dejará adivinar de qué manera va a funcionar el software y qué puntos de quiebre o puntos que puede producir tienen la posibilidad de ser provecho para el software.
Link al recurso
https://en.wikipedia.org/wiki/Cross-validation_(statistics)
Existen muchos packs en R, Python, etcétera. que hacen más fácil la partición, como el bulto caret de R, por servirnos de un ejemplo, o scikit-learn (sklearn) en Python. En la situacion de R, el próximo ejemplo exhibe de qué manera entrenar y validar un clasificador para el popular grupo de iris:
Técnicas de validación cruzada
Conque seamos claros de nuevo: SOLO contamos grupo de Entrenar y evaluar, ¿en concordancia? El de Test proseguirá siendo tratado como antes: lo separamos y lo vamos a usar en el final, una vez entrenemos el modelo.
En el grupo Tren, y siguiendo nuestro ejemplo inicial, contamos 8.000 registros. La validación mucho más usada y que nos asiste a comprender el término es “K-folds”, la vamos a comentar:
Validación cruzada de k-Fold
Es común valorar los modelos de estudio de las máquinas en un grupo de datos usando la validación cruzada k-fold.
El trámite de validación cruzada de k-pliegues divide un grupo de datos con limite en k-pliegues que no se sobreponen. Todos los k-pliegues tiene la posibilidad de emplearse como un grupo de prueba retenido, al tiempo que todos los otros pliegues se utilizan colectivamente como un grupo de datos de entrenamiento. Se ajustan y valoran un total de k modelos en los k conjuntos de prueba retenidos y se comunica el desempeño medio.