Qué es un árbol de decisión machine learning
Observemos de qué forma se edifican los árboles de resolución: se crean usando particiones recursivas para clasificar los datos. El algoritmo escoge la función mucho más predictiva para dividir los datos. Lo que es esencial en la construcción de un árbol de resolución es saber qué atributo es preferible, o mucho más que predice, para particionar los datos dependiendo de la característica. La «previsibilidad» se apoya en achicar la «impureza» de los nodos. Un nodo en el árbol se considera «puro» si, en el cien% de las situaciones, los nodos forman parte a una categoría especial del dominio de destino. En verdad, el procedimiento emplea la partición recursiva para dividir los registros en partes que minimizan la «impureza» en todos y cada paso. La «Impureza» de los nodos se calcula a través de la «Entropía» de los datos en el nodo. VER MUESTRA DE PYTHON
La entropía es la proporción de caos en la información, o la proporción de aleatoriedad en los datos. La entropía en un nodo es dependiente de la proporción de datos al azar recibidos en ese nodo y debe calcularse para cada nodo. En los árboles de resolución, procuramos los árboles cuyos nodos tienen la menor entropía. La entropía se emplea para calcular la homogeneidad de las muestras en ese nodo. Si las muestras son absolutamente homogéneas, la entropía es cero y si las muestras se dividen por igual, va a tener una entropía de uno.
Ejemplo de árbol de resolución
Trace la área de resolución de un árbol de resolución entrenado en pares de especificaciones del grupo de datos en un períodico.
Para cada par de especificaciones del iris, el árbol de resolución aprende los límites de las resoluciones tomadas a través de composiciones de reglas de umbral sencillos conseguidas de los ejemplos de entrenamiento.
¿Qué es el algoritmo del árbol de resoluciones en Machine Learning?
Un árbol de resolución en Machine Learning es una composición de árbol afín a un diagrama de fluído donde un nodo de adentro representa una característica (o atributo), la rama representa una regla de resolución y cada nodo hoja representa el resultado.
El nodo superior de un árbol de resolución en Machine Learning se llama nodo raíz. Aprenda a dividir según el valor del atributo. Divide el árbol de una forma recursiva llamada partición recursiva.
Datos para clasificación: Iris
Para argumentar de qué manera marchan los árboles de resolución con inconvenientes de clasificación, usaremos el grupo de datos de Iris. El inconveniente es clasificar apropiadamente la pluralidad floriris en base al ancho y largo de los pétalos y sépalos. Hay tres géneros de floriris: setosa, versicolor y virginica.
Este grupo de datos tiene dentro 150 ejemplos:
Ejemplo de árbol de resolución
El análisis de árbol de resolución es una herramienta de modelado que predice general que tiene apps en una pluralidad de ámbitos. Generalmente, los árboles de resolución se edifican usando un enfoque algorítmico que identifica maneras de dividir un grupo de datos en función de múltiples condiciones. Pertence a los métodos mucho más empleados y prácticos de estudio supervisado. Los árboles de resolución son un procedimiento de estudio supervisado no paramétrico que se usa tanto para tareas de clasificación como de regresión. La meta es hacer un modelo que prediga el valor de una variable propósito a través de la educación de reglas de resolución sencillos para colegir las peculiaridades de los datos.
Un árbol de resolución es un gráfico con apariencia de árbol donde los nodos representan dónde elegimos un atributo y hacemos una pregunta; los bordes detallan las respuestas a el interrogante; y las hojas representan la salida real o la etiqueta de clase. Se usan en la toma de resoluciones no lineales con una área de resolución lineal fácil.