Predicción de la calidad del vino utilizando distintos algoritmos declasificación. Para llevar a cabo esta tarea, utilizaremos el dataset proporcionado por “UCI Machine Learning repository” llamado “Wine Quality Data Set”. Con este dataset queremos crear un sistema capaz de predecir la calidad de una nueva muestra de vino en base a las 11 caracteristicas de entrada. Solucionaremos este problema de dos maneras:
- La salida tiene que ser un valor entre 0 y 10 (Los mismos valores que la columna “quality”)
- La salida será uno de los siguientes tres valores de calidad:
- baja (“quality” < 6)
- media (“quality” = 6)
- alta (“quality” > 6)
Realizar una comparación del rendimiento de los siguientes modelos:
Este aprendizaje se hará con los hiperparámetros por defecto de las implementaciónes de scikit-learn
Consiste en la realización de la parte de ingenieria de las caracteristicas, donde seleccionaremos las caracteristicas más adecuadas para resolver el problema y crear de nuevas a partir de las existentes. Explicar y comparar los resultados obtenidos utilizando todas las caracteristicas en la dificultad C o el subconjunto seleccionado
Consiste en estudiar los parámetros de los mejores modelos predecidos utilizando la función GridSearchCV. Extraer una conclusión global de cual es el modejo modelo y sus parametros