El siguiente proyecto es realizado por Guillermo Lodeiro, alumno del máster en Big Data and Data Science de la Universidad Complutense de Madrid.
El objetivo es poner en práctica los conocimientos adquiridos en el máster, donde conecto una base de datos en MySQL con Python para realizar consultas y posteriormente, realizar visualización de los resultados utilizando las librerías Pandas y Matplotlib.
Para este proyecto utilizare el lenguaje SQL y Python, las herramientas Excel, MySQL y Jupiter Notebooks. También, se clona repositorio de Github para trabajar local y luego subirlo, con el objetico de practicar y entender el funcionamiento de commits, pulls y pushs.
Cabe aclarar que la intención no es realizar consultas SQL complejas, sino realizar consultas desde Jupyter Notebooks a través la conexión a la base de datos y con los resultados obtenidos poder realizar gráficos.
El primer paso fue analizar el CSV, eliminar la información innecesaria, limpiar y corregir los carácteres especiales para poder importar el archivo a la base de datos creada en MySQL. El dataset fue obtenido de Kaggle en forma de CSV y trata de estadios de fútbol.
Autor: Guillermo Lodeiro
Docente: Javier Domínguez Gómez
Centro de estudios: Universidad Complutense de Madrid