¡¡Hola!! Soy Cesar Prieto, estudiante de último año en Ciencias Estadísticas, que bajo el seudonimo de CapStats muestro en este repositorio la pasion por el análisis de datos, el desarrollo de modelos predictivos, el machine learning y la inteligencia artificial.
Soy estudiante de Ciencias Estadísticas en la Universidad Nacional de Colombia, sede Bogotá. Me encanta aprender y aplicar mis conocimientos en proyectos prácticos que abordan problemas del mundo real. Tengo una sólida formación en estadística y programación en lenguajes para el desarrollo estadístico como R y Python (Este último usando Jupyter), además de habilidades en SQL, y me apasiona utilizar técnicas de análisis de datos y modelos predictivos para extraer insights valiosos. Estoy buscando oportunidades para crecer profesionalmente en el campo del análisis de datos, el machine learning y la inteligencia artificial, donde pueda contribuir con mis habilidades y aprender de profesionales experimentados.
Proyectos Destacados
- [Time-Series] - Se planteó el análisis de 2 series de tiempo con una periodicidad diferente para de esta forma aplicar los conceptos aprendidos en clase y descubrir el proceso y el funcionamiento de las técnicas de descripción y modelado de Series temporales utilizando técnicas de modelado típicas como son los modelos ARMA, ARIMA y SARIMA, y por otro lado técnicas novedosas como pueden ser el modelado a través de Árboles de decisión y usando Redes Neuronales tanto Recurrentes como LSTM, como no recurrentes y multicapas. (AUN EN DESARROLLO)
- Tecnologías: R, Python, Scikit-learn, TensorFlow, Pandas, NumPy
- Enlace al repositorio
- Análisis de Redes Bipartitas en Series de Anime - Se desarrolló en compañía de Alejandro Urrego un proyecto en el cual se analiza una red que refleja las relaciones entre usuarios y animes, examinándo cómo las descripciones de estos animes influyen en la formación de grandes comunidades de usuarios. En particular, se introduce una nueva variable que cuantifica la frecuencia con la que las palabras de una descripción aparecen en ciertos clústeres de palabras. Estos clústeres se generan a partir del análisis de bigramas derivados de todas las descripciones en la base de datos. De esta manera, se caracteriza completamente la dinámica de estas comunidades y cómo el contenido textual puede afectar la cohesión y estructura de la red social de aficionados al anime. Se concluye que los hallazgos pueden tener implicaciones significativas para el diseño de sistemas de recomendación y la mejora de la experiencia del usuario en plataformas de anime. (TERMINADO)
- Presentado en la escuela latinoamericana de redes y sistemas complejos ENREDANDO 2024 en la modalidad de póster
- Tecnologías: R, Python, Conda, Igraph (Tanto en R como en Python), Networkx
- Enlace al repositorio
- Publicado en: En espera
- Análisis del discruso del Caso 03 de la JEP - Se desarrolló en compañía de Alejandro Urrego y de él docente Juan Camilo Sosa el Análisis discursivo del Caso 03 de la JEP el cual habla sobre las desapariciones forzdas y las bajas de civiles presentadas como muertes en combates por parte de agentes del estado, donde se utilizaron tecnicas de WebScrapping a las listas de reproducción subidas a la página de YouTube de la JEP con la intencion de obtener las transcripciones de los videos y poder aplicar la metodología de análisis textual a travez de redes de palabras, tambien se propone un análisis secuencial de sentimientos el cual nos da una idea de como se percibe a nivel sentimental (Sentimientos buenos o Sentimientos Malos) el discurso. Este proyecto se realizo a nivel general y luego por subcasos y tambien por vistimas y victimarios. (AUN EN DESARROLLO)
- Tecnologías: R, Python, Conda, Igraph (Tanto en R como en Python), Networkx
- Enlace al repositorio
Habilidades
- Lenguajes de programación: R, Python
- Frameworks y Librerías: Scikit-learn, TensorFlow, Pandas, NumPy, Dplyr, Igraph
- Análisis de Datos y Visualización: RStudio, Jupyter Notebook, Matplotlib, Seaborn, Plotly
- Machine Learning y AI: Modelado predictivo, regresión, clasificación, clustering
- Bases de datos: PostgreSQL
- Herramientas: Git, VS Code, Conda, Mini Conda
Educación
- Universidad Nacional de Colombia - Estadística (Año de Finalización: 2025)
- Cursos relevantes: Metodos Multivariados, Analisis Estadistico de Redes Sociales, Analisis de Regresion, Series de Tiempo, Teoria Estadistica del Riesgo, Metodos no Parametricos
- Educación Virtual: Conviertete en Data Analyst - LinkedIn, Kaggle Learn Complete - Kaggle
- Correo: [ceprieto@unal.edu.co]
- LinkedIn:
- El siguiente link contiene mi presentación personal en forma de Blog en el cual se planean desarrollar varias actividades tanto academicas como divulgativas por mi persona, antes que nada mencionar que este sitio todavía esta En construccion pero puedes acceder haciendo click AQUÍ. Si estas interesado en ver como construí este sitio web, puedes echarle un vistazo al repo.