Asignatura de Recuperación de Información de la especialidad de Sistemas de la Información del Grado en Ingeniería Informática de la Universidad de Granada (UGR)
Extracción de contenido con Tika
Para poder ejecutar correctamente el programa hay que añadir las librerías especificadas en el script de ejecución. Para esta práctica en concreto sólo hace falta la librería de Tika, la cual puedes encontrar aquí.
Preprocesado de documentos
En el directorio /docs hay que añadir el documento sobre el que se van a realizar los análisis.
Las librerías necesarias para esta práctica son:
En esta práctica simplemente se implementa una clase capaz de extraer todas las películas del fichero csv y para cada una de ellas extraer todos y cada uno de los campos requeridos. Dicho fichero csv se encuentra aquí.
Las bibliotecas necesarias en esta práctica han de encontrarse en comprimidas en un fichero jar_files.zip, el cual no se ha incluido en el directorio.
Implementación del sistema de recuperación de información con interfaz gráfica. Tras la indexación y búsqueda de las prácticas anteriores se realiza un filtrado por categorías y facetas.