https://github.com/sadit/ir-2024
Curso de recuperación de información 2024
https://github.com/sadit/ir-2024
Last synced: 3 months ago
JSON representation
Curso de recuperación de información 2024
- Host: GitHub
- URL: https://github.com/sadit/ir-2024
- Owner: sadit
- License: mit
- Created: 2023-11-13T17:32:42.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2024-08-13T16:07:21.000Z (10 months ago)
- Last Synced: 2025-01-19T05:57:34.647Z (4 months ago)
- Language: Jupyter Notebook
- Size: 8.04 MB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Recuperación de Información
## Introducción
La RI es un área especializada en crear algoritmos, y sistemas en última instancia, que sean capaces de encontrar información de utilidad a un usuario así como también organizar la información de una colección para facilitar el acceso a la misma. En otras palabras, el fin es simplificar el acceso al conocimiento contenido en una colección de datos. Los datos pueden ser de diferentes índoles, pero es de especial importancia para la RI aquellos donde un humano puede tener más dificultados, esto es grandes colecciones de datos, y en especial en datos semi-estructurados o no estructurados (e.g., texto escrito en lenguaje natural).
En particular, estaremos trabajando en las siguientes vertientes de la recuperación de información:
- Búsqueda en una colección
- Texto completo
- Espacios métricos
- Análisis:
- Reducción de dimensión y visualización
- Agrupamiento de datosA lo largo de los temas se abordarán darán detalles teóricos sobre los problemas y los algoritmos, así como también se motivará al estudiante a realizar sus propias implementaciones. Se ealizarán análisis experimentales de los mismos y reportes.
## Temario
0. [Metodología y configuración del ambiente](https://github.com/sadit/IR-2024/blob/main/Unidades/u00.ipynb)
1. [Introducción](https://github.com/sadit/IR-2024/blob/main/Unidades/u01.ipynb)
2. [Búsqueda de texto completo y su el índice invertido](https://github.com/sadit/IR-2024/blob/main/Unidades/u02.ipynb)
3. [Modelado léxico y su efecto en el desempeño del índice invertido](https://github.com/sadit/IR-2024/blob/main/Unidades/u03.ipynb)
4. [Búsqueda en espacios métricos e indices basados en grafos](https://github.com/sadit/IR-2024/blob/main/Unidades/u04.ipynb)
5. [Modelado semántico](https://github.com/sadit/IR-2024/blob/main/Unidades/u05.ipynb)
6. [Agrupación de documentos](https://github.com/sadit/IR-2024/blob/main/Unidades/u06.ipynb)
7. [Visualización de información textual](https://github.com/sadit/IR-2024/blob/main/Unidades/u07.ipynb)
8. [Proyecto integrador](https://github.com/sadit/IR-2024/blob/main/Unidades/u07.ipynb)