Técnicas de expansión en los sistemas de recuperación de información
Defence university: Universidad de Salamanca
Fecha de defensa: 19 September 2003
- Luis Antonio Miguel Quintales Chair
- Francisco José García Peñalvo Secretary
- Francisco Sanchis Marco Committee member
- Julio Gonzalo Arroyo Committee member
- Ernest Abadal Committee member
Type: Thesis
Abstract
Esta tesis, después de analizar el estado del arte en recuperación clásica de la información, analiza el proceso de expansión de consultas. Con la expansión de consultas se pretende mejorar la recuperación respecto de una primera consulta, y es especialmente interesante con consultas cortas, ya que su grado de ambigüedad es más alto. Frecuentemente los usuarios no encuentran respuestas adecuadas a sus necesidades informativas, debido fundamentalmente a problemas de inconsistencia de vocabulario, y tienen que replantear su consulta al sistema. Cuando el proceso se hace automáticamente, la expansión conlleva una ampliación de nuevos términos a la consulta inicial y un recálculo de la importancia de cada término en la nueva consulta. En este contexto, las dos dificultades principales son: A,- La selección de los términos más adecuados para añadir a la consulta original. B,- La elección del mecanismo de pesado de los nuevos términos. En esta tesis se describen y analizan las diferentes técnicas existentes hoy día en expansión de consultas, y se realiza una amplia gama de experimentos conducentes a obtener cirterios de aplicabilidad los suficientemente robustos en diferentes condiciones. Sistemáticamente se desarrollan los experimentos utilizando dos colecciones documentales de prueba bastante diferentes en tamaño y calidad, una de ellas desarrollada en el grupo de investigación del doctorando, y la otra desarrolla en las conferencias CLEF. Son especialmente interesantes los experimentos y resultados en expansión utilizando tesauros de asociación y similitud, aplicados global y localmente.