Técnicas de expansión en los sistemas de recuperación de información

  1. ZAZO RODRIGUEZ, ÁNGEL FRANCISCO
Dirigée par:
  1. Luis Carlos García de Figuerola Paniagua Directeur

Université de défendre: Universidad de Salamanca

Fecha de defensa: 19 septembre 2003

Jury:
  1. Luis Antonio Miguel Quintales President
  2. Francisco José García Peñalvo Secrétaire
  3. Francisco Sanchis Marco Rapporteur
  4. Julio Gonzalo Arroyo Rapporteur
  5. Ernest Abadal Rapporteur
Département:
  1. INFORMÁTICA Y AUTOMÁTICA

Type: Thèses

Teseo: 95747 DIALNET

Résumé

Esta tesis, después de analizar el estado del arte en recuperación clásica de la información, analiza el proceso de expansión de consultas. Con la expansión de consultas se pretende mejorar la recuperación respecto de una primera consulta, y es especialmente interesante con consultas cortas, ya que su grado de ambigüedad es más alto. Frecuentemente los usuarios no encuentran respuestas adecuadas a sus necesidades informativas, debido fundamentalmente a problemas de inconsistencia de vocabulario, y tienen que replantear su consulta al sistema. Cuando el proceso se hace automáticamente, la expansión conlleva una ampliación de nuevos términos a la consulta inicial y un recálculo de la importancia de cada término en la nueva consulta. En este contexto, las dos dificultades principales son: A,- La selección de los términos más adecuados para añadir a la consulta original. B,- La elección del mecanismo de pesado de los nuevos términos. En esta tesis se describen y analizan las diferentes técnicas existentes hoy día en expansión de consultas, y se realiza una amplia gama de experimentos conducentes a obtener cirterios de aplicabilidad los suficientemente robustos en diferentes condiciones. Sistemáticamente se desarrollan los experimentos utilizando dos colecciones documentales de prueba bastante diferentes en tamaño y calidad, una de ellas desarrollada en el grupo de investigación del doctorando, y la otra desarrolla en las conferencias CLEF. Son especialmente interesantes los experimentos y resultados en expansión utilizando tesauros de asociación y similitud, aplicados global y localmente.