La Recuperación de Información en español y la normalizacion de términos

  1. Alonso Berrocal, José Luis
  2. Rodríguez Vázquez de Aldana, Emilio
  3. García de Figuerola Paniagua, Luis Carlos
  4. Zazo Rodríguez, Ángel Francisco
Revista:
Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

ISSN: 1137-3601 1988-3064

Año de publicación: 2004

Volumen: 8

Número: 22

Páginas: 135-145

Tipo: Artículo

Otras publicaciones en: Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

Resumen

La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.