La Recuperación de Información en español y la normalizacion de términos

  1. Alonso Berrocal, José Luis
  2. Rodríguez Vázquez de Aldana, Emilio
  3. García de Figuerola Paniagua, Luis Carlos
  4. Zazo Rodríguez, Ángel Francisco
Revista:
Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

ISSN: 1137-3601 1988-3064

Any de publicació: 2004

Volum: 8

Número: 22

Pàgines: 135-145

Tipus: Article

Altres publicacions en: Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial

Resum

La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.