Estudio de la incidencia del conocimiento lingüístico en los sistemas de recuperación de la información para el español
Defence university: Universidad de Salamanca
Fecha de defensa: 25 October 2001
- María Pinto Molina Chair
- María Angélica González Arrieta Secretary
- José Manuel Bustos Gisbert Committee member
- Eladio Sanz García Committee member
- Maria José Recoder Committee member
Type: Thesis
Abstract
[ES]Hoy en día es necesario estar bien informado, por las características de la información necesitamos sistemas que trabajen con el lenguaje natural o donde el central de los términos sea mínimo. Para este trabajo hemos creado un lenatizador mediante una máquina de estados finitos no determinista con el fin de aplicando a la recuperación de información en español. La función del lematizador es eliminar los sufijos de manera automática y establecer su lema. A partir de los lemas se hace la indización y posterior recuperación. Para probar la eficacia del lematiador se realizan experimentos de lematización flexiva y derivativa, combinando esto con la supresión de palabras vacías.