El conocimiento lingüistico en la desambiguación semántica automática

  1. NICA MIHAELA, IULIANA
Dirigée par:
  1. María Antonia Martí Antonín Directeur/trice
  2. Andrés Montoyo Guijarro Co-directeur/trice

Université de défendre: Universitat de Barcelona

Fecha de defensa: 29 octobre 2004

Jury:
  1. Sebastià Serrano Farrera President
  2. Mariona Taulé Delor Secrétaire
  3. Julio Gonzalo Rapporteur
  4. Manuel Palomar Rapporteur
  5. Germán Rigau Claramunt Rapporteur

Type: Thèses

Teseo: 123921 DIALNET

Résumé

La Desambiguación Semántica Automática (DSA) es una cuestión abierta dentro del área del Procesamiento del Lenguaje Natural. En la presente tesis, se estudian modalidades concretas para la incorporación de conocimiento lingüistico en el proceso de DSA, con el objetivo de mejorar la calidad de la terea. Se propone una nueva estrategia de desambiguación de las palabras no aisladas, sino integradas en patrones léxico sintácticos. Esta integración permite la extración de información paradigmática y antagmática relacionada con una ocurrencia ambigna dada a partes del corpus. En paralelo, se deriva a partir de EnoWodnet una nueva fuente léxica, Discrimadores de Sentido y se define en relación con ésta un nuevo algorítmo de DSA, Pueba de Conmutabilidad. La aplicación de este último algoritmo y del algoritmo de la Marcas de Especficita sobre la información precisamente extraída del corpus lleva a u n sistema de DSA con varias heurísticas. Los resultados obtenidos en la experimentación (una precisión de aproximadamente 95%) indican que el enfoque adoptado es idóneo para mejorar el nivel de la tasa de DSA. La tesis abre una nueva línea de investigación en DSA.