Clasificación fonética independiente del locutor usando una jerarquía de RNAs especializadas

  1. Cardeñoso Payo, Valentín
  2. Silva Varela, Hernando
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 1999

Número: 25

Páginas: 191-198

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Se describe una técnica para la clasificación fonética independiente del locutor mediante el uso de Redes Neuronales Artificiales (RNAs) especializadas; la técnica propuesta se basa en el principio "dividir para vencer" al utilizar una jerarquía de RNAs que se encarga de realizar la tarea por etapas. La jerarquía implementada consiste en un conjunto de Perceptrones Multicapa (PMCs), con un "clasificador modal" que se encarga de clasificar los patrones de entrada de acuerdo a su modo de articulación. Una vez preclasificado, el patrón de entrada es redirigido a un segundo PMC que ha sido entrenado para clasificar los fonemas que componen una categoría modal particular. Se presentan resultado obtenidos al clasificar datos de 108 locutores del corpus en castellano de OGI, el cual contiene habla continua grabada por línea telefónica. Los resultados expuestos abarcan cuatro parametrizaciones utilizadas comúnmente en el preproceso de señales de voz: CPL(LPC), Cepstrum, PLP y Mel Cepstrum.