Sistema genérico de razonamiento basado en casos (CBR) multi-clase como soporte al diagnóstico médico mediante técnicas de reconocimiento de patrones

  1. Blanco Valencia, Xiomara Patricia
Supervised by:
  1. Juan Manuel Corchado Rodríguez Director
  2. Diego Hernán Peluffo Ordoñez Director
  3. Juan Francisco de Paz Santana Director

Defence university: Universidad de Salamanca

Fecha de defensa: 15 September 2017

Committee:
  1. Florentino Fernández Riverola Chair
  2. Gabriel Villarrubia González Secretary
  3. Javier Bajo Pérez Committee member
Department:
  1. INFORMÁTICA Y AUTOMÁTICA

Type: Thesis

Abstract

El aprendizaje a partir de la experiencia es un proceso que se da de forma natural en los seres humanos, y el conocimiento generado con dicho proceso se convierte en la base para establecer soluciones a problemas cotidianos. En el campo de la inteligencia artificial, específicamente en el área del aprendizaje de máquina, pretendiendo emular esta habilidad del ser humano, ha surgido la metodología denominada razonamiento basado en casos (CBR). El núcleo de un sistema de CBR es el caso, que denota usualmente una situación problema o experiencia previa, la cual ha sido capturada y aprendida, y puede ser reutilizada para resolver problemas futuros. El ciclo de vida de un sistema basado en CBR consiste en cuatro etapas principales: Recuperación, donde se identifica el problema y se encuentran casos pasados similares al nuevo caso; adaptación, donde se sugiere una solución a partir de los casos recuperados; revisión, en la cual se evalúa la solución propuesta; y, finalmente, aprendizaje, donde se actualiza el sistema para aprender de la experiencia. Los sistemas de CBR han demostrado su alta aplicabilidad en el campo de la salud, específicamente en diagnóstico m´edico de forma que los síntomas representan el problema (nuevo caso) y, por tanto, la solución obtenida será el diagnóstico recomendado. En el estado del arte de CBR aplicado a diagnóstico m´edico, se encuentran algunos estudios que principalmente se enfocan en mejoras de la etapa de recuperación. No obstante, aún existen problemas abiertos relacionados con la representación de los casos y la solución de problemas multiclase. En efecto, si la representación de los casos no es adecuada, los resultados de la recuperación no serán óptimos. Además, la mayoría de los sistemas de CBR han sido dise˜nados para resolver problemas biclase, limitando entonces la etapa de adaptación automática a dos únicas posibles soluciones (típicamente, normal o patológico), con lo cual dichos sistemas pierden la capacidad de categorizar el estado de una patología o de identificar diagnósticos diferenciales. En este trabajo de tesis, se presenta una propuesta de sistema gen´erico de CBR para la identificación de múltiples casos diagnósticos usando etapas de recuperación y adaptación mejoradas. Para este propósito, se plantea SAM (Sistema de Adaptación Mejorada) que consiste en un sistema que utiliza dos clasificadores en cascada que mejora el desempe˜no de la clasificación de los pacientes enfermos. Dicha propuesta surge como resultado de un estudio comparativo de t´ecnicas de representación de datos para obtener el vector de casos y de diferentes clasificadores multiclase en la etapa de adaptación. Además, como aporte significativo de este trabajo, se desarrolla una interfaz que comunica al especialista las probabilidades de pertenencia del nuevo caso a cada uno de los posibles diagnósticos. Experimentalmente, se comprueba que SAM, usando dos clasificadores en cascada basados en K-NN y con una apropiada selección de características en el pre-proceso, genera resultados satisfactorios en t´erminos de medidas de clasificación mientras provee al especialista de forma inteligible los resultados de la recuperación de casos.