Red neuronal artificial como modelo predictivo en una unidad de patología cervical

  1. VIÑAS APARICIO, OLGA
Dirigida por:
  1. Yolanda Mª Díez Pastrana Director/a

Universidad de defensa: Universidad de Valladolid

Fecha de defensa: 10 de diciembre de 2015

Tribunal:
  1. José Miguel López Novoa Presidente
  2. Julio Alberto Gobernado Tejedor Secretario/a
  3. Enrique Alexandre Cortizo Vocal
  4. María Dolores Ludeña de la Cruz Vocal
  5. Roberto Hornero Sánchez Vocal

Tipo: Tesis

Resumen

El cáncer de Cuello Uterino es a nivel mundial la 3ª neoplasia mas frecuente en mujeres. Ocupando en nuestro país la 3ªcausa de muerte en mujeres entre 15 y 44 años. Su incidencia está íntimamente relacionada con el nivel de desarrollo de una población. A pesar de que en España la incidencia es baja, no podemos obviar que afecta a mujeres jóvenes, dando lugar a una morbimortalidad innecesariamente prematura y sanitariamente evitable. Es importante destacar que la persistencia de infección por VPH es un elemento necesario para el desarrollo de lesiones precursoras y cáncer de cuello uterino. Cofactores como la paridad, el uso de anticonceptivos orales, el tabaquismo, la inmunosupresión particularmente la relacionada con el VIH, la infección por otras enfermedades de transmisión sexual y la desnutrición, se han asociado en grado variable con la aparición de cáncer invasor de cérvix. Siendo indudable la implicación en las patologías de alto grado y carcinoma que en nuestra población tienen los tipos 16 y 18. Las redes neuronales artificiales (RNA) están inspiradas en las redes neuronales biológicas del cerebro humano. Abstraen las características principales de una base de datos y pueden cambiar su comportamiento en función del entorno. La unidad elemental análoga a la neurona biológica es el elemento procesador, siendo una RNA varios elementos procesadores conectados de una forma concreta. Normalmente están organizados en capas. HIPÓTESIS Y OBJETIVOS. La Hipótesis en función de lo relatado es la siguiente: Las Redes Neuronales Artificiales permiten plantear seguimientos clínicos en función de predictores relevantes, mejorando la calidad de la investigación, minimizando las acciones clínicas sobre las enfermas y optimizando la gestión de los recursos. En base a la hipótesis formulada se pretende alcanzar un objetivo general: Crear un modelo predictivo, basado en RNA, para ayuda a la toma de decisiones en nuestra practica clínica diaria, en la unidad de patología cervical del complejo asistencial de Palencia. Siendo los objetivos específicos para llegar al objetivo general: Generar e identificar el mejor modelo, crear un software para la clasificación en función del riesgo de Cáncer de Cérvix, elaborar un perfil, estimar el rendimiento predictivo de la RNA y formular criterios en el seguimiento de mujeres sanas con lesiones pre-invasivas y deseo de preservar su fertilidad, intentando lograr la disminución de tratamientos invasivos que puedan alterarla. MATERIAL Y METODOLOGÍA. Para dar respuesta a la hipótesis y los objetivos planteados diseñamos un plan de investigación que comparte las condiciones de un estudio observacional de prevalencia y prospectivo de cohortes. La unidad de cribado de cáncer de cérvix en Palencia cubre un área de 24008 mujeres entre 25-64 años en 2012. Se caracteriza correctamente la muestra de las pacientes a estudio, realizando un análisis descriptivo de las variables. El análisis exploratorio busca la reducción de la información y quedarnos tan solo con las variables que realmente son interesantes en la predicción del proceso a estudio, cáncer de cérvix. La RNA se trata del objeto básico de la investigación realizada. Para su realización se extrae la información contenida en los datos disponibles desde la apertura de la unidad de patología cervical el 1 de enero 2013. Para la implementación de la RNA hemos utilizado el software neuronal designer que permite arquitecturas con múltiples capas de procesamiento no lineal. RESULTADOS. El conjunto de datos contiene la información relevante para crear el modelo predictivo. Está contenido en un archivo Excel en el que cada columna representa una variable relacionada con el cáncer de cérvix y cada fila una paciente de la unidad de patología cervical. El número de variables es 7; edad, citología, hpv, biopsia, p16, tabaco, diagnóstico. El número de casos es 197 que son las pacientes de los últimos 3 años con un diagnóstico definitivo. Las RNA trabajan con valores numéricos sin embargo la mayoría de las variables tienen valores nominales. El primer paso es asignar valores numéricos a todas estas variables.La variable edad es numérica y por tanto no hay que modificarla. La variable citología se puede considerar ordinal ya que sus valores son distintos grados de una misma manifestación y se pueden ordenar por severidad. La variable hpv se considera ordinal, representando los valores numéricos asignados a esta prueba donde 16 y 18 representan el mismo riesgo que es máximo. La variable p16 al igual que el tabaco son binarias, a la positividad se le asigna el valor 1. Una vez asignados los valores numéricos a todas las variables ordinales y binarias, ya disponemos de un conjunto de datos listo para ser modelado por una red neuronal. Los valores perdidos representados por ? no se han eliminado, se han sustituido por las medias de las variables. Las variables son de dos tipos: de entrada (predictoras) ,objetivo (variables a predecir). En cuanto a los casos pueden ser de 3 tipos: de entrenamiento: utilizados para construir distintos modelos de diagnóstico con distintas topologías. De generalización: elegir el modelo de diagnóstico con la mejor capacidad predictiva. De validación: validar el funcionamiento del modelo de diagnóstico. Las estadísticas básicas aportan una información muy valiosa cuando se diseña un modelo, dado que nos indican cuales son los rangos de todas las variables. Caracterizando la muestra de las pacientes a estudio, realizando un análisis descriptivo de las variables. El valor medio DIAGNÓSTICO (1.66) es un poco mayor que el valor medio de BIOPSIA (1.64). Esto indica que la evolución media de los pacientes tiende a ser bastante estable, aunque tiende a empeorar. Los histogramas muestran como las variables se distribuyen por todo su rango. Para el análisis predictivo es aconsejable una distribución uniforme de todas las variables. Si los datos se distribuyen de forma muy irregular entonces el modelo será de baja calidad. Es interesante buscar dependencias lineales entre cada una de las variables de entrada y el diagnóstico. Correlaciones de 1 indican una dependencia lineal fuerte, en cambio las correlaciones de cero no indican dependencia. Hay que tener en cuenta que en general las variables objetivo dependen de muchas entradas simultáneamente y que su relación no es lineal. La tabla muestra correlaciones lineales entre las variables de entrada y las variables objetivo, indicándonos la importancia relativa de cada variable en el diagnóstico aunque hay que ser precavido. La RNA define la función que representa el modelo de diagnóstico. El tipo de RNA está basado en el perceptrón multicapa que es ampliamente utilizado debido a sus capacidades de aproximación. El perceptrón multicapa es extendido con una capa de escalado conectada a las entradas y una capa de desescalado conectada a las salidas, estas dos capas hacen q la RNA trabaje siempre con valores normalizados produciendo mejores resultados. Inicialmente el numero de entradas es 7, y el de salidas 1. Posteriormente el estudio de generalización eliminará las variables que no mejoren la capacidad predictiva de la red neuronal. La complejidad de esta red es de 2 capas de perceptrones. La 1ª o capa oculta tiene una función de activación no lineal. La 2ªcapa o de salida tiene función de activación lineal. Inicialmente el número de neuronas en la capa oculta es 9 aunque el estudio de generalización podrá aumentar o reducir este número hasta encontrar la complejidad óptima. Uno de los términos objetivo mas comunes es la suma de los errores cuadráticos, una de las formas mas simples de regularización es la norma de los parámetros de la red neuronal: lo que hace que la RNA tenga pesos sinápticos mas pequeños lo que forzará que sus salidas sean mas suaves. La función de rendimiento al ser una función no lineal de los parámetros no es posible encontrar algoritmos de entrenamiento exacto, por lo que se busca el óptimo de la función de rendimiento iterativamente. En cada iteración el rendimiento se incrementara mediante el ajuste de los parámetros de la red neuronal. Utilizamos el método Quasi-Newton como estrategia de entrenamiento. No requiere cálculo de 2ª derivadas, en su lugar aproxima las segundas derivadas usando información de las primeras derivadas. Para saber si las capacidades predictivas de una RNA son buenas se hace uso de los datos de generalización. El error de la red sobre estos datos indica la capacidad que tiene el modelo para predecir futuros casos no incluidos en el conjunto de datos usado para su entrenamiento. El resultado es que al eliminar la variable tabaco las capacidades predictivas mejoran, al eliminar cualquier otra variable empeoran. Se entrenan varias redes neuronales con diferentes complejidades, midiendo el error de generalización, siendo el resultado óptimo con dos neuronas en la capa oculta. Los resultados del entrenamiento para la red neuronal con menor error de generalización son: Norma de los parámetros 2.19, valor no muy alto, la red no esta sobre-ajustando datos. Error de entrenamiento final: 0,484, valor pequeño, la red esta ajustando datos. Error de generalización: 0,557, pequeño, tiene buenas capacidades predictivas. Norma del gradiente: 0,0894, muy pequeño, indica que el algoritmo de entrenamiento ha llegado al mínimo error. El propósito de la validación es comparar los resultados predichos por la red neuronal y sus respectivos valores en un conjunto de datos independientes. El análisis conduce a tres parámetros: ordenada en el origen, pendiente de la mejor regresión lineal relacionando salidas y objetivos y el coeficiente de correlación entre salidas y objetivos. La tendencia es buena y la dispersión no es muy elevada aunque son susceptibles de mejora. Las estadísticas básicas de los errores para los casos de validación, la media de error es 0,5 que es la mitad de un grado de la variable diagnóstico: este es un buen indicador de la calidad del diagnóstico. El decir que la desviación es de 0,565 indica que la mayoría de las pacientes tienen un error que no supera ese valor. Por otro lado se pueden observar errores elevados, siendo necesario estudiar si son casos aislados o no. Una vez validadas las capacidades predictivas de la RNA esta pasa a ser usada en la unidad de patología cervical como un sistema de ayuda a la toma de decisiones. La expresión matemática representada por la red neuronal está listada y puede implementarse en cualquier lenguaje computacional. Esta toma como entradas los valores de edad, citología, hpv, biopsia, p16 para producir la salida diagnóstico. La información se propaga hacia adelante por la capa de escalado, las capas de perceptrones y la capa de desescalado. CONCLUSIONES.1. Las características demográficas y epidemiológicas de las mujeres participantes en el programa de cribado de cáncer de cuello uterino del Área Sanitaria de Palencia, son semejantes a las identificadas en el contexto nacional y regional. 2. Al aplicar una red neuronal artificial en la unidad de patología cervical en base a un programa de cribado de cáncer de cuello uterino poblacional nos permite la identificación de variables relevantes para la clasificación de las mujeres participantes que se encuentran ya en nuestra unidad. 3. En el seguimiento de lesiones intraepiteliales de bajo grado (L-SIL), la utilización de la Red Neuronal creada para nuestra unidad de Patología Cervical es un eficaz predictor en seleccionar aquellas lesiones que evolucionarían hacia una lesión de alto grado, y evita que estas pasen desapercibidas. 4. A la hora de elegir sólo aquellas pacientes con CIN II, y estudiar su probabilidad de desarrollo a carcinoma de cérvix, encontramos el fallo de la falta de datos existentes a día de hoy en la unidad. 5. La interacción de factores de riesgo evaluados, hace eficiente el modelo de Redes Neuronales propuesto, y nos ayuda a identificar a las mujeres participantes en el programa de cribado en grupos de riesgo para desarrollar cáncer de cuello uterino. 6. La efectividad del modelo Perceptrón Multicapa parece facilitar el diseño de programas de seguimiento en función del perfil de riesgo propio de las mujeres participantes ya clasificadas y seguidas en una unidad de patología cervical. 7. En función de los resultados observados, el empleo de la Red Neuronal no optimizaría aún las intervenciones realizadas sobre las pacientes participantes en nuestra unidad tanto en el seguimiento como quirúrgicamente hablando, disminuyendo intervenciones innecesarias, ya que hace falta un aumento de la información, precisión y disminución del error a expensas de aumentar el número de casos. 8. Con respecto a lo observado en nuestro estudio podemos afirmar que en general: “Las redes neuronales artificiales permiten plantear seguimientos clínicos a la carta en función de predictores relevantes mejorando la calidad de la investigación, minimizando las acciones clínicas sobre las enfermas y optimizando la gestión de los recursos”. Pero en nuestro caso concreto debemos seguir implementando su información, aumentando el número de datos e introduciendo y valorando más variables que puedan influir en el diagnóstico final. 9. Las Redes Neuronales Artificiales se muestran como una herramienta potente para el análisis del conjunto de datos donde hay relaciones no lineales entre los datos a estudio y la información a ser predicha.