Análisis de variables explicativas en modelos de predicción de roturas en redes de tuberías

  1. Gomez Marti­nez, Patricia
Dirigida por:
  1. Alfredo Granados García Director/a
  2. Francisco J. Martín Carrasco Codirector/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 20 de septiembre de 2017

Tribunal:
  1. Luis M. Garrote de Marcos Presidente/a
  2. Raúl Sánchez Calvo Secretario/a
  3. Luis Balairón Pérez Vocal
  4. Petra Amparo López Jiménez Vocal
  5. Ángela Martínez Codina Vocal

Tipo: Tesis

Resumen

Esta Tesis plantea una metodología para la construcción de un modelo de predicción de roturas, basado en el análisis estadístico de los fallos de una infraestructura en servicio, que en este trabajo se particulariza para la red de distribución, y en su relación con las diferentes variables explicativas. Su aplicación permite identificar las variables con influencia significativa en la ocurrencia de roturas, cuantificar su repercusión en la capacidad predictiva de los modelos que se generen y seleccionar aquél modelo con mayor capacidad de predicción de las roturas de entre las diferentes opciones que se planteen según las múltiples combinaciones de variables consideradas. Con el tiempo y el uso, las infraestructuras de abastecimiento se van deteriorando y van requiriendo cada vez mayores inversiones en reparación. En concreto, la red de tuberías presenta un número creciente de fallos anuales que hace que los gestores del abastecimiento busquen en todo momento reducir la frecuencia de las averías y roturas, siendo éste uno de los mayores retos a los que se enfrentan. La estimación de la vida útil de los elementos de la red requiere un criterio fiable para poder plantear adecuadamente las estrategias de renovación y mantenimiento. Ante los diferentes planteamientos de modelos de predicción de roturas, ya sean físicos o estadísticos, determinísticos o probabilísticos, con diferentes formulaciones matemáticas, la presente Tesis evidencia la dependencia estadística de las roturas de tuberías respecto de las variables explicativas, y determina la combinación más adecuada para la construcción de modelos predictivos a través de la cuantificación de su influencia en la capacidad para predecir los fallos. La característica del planteamiento radica en que para la construcción de los modelos se seleccionan las variables predictivas apoyándose únicamente en un estudio estadístico objetivo de las roturas, basado en la evidencia científica sin adoptar ideas preconcebidas sobre la influencia de las diferentes variables en la ocurrencia de roturas. La metodología planteada se divide en tres partes; en la primera de ellas se identifican las variables de las que dependen las roturas de la red de distribución. Para ello se toman todas las variables que a priori podrían tener significancia en la ocurrencia de roturas a partir de la literatura de referencia, y se realiza un test de significancia Kolmogorov-Smirnov que permite confirmar si existe relación de dependencia. En la segunda parte se plantea la construcción de múltiples modelos predictivos basados en un análisis Bayesiano cuyo objetivo es identificar la probabilidad de ocurrencia de roturas como función de las diferentes variables explicativas seleccionadas en la etapa anterior. Para ello se analiza la función de distribución de la probabilidad de ocurrencia de las variables explicativas en una base de datos genérica y en una asociada a las roturas en la red de distribución. El proceso de generación de modelos va incrementando secuencialmente el orden de los mismos, partiendo del modelo más simple de orden uno, con una única variable, e incorporando paso a paso variables de manera adicional. De entre todos los modelos generados en un mismo orden, al incorporar una variable adicional se seleccionan los diez mejores; sobre esta selección se plantean todos los modelos de orden inmediatamente superior posibles al introducir una nueva variable explicativa independiente; este proceso se realiza con todas las variables explicativas disponibles. Se evalúan los modelos y se vuelven a elegir los diez con mejor comportamiento. El proceso prosigue incorporando variables de manera secuencial hasta que no se observa una mejoría significativa en el comportamiento entre un modelo y el de orden superior de acuerdo con el proceso de validación que se describe a continuación. La combinación de variables en la generación de los diferentes modelos se realiza desde dos perspectivas, por un lado se plantean modelos con todas las variables independientes, y por otro se plantean modelos en los que dos variables se analizan de manera conjunta y el resto independientes. La tercera parte de la metodología consiste en la evaluación de los modelos generados de forma objetiva y sistemática mediante la definición de un procedimiento de validación que cuantifica la calidad de los mismos en base a su capacidad de predicción de las roturas. Dicho planteamiento exige un análisis de sensibilidad previo que permita conocer la incertidumbre de los resultados de la validación para garantizar la bondad de la evaluación, y la minimización de la influencia de los parámetros que definen el procedimiento como son el tamaño de la muestra, el número de muestras y el periodo de ajuste. El resultado esperado de la aplicación de la metodología es la definición de la mejor combinación de variables en el modelo predictivo de mayor calidad, es decir, aquél en el que se observa la mejor capacidad de predicción de las roturas. Esta metodología se aplica a la red de distribución de la Comunidad de Madrid (España) gestionada por Canal de Isabel II. Aprovechando los datos disponibles en dicha red se analiza la influencia de las variables explicativas y se identifican los mejores modelos predictivos. En este sentido, las variables con mejor comportamiento por sí solas son diámetro, material y año de instalación. El análisis de los modelos desarrollados revela que si bien a medida que se incorporan variables explicativas de manera secuencial se va mejorando la capacidad predictiva, no todas las combinaciones de variables lo consiguen. También se observa que la mejora se va suavizando por lo que no siempre compensará establecer un modelo predictivo con el mayor número de variables posibles pues la mejora en la predicción resulta insignificante de los modelos de mayor orden frente a la complejidad que implica el tratamiento de un mayor número de variables. Esta idea se traduce en que determinados modelos con un menor número de variables explicativas suponen mejores soluciones, es decir que no se observan ventajas relevantes al establecer modelos construidos con un gran número de variables explicativas. Los resultados obtenidos con los modelos de orden cuatro y orden cinco son muy similares lo que no justifica la aplicación de modelos más complejos simplificando así el tratamiento y la predicción de las roturas con menos variables, cuatro para el caso de estudio.