Clasificación de imágenes de satélite mediante autómatas celulares

Espinola Pérez, Antonio Moisés

Clasificación de imágenes de satélite mediante autómatas celulares

Espinola Pérez, Antonio Moisés

Dirigida por:

Luis Fernando Iribarne Martínez Director/a
José Antonio Piedra Fernández Codirector/a
R. M. Ayala Palenzuela Codirector/a

Universidad de defensa: Universidad de Almería

Fecha de defensa: 21 de noviembre de 2014

Tribunal:

Amparo Fúster Sabater Presidente/a
José Antonio Torres Arriaza Secretario/a
Juan Manuel Corchado Rodríguez Vocal

Tipo: Tesis

Teseo: 374660 DIALNET riUAL editor

Resumen

La teledetección es una ciencia aplicada que permite la adquisición de información mediante técnicas que no requieren contacto físico con el objeto o área que está siendo observada. La teledetección ha sido utilizada en incontables aplicaciones medioambientales con el objetivo de resolver y optimizar problemas de índole muy variada, como por ejemplo los estudios de calidad del suelo, la búsqueda de recursos hídricos, las simulaciones meteorológicas o la protección ambiental, entre otros. Para solventar todos estos problemas, uno de los desafíos más complicados a los que se enfrenta la teledetección es el procesamiento de las enormes cantidades de datos recolectados por los satélites. Existen muchas técnicas que se utilizan en el ámbito de la teledetección, con el objetivo de ayudar a los analistas expertos a interpretar los datos generados y ofrecidos por los satélites. Algunas de las técnicas más importantes son los algoritmos de clasificación de imágenes de satélite, cuya finalidad consiste en agrupar todos los píxeles de una imagen digital en un número finito de clases, facilitando de este modo la interpretación de la enorme cantidad de datos contenidos en las bandas espectrales captadas por los sensores de los satélites. Cuando se aplica un algoritmo de clasificación a una imagen de satélite, los datos obtenidos por los sensores, almacenados como niveles digitales en forma de bandas espectrales, se transforman en una escala categórica fácil de interpretar por parte de los analistas expertos. La imagen clasificada que se obtiene como resultado es un mapa temático de la imagen de satélite original, donde los píxeles pertenecientes a la misma clase tienen características espectrales similares. Los algoritmos de clasificación de imágenes de satélite se pueden dividir en dos categorías principales, no supervisados y supervisados, y el uso de unos u otros depende del conocimiento previo que tengan los analistas expertos de la zona de estudio. Los algoritmos de clasificación de imágenes de satélite no supervisados trabajan sin el conocimiento previo del área de estudio. En este caso, el analista experto sólo tiene que especificar el número total de clases deseadas, y el algoritmo no supervisado agrupa los píxeles de la imagen en dicho número de clases, basándose únicamente en los datos espectrales de las bandas. La tasa de acierto de la clasificación obtenida por estos métodos es bastante menos fiable que los resultados ofrecidos por los algoritmos de clasificación supervisados, ya que en los algoritmos no supervisados la computadora agrupa los píxeles de la imagen en clases sin tener en cuenta el conocimiento que tiene el analista experto del área de estudio. Existen muchos algoritmos de clasificación no supervisados, como k-medias, isodata, maximin y el modelo neural. Los algoritmos de clasificación de imágenes de satélite supervisados trabajan con el conocimiento previo del área de estudio, por lo que pueden hacer una clasificación mucho más precisa que los algoritmos de clasificación no supervisados, basándose en el conocimiento experto humano. En una fase anterior al proceso de clasificación, el analista experto selecciona, de la propia imagen de satélite, varias muestras de las diferentes clases. Dichas muestras están formadas por píxeles representativos que componen el denominado conjunto de entrenamiento (o firmas), sobre el que posteriormente se basa el proceso de clasificación supervisado. Por lo tanto, en este método, el conocimiento del analista experto sobre el área de estudio determina la calidad, tanto del conjunto de entrenamiento como de la tasa de acierto obtenida por parte del proceso de clasificación. Los algoritmos de clasificación supervisados comparan cada píxel de la imagen con estas firmas elegidas por el analista experto y, a continuación, cada píxel es etiquetado en la clase a la que más se asemeja espectralmente. Los algoritmos de clasificación supervisados, en general, ofrecen mejores resultados que los algoritmos de clasificación no supervisados. Existen muchos algoritmos de clasificación de imágenes de satélite supervisados, como paralelepípedos, mínima distancia}, máxima verosimilitud, distancia de Mahalanobis y algoritmos difusos supervisados. Los resultados proporcionados por los algoritmos de clasificación de imágenes de satélite tienen muchas aplicaciones medioambientales, militares, sociales y políticas. Estos resultados son los principales elementos que utilizan muchos sistemas de información geográficos (SIG) para ofrecer al usuario la información requerida, como por ejemplo el cálculo del crecimiento del suelo urbano en las ciudades en un intervalo de tiempo determinado, la monitorización de la calidad ambiental después de desastres naturales, la creación de mapas GPS de manera automatizada, la actualización de la superficie cartográfica de una zona concreta, la prevención de desastres naturales (como la propagación de incendios o las avalanchas de nieve), la evaluación de los riesgos de los recursos naturales o el estudio de la evolución del cambio climático en las distintas zonas del planeta. Por lo tanto, ya que los algoritmos de clasificación de imágenes de satélite son la base de muchos SIG, es importante proporcionar unos resultados tan optimizados como sea posible. En la actualidad existe una gran cantidad de algoritmos de clasificación, y el uso de uno u otro en particular depende del conocimiento que posea el analista experto sobre la zona de estudio. Sin embargo, los algoritmos clásicos presentan tres limitaciones importantes: la baja tasa de acierto obtenida en imágenes de satélite complejas, la rigidez de los resultados y la falta de personalización del proceso de clasificación. En primer lugar, a pesar del gran número de algoritmos de clasificación de imágenes de satélite que existe en la actualidad, ninguno es completamente fiable en términos de tasa de acierto. En general, los algoritmos de clasificación funcionan de un modo correcto si las propiedades espectrales de los píxeles determinan adecuadamente las clases, o si las imágenes no presentan ruido adicional. Sin embargo, si existen clases en la imagen de satélite con un alto grado de heterogeneidad, es decir, que agrupan píxeles con diferentes características, y que presentan un amplio abanico espectral (píxeles inciertos), o las imágenes son alteradas con un ruido de tipo impulsivo-gaussiano (píxeles ruidosos), la imagen resultante puede presentar muchas áreas diminutas mal clasificadas. Todos estos problemas provocan una pérdida de la calidad de la tasa de acierto durante el proceso de clasificación. Para solucionar estos problemas, podemos aplicar posteriormente algoritmos contextuales de post-clasificación, que utilizan datos contextuales además de los datos espectrales. Existen muchos algoritmos contextuales de post-clasificación, que utilizan valores promedio o la descripción de texturas, para mejorar los resultados obtenidos por los algoritmos de clasificación espectral. Sin embargo, el inconveniente de su uso consiste en que es necesario aplicar tres algoritmos a lo largo de todo el proceso: un algoritmo de pre-clasificación para eliminar los píxeles ruidosos, el algoritmo de clasificación propiamente dicho y un algoritmo de post-clasificación para mejorar la clasificación de los píxeles inciertos. A veces, como consecuencia de la aplicación de todos estos algoritmos, puede incluso empeorar la tasa de acierto. Por lo tanto, sería interesante disponer de un solo algoritmo que contara con las bondades de los tres procesos anteriormente mencionados, para incrementar la calidad de la tasa de acierto mediante una clasificación espectral-contextual. En segundo lugar, los algoritmos de clasificación de imágenes de satélite clásicos ofrecen resultados demasiado rígidos, ya que cada píxel es etiquetado en su clase correspondiente independientemente del nivel real de cercanía respecto al centro espectral de dicha clase, es decir, no se ofrece un grado de pertenencia. Sólo los algoritmos de clasificación difusa proporcionan dicha información, pero no los clásicos. Sería interesante que un algoritmo ofreciera una clasificación jerárquica dividida en niveles de pertenencia a las clases, para que los analistas expertos pudieran comprobar qué píxeles están más cerca de sus clases y cuáles están más distantes en el espacio de características, con el objetivo de detectar los píxeles más problemáticos. En tercer lugar, los algoritmos de clasificación clásicos no permiten personalizar el funcionamiento para ajustarse a una zona de estudio concreta, o para obtener unos resultados específicos. Sería interesante poder personalizar el proceso de clasificación, para obtener unos u otros resultados dependiendo del objetivo que se quisiera conseguir en cada zona de estudio determinada. Por otro lado, un autómata celular es un modelo matemático que consiste en un conjunto de celdas, normalmente distribuidas en forma de matriz bidimensional, donde cada celda posee un estado, que puede cambiar a lo largo de un número determinado de iteraciones, como consecuencia de la aplicación de un conjunto de reglas a través de una función de transición f, teniendo en cuenta no sólo el estado actual de la celda en cada iteración concreta, sino también el estado de sus celdas vecinas. En los últimos años, los autómatas celulares se han convertido en una potente herramienta que se ha aplicado a numerosos ámbitos científicos. Dentro del ámbito de la teledetección, se han aplicado sobre todo para implementar procesos de simulación en imágenes de satélite, ya que sus propiedades permiten trabajar con este tipo de problemas. No obstante, en el ámbito específico de la clasificación de imágenes de satélite, son escasos los trabajos relacionados con los autómatas celulares, a pesar de las ventajas que pueden llegar a ofrecer. Las tres limitaciones de los algoritmos de clasificación de imágenes de satélite mencionadas anteriormente se pueden resolver mediante las propiedades de los autómatas celulares. La primera limitación se puede superar mediante el uso de la vecindad de cada celda del autómata celular durante el proceso de clasificación, obteniendo una pre-clasificación (para píxeles ruidosos), clasificación y post-clasificación (para píxeles inciertos) agrupados en un solo algoritmo espectral-contextual, pudiendo ajustar además el nivel contextual, usando más o menos vecinos para las celdas. La segunda limitación se puede superar mediante el uso de las iteraciones del autómata celular, como método de división del proceso de clasificación en varios niveles jerárquicos con distinto grado de calidad. La tercera limitación se puede superar mediante el empleo de distintas reglas aplicadas, a través de la función de transición f, para poder personalizar lo máximo posible el proceso de clasificación en cada caso concreto. Esta tesis doctoral se centra en el desarrollo de un nuevo algoritmo de clasificación de imágenes de satélite basado en autómatas celulares, denominado algoritmo ACA (classification Algorithm based on Cellular Automata), que resuelve las tres limitaciones descritas, proporcionando una clasificación con una tasa de acierto mejorada mediante resultados espectrales-contextuales, divididos en niveles de fiabilidad relacionados con el grado de pertenencia de los píxeles a sus clases correspondientes, y con la posibilidad de personalizar el proceso de clasificación. Todas estas mejoras permiten a los analistas expertos disponer de una mayor cantidad de información para mejorar la interpretación de los resultados obtenidos. De este modo, el algoritmo ACA optimiza la funcionalidad de cualquier SIG que lo utilice como base, ya que mejora los resultados de la clasificación en tres niveles: acierto, flexibilidad y personalización.