Minería de datos y texto para la detección de fraude en contratos públicoscaso de estudio sistema oficial de contratación pública de Ecuador
- Vivian Félix López Batista Director
Defence university: Universidad de Salamanca
Fecha de defensa: 27 September 2023
- Manuel Martín-Merino Acera Chair
- Gabriel Villarrubia González Secretary
- Valderi Reis Quietinho Leithardt Committee member
Type: Thesis
Abstract
En el mundo globalizado actual, la corrupción según afirma la ONU, está presente en todos los países, en diferentes formas y tipologías. Afectando directamente en la ejecución de contratos tanto públicos como privados. Los avances en las Tecnologías de la Información (TIC) y la Inteligencia Artificial (IA) han propiciado la lucha contra esta lacra a través del uso de la tecnología. Aportando y tomando como aliada el fomento de la transparencia en los actos de contratación, que constituyen la clave para lograr la integridad del proceso de adquisición gubernamental. Las iniciativas actuales se centran en el análisis e identificación de riesgos de corrupción en las compras públicas, pues según afirma Transparencia Internacional, es este proceso el que alcanza los mayores costos de la corrupción. La detección de corrupción de forma automática requiere una gestión avanzada de importantes cantidades de información con técnicas típicas de minería de datos, aprendizaje automático y analítica avanzada. Pero la mayoría de las propuestas recogidas en la literatura, en la exploración de estos datos, solo están enfocadas a la resolución de problemas muy específicos. Evidenciándose que algunos tipos de corrupción como el favoritismo, han sido poco estudiados. Así como los sesgo o la combinación de varios tipos de corrupción. Por lo que en la actualidad se han venido desarrollando nuevos trabajos de investigación sobre el uso de los datos, asociadas al proceso de compra pública, para abordar estas carencias, que han llamado nuestra atención. En esta tesis doctoral se establece una metodología para prevenir y detectar corrupción de forma automática, desde la información generada en la contratación pública, mediante el uso de técnicas de aprendizaje automático y Procesamiento del Lenguaje Natural (PLN). Con el objetivo de comprobar el potencial de la metodología propuesta, se desarrollan algoritmos de detección y predicción de favoritismo, sobreprecio y sesgo en contratos elaborados con instituciones del estado. La investigación geográfica, también refleja que Latinoamérica, se considera un nicho de investigación sobre el tema, al no existir una gran cantidad de trabajos en el área. En consecuencia, se diseñaron diferentes casos de estudio a través del Servicio Nacional de Contratación Pública (SERCOP) de Ecuador. Permitiendo validar la metodología, para la detección de sobreprecio en compras de medicamentos durante la pandemia COVID 2019, el favoritismo basado en los parámetros de calificación de procesos y los tipos de contratación. Además, del favoritismo y sesgo basado en el texto generado en cada proceso de compra pública. En cada caso se emplean diversas técnicas de extracción de información, que se aplican a los algoritmos de aprendizaje automático y luego se comprueba su rendimiento a través de diferentes métricas. La metodología permite validar la hipótesis planteada: a través de la evaluación, de los datos y el texto generado en las fases de un proceso de compra pública, mediante la combinación de técnicas de minería de datos y PLN, se puede identificar la corrupción, con resultados muy alentadores para su detección y prevención en compras del sector público. Se pudo comprobar que entre el 30% y el 35% de los procesos de compra pública presentaban indicios de corrupción independientemente de su tipo.