Desarrollo de un algoritmo de Mínimos Cuadrados Parciales para análisis de datos de chips de ADN usando el estadístico VIP para selección de genes y clasificación binaria

  1. Burguillo Muñoz, Francisco Javier
Supervised by:
  1. Francisco Javier Martín Vallejo Director
  2. Inmaculada Barrera Mellado Director

Defence university: Universidad de Salamanca

Fecha de defensa: 15 May 2015

Committee:
  1. Purificación Galindo-Villardón Chair
  2. Susana Luísa da Custódia Machado Mendes Secretary
  3. Valter Martins Vairinhos Committee member
Department:
  1. ESTADÍSTICA

Type: Thesis

Abstract

[ES]La tecnología de chips de ADN o "microarrays" ha supuesto un nuevo paradigma en la investigación biomédica, especialmente en el estudio del cáncer. Estos chips miden los niveles de expresión de miles de genes simultáneamente, que se usan luego para caracterizar el perfil génico de las enfermedades, la respuesta a los tratamientos o la evaluación de pronósticos. En esta investigación se ha implementado un algoritmo de mínimos cuadrados parciales (partial least squares (PLS) en inglés) que realiza una selección de variables (genes) mediante el estadístico VIP (Variable Influence on Projection), que de modo iterativo optimiza la selección de variables y el número de factores PLS del modelo predictor, con el fin de obtener un valor mínimo de error de clasificación binaria que es la habitual en Biomedicina. Este algoritmo se ha probado de forma sistemática tanto con datos simulados como con datos reales. Se ha investigado también el funcionamiento del algoritmo con modelos predictores que combinan variables clínicas y génicas a la vez.