Desarrollo de un algoritmo de Mínimos Cuadrados Parciales para análisis de datos de chips de ADN usando el estadístico VIP para selección de genes y clasificación binaria

  1. Burguillo Muñoz, Francisco Javier
Dirigida por:
  1. Francisco Javier Martín Vallejo Director
  2. Inmaculada Barrera Mellado Directora

Universidad de defensa: Universidad de Salamanca

Fecha de defensa: 15 de mayo de 2015

Tribunal:
  1. Purificación Galindo-Villardón Presidenta
  2. Susana Luísa da Custódia Machado Mendes Secretario/a
  3. Valter Martins Vairinhos Vocal
Departamento:
  1. ESTADÍSTICA

Tipo: Tesis

Resumen

[ES]La tecnología de chips de ADN o "microarrays" ha supuesto un nuevo paradigma en la investigación biomédica, especialmente en el estudio del cáncer. Estos chips miden los niveles de expresión de miles de genes simultáneamente, que se usan luego para caracterizar el perfil génico de las enfermedades, la respuesta a los tratamientos o la evaluación de pronósticos. En esta investigación se ha implementado un algoritmo de mínimos cuadrados parciales (partial least squares (PLS) en inglés) que realiza una selección de variables (genes) mediante el estadístico VIP (Variable Influence on Projection), que de modo iterativo optimiza la selección de variables y el número de factores PLS del modelo predictor, con el fin de obtener un valor mínimo de error de clasificación binaria que es la habitual en Biomedicina. Este algoritmo se ha probado de forma sistemática tanto con datos simulados como con datos reales. Se ha investigado también el funcionamiento del algoritmo con modelos predictores que combinan variables clínicas y génicas a la vez.