Generalización del biplot logístico para dos o más matrices

  1. Vicente González, Laura
Dirigida por:
  1. José Luis Vicente Villardón Director

Universidad de defensa: Universidad de Salamanca

Fecha de defensa: 02 de febrero de 2023

Tribunal:
  1. Purificación Vicente Galindo Presidenta
  2. Eugenia María Dores Maia Ferreira Secretario/a
  3. David Almorza Gomar Vocal
Departamento:
  1. ESTADÍSTICA

Tipo: Tesis

Teseo: 790213 DIALNET lock_openTESEO editor

Resumen

El presente trabajo se centra principalmente en el análisis de bases de datos binarios donde los métodos estadísticos clásicos para datos continuos no son óptimos. Con el objetivo de avanzar en el desarrollo y propuesta de métodos multivariantes y de minería de datos que permitan trabajar con matrices de datos categóricos en general y binarios en particular, especialmente cuando se dispone de dos o más matrices de datos, se proponen los siguientes métodos: Se realiza una revisión de dos métodos no paramétricos alternativos a la Regresión Lineal Multivariante tradicional, el PERMANOVA y el BOOTMANOVA, asociando a ellos la representación gráfica denominada Análisis de Coordenadas Principales sobre los centroides a la que añadiremos regiones de confianza empleando el Análisis Canónico Bootstrap. Se propone el Análisis de la Redundancia para datos binarios (BRDA) como generalización del Análisis de la Redundancia para datos continuos (RDA) y su representación biplot asociada. Se generaliza el algoritmo NIPALS y la Regresión PLS para datos binarios proponiendo la Regresión Logística Binaria de Mínimos Cuadrados Parciales y su representación biplot o triplot asociada. Cuando nuestra base de datos está formada por más de dos matrices binarias en las que se miden las mismas variables en diferentes individuos se propone el STATIS tetracórico Dual como generalización del STATIS Dual realizado en el caso continuo. Igual que en las técnicas anteriores se han realizado las representaciones biplot asociadas. Para todas ellas se han elaborado funciones en R, incluidas en los paquetes propios PERMANOVA y MultBiplotR alojados en el repositorio CRAN, para realizar todos los análisis tras una revisión previa de los software que permitían realizar dichos análisis.