Avatar virtual realista con capacidad perceptiva orientado a la robótica social

  1. Marcos Pablos, Samuel
Supervised by:
  1. Eduardo Zalama Casanova Director
  2. Jaime Gómez García-Bermejo Co-director

Defence university: Universidad de Valladolid

Fecha de defensa: 21 June 2011

Committee:
  1. José Ramón Perán González Chair
  2. Juan Carlos Fraile Marinero Secretary
  3. Jose María Sebastián y Zúñiga Committee member
  4. Miguel Ángel Salichs Sánchez-Caballero Committee member
  5. Fernando Matía Espada Committee member

Type: Thesis

Teseo: 310734 DIALNET

Abstract

El presente trabajo de tesis se enmarca en el ámbito de la interacción hombre-máquina y, dentro de ésta, en el campo de la Robótica Social y de Servicio. El principal objetivo es la investigación de nuevas formas de interacción hombre-máquina que incluyan modos, estilos y canales de comunicación propios de la comunicación humana de forma que se facilite la aceptación de este tipo de dispositivos por parte de los usuarios. A tal fin, se aportan soluciones en ambos sentidos de la comunicación: desde la máquina al hombre, mediante el desarrollo de un avatar virtual realista capaz de generar expresiones faciales y desde el hombre a la máquina, por medio de un sistema de reconocimiento automático de expresiones emocionales. Hasta hace poco, robots y avatares virtuales destinados a la interacción con personas han sido considerados como elementos diferenciados y con su propio campo de estudio correspondiente. Actualmente, sin embargo, robots y avatares se consideran instancias de la misma noción de agente (una entidad autónoma capaz de mostrar un comportamiento reactivo y proactivo con el entorno que le rodea). Partiendo de esta idea, la primera parte de la tesis describe la construcción de un rostro virtual capaz de generar expresiones emocionales que pueda servir de complemento a una arquitectura robótica destinada a la interacción con personas. La propuesta que se presenta busca la convergencia entre técnicas propias de la animación de personajes, métodos empleados en construcciones robóticas y fundamentos de la anatomía y fisionomía humanas. La combinación de técnicas específicas de animación y robótica facilita la integración del avatar en una arquitectura social inicialmente pensada para construcciones robóticas. Por otro lado, los fundamentos anatómicos en los que se asienta el avatar permiten que su expresividad se desarrolle siguiendo patrones específicos de la generación de expresiones del rostro humano. En concreto, se parte de Sistema de Codificación de Acciones Faciales (Facial Action Coding System, FACS), que es un sistema destinado a estudios psicológicos de la expresividad humana. Siguiendo los patrones de movimiento facial descritos en el FACS, el avatar realiza expresiones partiendo de movimientos específicos de las diferentes regiones del rostro que son luego combinadas para dar lugar a expresiones complejas de emoción. El estudio de la expresividad humana sirve también de base en el desarrollo de un sistema de reconocimiento automático de expresiones emocionales empleando técnicas de visión por ordenador. El segundo gran bloque de la tesis describe la metodología empleada para detectar las seis expresiones básicas de emoción (alegría, tristeza, miedo, disgusto, enfado y sorpresa) a partir del análisis de imágenes capturadas mediante una cámara convencional. Empleando un procedimiento similar al utilizado para la generación de expresiones, se propone un método de reconocimiento que combina modelos estadísticos de forma y técnicas de filtrado en frecuencia. Dicha metodología permite identificar y categorizar un conjunto de características faciales permanentes (como los ojos, las cejas o la boca) junto con otras de naturaleza transitoria (como las arrugas faciales). El sistema propuesto analiza las variaciones en dichas características faciales y combina los resultados obtenidos para identificar la expresión emocional que el usuario esté mostrando en cada momento. En el último bloque de la tesis se describe la integración de las diferentes propuestas en una arquitectura social genérica, arquitectura que comparten varias construcciones robóticas desarrolladas por nuestra división. Dicha integración permite realizar un estudio comparativo de las bondades del avatar frente a una cabeza robótica equivalente cuando ambas se enfrentan a usuarios en condiciones reales de operación. Los resultados obtenidos muestran una buena aceptación del avatar por parte de los usuarios, y permiten identificar una serie de ventajas e inconvenientes que presentan los avatares virtuales frente a construcciones robóticas las cuales pueden ser tenidas en cuenta para el desarrollo de futuros interfaces destinados a la interacción social.