A incidência de web spam nos sistemas de recuperação de informação

  1. COSTA CARVALHO, ARMANDO CARLOS
Dirigida por:
  1. José Luis Alonso Berrocal Director

Universidad de defensa: Universidad de Salamanca

Fecha de defensa: 04 de mayo de 2010

Tribunal:
  1. Luis Carlos García de Figuerola Paniagua Presidente
  2. Marcelino Zazo Rodríguez Secretario
  3. Maria Montserrat Sebastia Salat Vocal
  4. Montserrat Mateos Sánchez Vocal
  5. Francisco Javier García Marco Vocal
Departamento:
  1. INFORMÁTICA Y AUTOMÁTICA

Tipo: Tesis

Teseo: 306087 DIALNET

Resumen

El trabajo, encuadrado dentro de las tecnologías de Recuperación de Información (RI) en ambiente WEB, se centra en el estudio particular de las dificultades causadas por sofisticadas introducciones de SPAM, deteriorando los resultados de las búsquedas efectuadas por los motores de búsqueda, y se encuentra dividido en 6 capítulos organizados de la siguiente forma: 1. En el primer capítulo se aborda el concepto de la RI general y en contexto web; se presentan algunos conceptos de búsqueda y de motores de búsqueda. 2. En el segundo capítulo se presenta el Web Spam, a nivel de definición, propiedades y evolución histórica de los motores de búsqueda y de algunos algoritmos de ranking; evolución de motores de búsqueda y la identificación de sus propiedades fundamentales. 3. En el tercer capítulo mencionamos estrategias con el objetivo de mejorar la visibilidad de los sites. Dedicamos algún estudio a los SEO - Search Engines Optimization. 4. En el cuarto capítulo dedicamos especial atención a los principales tipos de Web Spam conocidos y a las formas desarrolladas en investigación para combatirlos. 5. En el quinto capítulo se abordan estudios prácticos de clasificación de sites, en el sentido de colaborar con la validación de modelos matemáticos. Presentamos un caso de estudio relacionado con la forma en cómo los seres humanos pueden verse influenciados por sus vecinos (sociedad física o sociedad digital) en la forma en cómo clasifican o evolucionan su clasificación binaria y las dificultades que puede provocar la clasificación de 'borderline'. 6. En el sexto capítulo se presentan las principales conclusiones del trabajo desarrollado y las posibles líneas futuras de investigación que se abren a partir de este trabajo