A incidência de web spam nos sistemas de recuperação de informação

  1. COSTA CARVALHO, ARMANDO CARLOS
unter der Leitung von:
  1. José Luis Alonso Berrocal Doktorvater

Universität der Verteidigung: Universidad de Salamanca

Fecha de defensa: 04 von Mai von 2010

Gericht:
  1. Luis Carlos García de Figuerola Paniagua Präsident
  2. Marcelino Zazo Rodríguez Sekretär
  3. Maria Montserrat Sebastia Salat Vocal
  4. Montserrat Mateos Sánchez Vocal
  5. Francisco Javier García Marco Vocal
Fachbereiche:
  1. INFORMÁTICA Y AUTOMÁTICA

Art: Dissertation

Teseo: 306087 DIALNET

Zusammenfassung

El trabajo, encuadrado dentro de las tecnologías de Recuperación de Información (RI) en ambiente WEB, se centra en el estudio particular de las dificultades causadas por sofisticadas introducciones de SPAM, deteriorando los resultados de las búsquedas efectuadas por los motores de búsqueda, y se encuentra dividido en 6 capítulos organizados de la siguiente forma: 1. En el primer capítulo se aborda el concepto de la RI general y en contexto web; se presentan algunos conceptos de búsqueda y de motores de búsqueda. 2. En el segundo capítulo se presenta el Web Spam, a nivel de definición, propiedades y evolución histórica de los motores de búsqueda y de algunos algoritmos de ranking; evolución de motores de búsqueda y la identificación de sus propiedades fundamentales. 3. En el tercer capítulo mencionamos estrategias con el objetivo de mejorar la visibilidad de los sites. Dedicamos algún estudio a los SEO - Search Engines Optimization. 4. En el cuarto capítulo dedicamos especial atención a los principales tipos de Web Spam conocidos y a las formas desarrolladas en investigación para combatirlos. 5. En el quinto capítulo se abordan estudios prácticos de clasificación de sites, en el sentido de colaborar con la validación de modelos matemáticos. Presentamos un caso de estudio relacionado con la forma en cómo los seres humanos pueden verse influenciados por sus vecinos (sociedad física o sociedad digital) en la forma en cómo clasifican o evolucionan su clasificación binaria y las dificultades que puede provocar la clasificación de 'borderline'. 6. En el sexto capítulo se presentan las principales conclusiones del trabajo desarrollado y las posibles líneas futuras de investigación que se abren a partir de este trabajo