"Extracción de contenido independiente del idioma de las páginas web"

Versandkostenfrei!
Versandfertig in 1-2 Wochen
27,99 €
inkl. MwSt.
PAYBACK Punkte
14 °P sammeln!
El rápido desarrollo de Internet y las técnicas de publicación en la web crean numerosas fuentes de información publicadas como páginas HTML en la World Wide Web. Sin embargo, también hay mucha información redundante e irrelevante en las páginas web. Los paneles de navegación, la tabla de contenidos (TOC), los anuncios, las declaraciones de derechos de autor, los catálogos de servicios, las políticas de privacidad, etc. de las páginas web se consideran contenidos relevantes e irrelevantes. Esta información hace que varias tareas de minería web, como el rastreo de páginas web, la...