Estrazione dei dati del web profondo basata sulla visione per il raggruppamento dei documenti web
M. Lavanya
Broschiertes Buch

Estrazione dei dati del web profondo basata sulla visione per il raggruppamento dei documenti web

Questo lavoro propone un approccio all'estrazione di dati web profondi basato sulla visione per il clustering dei documenti web (VDEC)

Versandkostenfrei!
Versandfertig in 6-10 Tagen
51,99 €
inkl. MwSt.
PAYBACK Punkte
26 °P sammeln!
L'approccio VDEC comprende due fasi: 1) estrazione dei dati web basata sulla visione e 2) raggruppamento dei documenti web. Nella fase 1, le informazioni della pagina Web vengono segmentate in vari chunk, dai quali vengono rimossi il rumore in eccesso e i chunk duplicati utilizzando tre parametri, quali la percentuale di collegamenti ipertestuali, il punteggio del rumore e la somiglianza del coseno. Per identificare i chunk rilevanti, vengono utilizzati tre parametri, quali la rilevanza del titolo, la selezione dei chunk basata sulla frequenza delle parole chiave e le caratteristiche della pos...