
Algoritmo K-Means parallelo basato su Hadoop-MapReduce per il data mining
Versandkostenfrei!
Versandfertig in 6-10 Tagen
26,99 €
inkl. MwSt.
PAYBACK Punkte
13 °P sammeln!
Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchi...
Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.