L'estrazione e l'analisi dei dati hanno recentemente ricevuto un'attenzione significativa a causa dell'evoluzione dei social media e del grande volume di dati disponibili in forma non strutturata. Hadoop e Map-Reduce sono stati continuamente implementati per analizzare grandi quantità di dati. In questo libro Apache Pig, che è una piattaforma di alto livello per l'analisi di grandi volumi di dati e viene eseguito su Hadoop, viene utilizzato per analizzare i file di log non strutturati ed estrarre informazioni. In questo libro, i file del server weblog vengono utilizzati per analizzare ed estrarre informazioni significative in forma non strutturata in forma strutturata nel framework Apache Pig. Misureremo l'efficienza e le prestazioni quando un grande volume di dati viene elaborato in modalità Map-Reduce e in modalità locale.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno