Déduplication efficace des données dans Hadoop

Déduplication efficace des données dans Hadoop

Versandkostenfrei!
Versandfertig in 6-10 Tagen
26,99 €
inkl. MwSt.
PAYBACK Punkte
13 °P sammeln!
Hadoop est largement utilisé pour le stockage massif de données distribuées. Même s'il est hautement tolérant aux pannes, évolutif et fonctionne sur du matériel standard, il ne fournit pas de solution de stockage de données efficace et optimisée. Lorsque l'utilisateur télécharge des fichiers avec le même contenu dans Hadoop, celui-ci stocke tous les fichiers dans HDFS (Hadoop Distributed File System), même si le contenu est identique, ce qui entraîne une duplication du contenu et donc un gaspillage d'espace de stockage. La déduplication des données est un processus qui permet d...