
Analisi della classificazione per dati sbilanciati
Versandkostenfrei!
Versandfertig in 6-10 Tagen
23,99 €
inkl. MwSt.
PAYBACK Punkte
12 °P sammeln!
Un'enorme quantità di dati viene raccolta e archiviata nei database di tutto il mondo. Questi dati si accumulano e continuano ad aumentare ogni anno. Estrarre le informazioni nascoste in questi database e classificare le informazioni estratte sono i compiti più importanti del data mining. Se questi insiemi di dati sono sbilanciati, diventa difficile gestirli. La previsione del futuro è uno dei compiti fondamentali del data mining. Lavorare con insiemi di dati sbilanciati per prevedere i possibili risultati è un compito molto noioso. Un set di dati è sbilanciato quando non viene classifica...
Un'enorme quantità di dati viene raccolta e archiviata nei database di tutto il mondo. Questi dati si accumulano e continuano ad aumentare ogni anno. Estrarre le informazioni nascoste in questi database e classificare le informazioni estratte sono i compiti più importanti del data mining. Se questi insiemi di dati sono sbilanciati, diventa difficile gestirli. La previsione del futuro è uno dei compiti fondamentali del data mining. Lavorare con insiemi di dati sbilanciati per prevedere i possibili risultati è un compito molto noioso. Un set di dati è sbilanciato quando non viene classificato correttamente, quando una classe contiene più istanze di altre. Spesso vengono rappresentate come una classe positiva (minoranza) e una negativa (maggioranza). La classe che ha un numero minore di campioni è chiamata classe minoritaria, mentre quella che ne ha di più è chiamata classe maggioritaria. I dataset sbilanciati causano molti problemi seri nel data mining, per lo più l'algoritmo di classificazione standard considera il dataset come bilanciato, che a sua volta è parziale verso la classe maggioritaria. Per applicazioni come la diagnosi medica, ciò provoca effetti molto gravi. Il bilanciamento del set di dati è quindi fondamentale per molte applicazioni in tempo reale.