
Melhorar os algoritmos de ML para conjuntos de dados desequilibrados
Atenuar a distorção de dados desequilibrados
Versandkostenfrei!
Versandfertig in 6-10 Tagen
32,99 €
inkl. MwSt.
PAYBACK Punkte
16 °P sammeln!
A grande quantidade de dados gerados em linha permitiu que os cientistas de dados analisassem esta informação e tirassem conclusões em vários domínios. No entanto, os dados em tempo real são muitas vezes propensos a desequilíbrios, o que pode degradar a qualidade dos dados e constitui um desafio significativo no domínio da aprendizagem automática. As técnicas baseadas em amostragem e os modelos baseados em algoritmos são dois métodos principais utilizados para resolver e equilibrar o desequilíbrio dos dados. Esta tese apresenta três técnicas distintas para gerir diferentes níve...
A grande quantidade de dados gerados em linha permitiu que os cientistas de dados analisassem esta informação e tirassem conclusões em vários domínios. No entanto, os dados em tempo real são muitas vezes propensos a desequilíbrios, o que pode degradar a qualidade dos dados e constitui um desafio significativo no domínio da aprendizagem automática. As técnicas baseadas em amostragem e os modelos baseados em algoritmos são dois métodos principais utilizados para resolver e equilibrar o desequilíbrio dos dados. Esta tese apresenta três técnicas distintas para gerir diferentes níveis de desequilíbrio em dados em tempo real.A abordagem inicial propõe uma técnica baseada em amostragem integrada com o mecanismo de ensacamento para tratar o desequilíbrio dos dados. O modelo identifica o desequilíbrio de dados baseado em classes e efectua uma sobreamostragem para cada classe disponível. O mecanismo de ensacamento envolve a criação de subconjuntos dos dados de treino, com o objetivo de variar os níveis de desequilíbrio nos dados de treino para garantir uma previsão eficaz. Apesar disso, o efeito do desequilíbrio persiste no mecanismo de previsão, levando à classificação incorrecta de várias classes minoritárias.