Mineração de Dados e Dados Faltantes

Grande parte dos modelos de predição usados em mineração de dados, entre eles regressão linear múltipla, regressão logística e redes neurais, pressupõe que todos os valores das informações das variáveis associadas a cada observação são conhecidos e foram corretamente anotados. Entretanto, a perda ou o não registro de parte das informações é uma situação freqüente que ocorre em diversas áreas do conhecimento, tais como finanças, saúde, e ciências sociais.
(mais…)