Il presente studio riguarda il problema della scelta di un modello di regressione non lineare che si presenta nel data mining quando la funzione che lega una variabile dipendente ad un pluralità di variabili esplicative non è nota ma deve essere desunta dai dati. Viene mostrato come, in presenza di multicollinearità, la scelta del modello non possa essere basata unicamente sull’errore quadratico od indici ad esso collegati (ad esempio, AIC, BIC/SBC), in quanto alcuni modelli che utilizzano l’algoritmo di backfitting sono soggetti a grande instabilità ed arbitrarietà nella scelta delle funzioni di base. Il comportamento dei più noti metodi non lineari basati sia sulla subset selection sia sulla proiezione delle variabili, in presenta di multicollinearità, viene illustrato attraverso un esempio numerico.
Facing multicollinearity in data mining / Morlini, Isabella. - STAMPA. - (2002), pp. 55-58. (Intervento presentato al convegno XLI Convegno della Società Italiana di Statistica tenutosi a Milano nel 5-7 Giugno 2002).
Facing multicollinearity in data mining
MORLINI, Isabella
2002
Abstract
Il presente studio riguarda il problema della scelta di un modello di regressione non lineare che si presenta nel data mining quando la funzione che lega una variabile dipendente ad un pluralità di variabili esplicative non è nota ma deve essere desunta dai dati. Viene mostrato come, in presenza di multicollinearità, la scelta del modello non possa essere basata unicamente sull’errore quadratico od indici ad esso collegati (ad esempio, AIC, BIC/SBC), in quanto alcuni modelli che utilizzano l’algoritmo di backfitting sono soggetti a grande instabilità ed arbitrarietà nella scelta delle funzioni di base. Il comportamento dei più noti metodi non lineari basati sia sulla subset selection sia sulla proiezione delle variabili, in presenta di multicollinearità, viene illustrato attraverso un esempio numerico.Pubblicazioni consigliate
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris