Il presente studio riguarda il problema della scelta di un modello di regressione non lineare che si presenta nel data mining quando la funzione che lega una variabile dipendente ad un pluralità di variabili esplicative non è nota ma deve essere desunta dai dati. Viene mostrato come, in presenza di multicollinearità, la scelta del modello non possa essere basata unicamente sull’errore quadratico od indici ad esso collegati (ad esempio, AIC, BIC/SBC), in quanto alcuni modelli che utilizzano l’algoritmo di backfitting sono soggetti a grande instabilità ed arbitrarietà nella scelta delle funzioni di base. Il comportamento dei più noti metodi non lineari basati sia sulla subset selection sia sulla proiezione delle variabili, in presenta di multicollinearità, viene illustrato attraverso un esempio numerico.

Facing multicollinearity in data mining / Morlini, Isabella. - STAMPA. - (2002), pp. 55-58. (Intervento presentato al convegno XLI Convegno della Società Italiana di Statistica tenutosi a Milano nel 5-7 Giugno 2002).

Facing multicollinearity in data mining

MORLINI, Isabella
2002

Abstract

Il presente studio riguarda il problema della scelta di un modello di regressione non lineare che si presenta nel data mining quando la funzione che lega una variabile dipendente ad un pluralità di variabili esplicative non è nota ma deve essere desunta dai dati. Viene mostrato come, in presenza di multicollinearità, la scelta del modello non possa essere basata unicamente sull’errore quadratico od indici ad esso collegati (ad esempio, AIC, BIC/SBC), in quanto alcuni modelli che utilizzano l’algoritmo di backfitting sono soggetti a grande instabilità ed arbitrarietà nella scelta delle funzioni di base. Il comportamento dei più noti metodi non lineari basati sia sulla subset selection sia sulla proiezione delle variabili, in presenta di multicollinearità, viene illustrato attraverso un esempio numerico.
2002
XLI Convegno della Società Italiana di Statistica
Milano
5-7 Giugno 2002
55
58
Morlini, Isabella
Facing multicollinearity in data mining / Morlini, Isabella. - STAMPA. - (2002), pp. 55-58. (Intervento presentato al convegno XLI Convegno della Società Italiana di Statistica tenutosi a Milano nel 5-7 Giugno 2002).
File in questo prodotto:
Non ci sono file associati a questo prodotto.
Pubblicazioni consigliate

Licenza Creative Commons
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/465829
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact