Negli ultimi anni l’impatto dei big data sulla capacità di prevedere vari fenomeni e sulla conoscenza in generale è stato tale che si è dibattuto sulla possibile “fine della teoria”. La disponibilità di dataset relazionali su larga scala, spesso generati attraverso contenuti pubblicati direttamente dagli utenti sui Social Networking Sites, offre nuove opportunità e solleva al tempo stesso interrogativi e problematiche metodologiche, che la sociologia e le scienze sociali in generale non possono ignorare. Un saggio delle potenzialità di analisi di dati sociali su larga scala è offerto dai modelli probabilistici per l’individuazione dei topic latenti in un corpus testuale, come la latent Dirichlet allocation, applicabili, per esempio, ai contenuti presenti sul sito di micro-blogging Twitter. A partire da queste premesse, il presente contributo illustra una proposta di inquadramento metodologico del topic modeling all’interno di disegni di ricerca basati sui mixed methods, che combinano metodi e tecniche quantitative e qualitative. In particolare, questo lavoro mostra una possibile integrazione di metodi qualitativi in un disegno di ricerca fondato su analisi e algoritmi derivanti da un approccio tipicamente quantitativo. Pur sottolineando i limiti conoscitivi insiti in queste tecniche di analisi, la loro ricaduta sulla ricerca sociale è rilevante e la strada intrapresa non può che favorire una maggiore collaborazione interdisciplinare.
Big data nelle scienze sociali: una proposta di integrazione del topic modeling nei disegni di ricerca con mixed methods / Sciandra, A. - (2015), pp. 187-200.
Big data nelle scienze sociali: una proposta di integrazione del topic modeling nei disegni di ricerca con mixed methods
Sciandra A
2015
Abstract
Negli ultimi anni l’impatto dei big data sulla capacità di prevedere vari fenomeni e sulla conoscenza in generale è stato tale che si è dibattuto sulla possibile “fine della teoria”. La disponibilità di dataset relazionali su larga scala, spesso generati attraverso contenuti pubblicati direttamente dagli utenti sui Social Networking Sites, offre nuove opportunità e solleva al tempo stesso interrogativi e problematiche metodologiche, che la sociologia e le scienze sociali in generale non possono ignorare. Un saggio delle potenzialità di analisi di dati sociali su larga scala è offerto dai modelli probabilistici per l’individuazione dei topic latenti in un corpus testuale, come la latent Dirichlet allocation, applicabili, per esempio, ai contenuti presenti sul sito di micro-blogging Twitter. A partire da queste premesse, il presente contributo illustra una proposta di inquadramento metodologico del topic modeling all’interno di disegni di ricerca basati sui mixed methods, che combinano metodi e tecniche quantitative e qualitative. In particolare, questo lavoro mostra una possibile integrazione di metodi qualitativi in un disegno di ricerca fondato su analisi e algoritmi derivanti da un approccio tipicamente quantitativo. Pur sottolineando i limiti conoscitivi insiti in queste tecniche di analisi, la loro ricaduta sulla ricerca sociale è rilevante e la strada intrapresa non può che favorire una maggiore collaborazione interdisciplinare.Pubblicazioni consigliate
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris