This work concerns the processing of a corpus made up of a financial weekly column. Specifically, we focused on document-level index extraction and textual feature extraction. Moreover, some feature extraction methods had been compared to evaluate their predictive capacity. Results confirm the hypothesis that vectors derived from word embedding do not improve the predictive power compared to other feature extraction methods but remain a fundamental resource for capturing semantics in texts.
Questo contributo riguarda il trattamento di un corpus costituito da una rubrica finanziaria settimanale. In particolare, ci siamo concentrati sull'estrazione di indici a livello di documento e sull'estrazione di variabili testuali. Inoltre, abbiamo confrontato alcuni metodi di estrazione delle variabili per valutare la loro capacità predittiva. I risultati confermano l'ipotesi che i vettori derivati dal word embedding non migliorano la capacità predittiva rispetto ad altri metodi di estrazione delle variabili, ma restano una risorsa fondamentale per cogliere la semantica nei testi.
Predictive performance comparisons of different feature extraction methods in a financial column corpus / Sciandra, Andrea; Ferretti, Riccardo. - (2022), pp. 421-427. (Intervento presentato al convegno 51st Scientific Meeting of the Italian Statistical Society (SIS 2022) tenutosi a Caserta (Italy) nel June 22-24, 2022).
Predictive performance comparisons of different feature extraction methods in a financial column corpus
Andrea Sciandra;Riccardo Ferretti
2022
Abstract
This work concerns the processing of a corpus made up of a financial weekly column. Specifically, we focused on document-level index extraction and textual feature extraction. Moreover, some feature extraction methods had been compared to evaluate their predictive capacity. Results confirm the hypothesis that vectors derived from word embedding do not improve the predictive power compared to other feature extraction methods but remain a fundamental resource for capturing semantics in texts.File | Dimensione | Formato | |
---|---|---|---|
Sciandra_Ferretti_Predictive-performance-comparisons_rev1.pdf
Open access
Tipologia:
Versione pubblicata dall'editore
Dimensione
223.13 kB
Formato
Adobe PDF
|
223.13 kB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris