This work concerns the processing of a corpus made up of a financial weekly column. Specifically, we focused on document-level index extraction and textual feature extraction. Moreover, some feature extraction methods had been compared to evaluate their predictive capacity. Results confirm the hypothesis that vectors derived from word embedding do not improve the predictive power compared to other feature extraction methods but remain a fundamental resource for capturing semantics in texts.

Questo contributo riguarda il trattamento di un corpus costituito da una rubrica finanziaria settimanale. In particolare, ci siamo concentrati sull'estrazione di indici a livello di documento e sull'estrazione di variabili testuali. Inoltre, abbiamo confrontato alcuni metodi di estrazione delle variabili per valutare la loro capacità predittiva. I risultati confermano l'ipotesi che i vettori derivati dal word embedding non migliorano la capacità predittiva rispetto ad altri metodi di estrazione delle variabili, ma restano una risorsa fondamentale per cogliere la semantica nei testi.

Predictive performance comparisons of different feature extraction methods in a financial column corpus / Sciandra, Andrea; Ferretti, Riccardo. - (2022), pp. 421-427. (Intervento presentato al convegno 51st Scientific Meeting of the Italian Statistical Society (SIS 2022) tenutosi a Caserta (Italy) nel June 22-24, 2022).

Predictive performance comparisons of different feature extraction methods in a financial column corpus

Andrea Sciandra;Riccardo Ferretti
2022

Abstract

This work concerns the processing of a corpus made up of a financial weekly column. Specifically, we focused on document-level index extraction and textual feature extraction. Moreover, some feature extraction methods had been compared to evaluate their predictive capacity. Results confirm the hypothesis that vectors derived from word embedding do not improve the predictive power compared to other feature extraction methods but remain a fundamental resource for capturing semantics in texts.
2022
51st Scientific Meeting of the Italian Statistical Society (SIS 2022)
Caserta (Italy)
June 22-24, 2022
421
427
Sciandra, Andrea; Ferretti, Riccardo
Predictive performance comparisons of different feature extraction methods in a financial column corpus / Sciandra, Andrea; Ferretti, Riccardo. - (2022), pp. 421-427. (Intervento presentato al convegno 51st Scientific Meeting of the Italian Statistical Society (SIS 2022) tenutosi a Caserta (Italy) nel June 22-24, 2022).
File in questo prodotto:
File Dimensione Formato  
Sciandra_Ferretti_Predictive-performance-comparisons_rev1.pdf

Open access

Tipologia: Versione pubblicata dall'editore
Dimensione 223.13 kB
Formato Adobe PDF
223.13 kB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

Licenza Creative Commons
I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11380/1284166
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact