Extending Word Net with compound nouns for semi-automatic annotation in data integration systems

Beneventano, Domenico; Bergamaschi, Sonia; Sorrentino, Serena

doi:10.1109/NLPKE.2009.5313842

The focus of data integration systems is on producing a comprehensive global schema successfully integrating data from heterogeneous data sources (heterogeneous in format and in structure). Starting from the “meanings” associated to schema elements (i.e. class/attribute labels) and exploiting the structural knowledge of sources, it is possible to discover relationships among the elements of different schemata. Lexical annotation is the explicit inclusion of the “meaning” of a data source element according to a lexical resource. Accuracy of semi-automatic lexical annotatortools is poor on real-world schemata due to the abundance of non-dictionary compound nouns. It follows that a large set of relationships among different schemata is discovered, including a great amount of false positive relationships. In this paper we propose a new method for the annotation ofnon-dictionary compound nouns, which draws its inspiration from works in the natural languagedisambiguation area. The method extends the lexical annotation module of the MOMIS data integration system.

Extending Word Net with compound nouns for semi-automatic annotation in data integration systems / Beneventano, D., Bergamaschi, S., Sorrentino, S.. - STAMPA. - (2009), pp. 1-8. (2009 International Conference on Natural Language Processing and Knowledge Engineering, NLP-KE 2009 Dalian , China 24-27 September 2009) [10.1109/NLPKE.2009.5313842].

Extending Word Net with compound nouns for semi-automatic annotation in data integration systems

BENEVENTANO, Domenico;BERGAMASCHI, Sonia;SORRENTINO, Serena

2009

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno di pubblicazione
	
				2009
			
	Titolo del Convegno
	
				2009 International Conference on Natural Language Processing and Knowledge Engineering, NLP-KE 2009
			
	Luogo del Convegno
	
				Dalian , China
			
	Data del Convegno
	
				24-27 September 2009
			
	Codice DOI
	
				https://dx.doi.org/10.1109/NLPKE.2009.5313842
			
	Codice WoS
	
				WOS:000291373000001
			
	Codice Scopus
	
				2-s2.0-72249122528
			
	Pagina iniziale
	
				1
			
	Pagina finale
	
				8
			
	Tutti gli autori
	
						Beneventano, Domenico; Bergamaschi, Sonia; Sorrentino, Serena
					
	Citazione
	
				Extending Word Net with compound nouns for semi-automatic annotation in data integration systems / Beneventano, D., Bergamaschi, S., Sorrentino, S.. - STAMPA. - (2009), pp. 1-8. (2009 International Conference on Natural Language Processing and Knowledge Engineering, NLP-KE 2009 Dalian , China 24-27 September 2009) [10.1109/NLPKE.2009.5313842].
			
	Tipologia
	
				Relazione in Atti di Convegno

File in questo prodotto:

File	Dimensione	Formato
Extending_WordNet_with_compound_nouns_for_semi-automatic_annotation_in_data_integration_systems.pdf Accesso riservato Tipologia: VOR - Versione pubblicata dall'editore Dimensione 499.94 kB Formato Adobe PDF Visualizza/Apri Richiedi una copia	499.94 kB	Adobe PDF	Visualizza/Apri Richiedi una copia

Pubblicazioni consigliate

I metadati presenti in IRIS UNIMORE sono rilasciati con licenza Creative Commons CC0 1.0 Universal, mentre i file delle pubblicazioni sono rilasciati con licenza Attribuzione 4.0 Internazionale (CC BY 4.0), salvo diversa indicazione.
In caso di violazione di copyright, contattare Supporto Iris