Annotazione di contenuti concettuali in un corpus italiano: I-CAB

Translated title of the contribution: [Autom. eng. transl.] Annotation of conceptual contents in an Italian corpus: I-CAB

Rachele Sprugnoli, Bernardo Magnini, A. Cappelli, Emanuele Pianta, Manuela Speranza, V. Bartalesi, Lorenza Romano, Christian Girardi, Matteo Negri

Research output: Chapter in Book/Report/Conference proceedingConference contribution

Abstract

In questo articolo presentiamo I-CAB (Italian Content Annotation Bank), un corpus di articoli in lingua italiana annotato semanticamente. L’attività di annotazione, realizzata in modo completamente manuale, prevede tre livelli: le espressioni temporali, le entità (cioè persone, organizzazioni, luoghi ed entità geo-politiche) e le relazioni tra entità (per esempio la relazione di affiliazione che collega una persona a un’organizzazione). I primi due livelli di annotazione sono completi, mentre il terzo livello è in fase di realizzazione. Avendo come scopo quello di fare di I-CAB un corpus di riferimento per diversi task di Estrazione automatica di Informazione, abbiamo seguito una politica di riutilizzo di linguaggi di annotazione già disponibili. In particolare, abbiamo adottato gli schemi di annotazione sviluppati per il task ACE Entity Detection and Recognition e per il task Time Expression Recognition and Normalization. Poiché le linee-guida di questi task sono state sviluppate originariamente per l’inglese, è stato necessario adattarle alle caratteristiche morfo-sintattiche dell’italiano; si è deciso inoltre di estenderle in modo tale da includere un insieme più ampio di entità, come ad esempio le congiunzioni.
Translated title of the contribution[Autom. eng. transl.] Annotation of conceptual contents in an Italian corpus: I-CAB
Original languageItalian
Title of host publicationIX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006)
Pages321-328
Number of pages8
Publication statusPublished - 2006
EventIX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006) - Firenze, Italy
Duration: 14 Jun 200617 Jun 2006

Conference

ConferenceIX Congresso Internazionale della Società di Linguistica e Filologia Italiana (SILFI 2006)
CityFirenze, Italy
Period14/6/0617/6/06

Keywords

  • Content Processing
  • annotation
  • corpora

Fingerprint

Dive into the research topics of '[Autom. eng. transl.] Annotation of conceptual contents in an Italian corpus: I-CAB'. Together they form a unique fingerprint.

Cite this