Clustering the Corpus of Seneca. A Lexical-Based Approach

Gabriele Cantaluppi, Marco Carlo Passarotti, 27260, DI ECONOMIA FACOLTA', MILANO - Dipartimento di Scienze linguistiche e letterature straniere, 27494, DI SCIENZE LINGUISTICHE E LETTERATURE STRANIERE FACOLTA', MILANO - Dipartimento di Scienze statistiche, DI ECONOMIA FACOLTA', DI SCIENZE LINGUISTICHE E LETTERATURE STRANIERE FACOLTA'

Risultato della ricerca: Contributo in libroChapter

Abstract

We provide an in-depth investigation into the corpus of the opera omnia of Seneca, by applying a number of statistical techniques to textual data. The corpus comprises 23 works plus two tragedies of disputed attribution. The size of the corpus is approximately 364,000 words. Comparison with the corpus of the orationes of Cicero, with the Latin New Testament by Jerome (Vulgata) and with the opera maiora of Thomas Aquinas is provided as well.
Lingua originaleEnglish
Titolo della pubblicazione ospiteAdvances in Latent Variables
EditorEugenio Brentari, Maurizio Carpita
Pagine1-6
Numero di pagine6
Stato di pubblicazionePubblicato - 2013

Keywords

  • Latin
  • hierarchical clustering

Fingerprint

Entra nei temi di ricerca di 'Clustering the Corpus of Seneca. A Lexical-Based Approach'. Insieme formano una fingerprint unica.

Cita questo