Abstract

We present a lexical-based investigation into the corpus of the opera omnia of Seneca. By applying a number of statistical techniques to textual data we aim to automatically collect similar texts into closely related groups. We demonstrate that our objective and unsupervised method is able to distinguish the texts by work and genre.
Lingua originaleEnglish
Titolo della pubblicazione ospiteAdvances in Latent Variables. Methods, Models and Applications
EditorMaurizio Carpita, Eugenio Brentari, El Mostafa Qannari
Pagine13-25
Numero di pagine13
DOI
Stato di pubblicazionePubblicato - 2014

Serie di pubblicazioni

NomeSTUDIES IN THEORETICAL AND APPLIED STATISTICS

Keywords

  • Clustering
  • Latin

Cita questo