Abstract
[Ita:]La tecnologia per la raccolta di dati genetici si sta sviluppando con grande
rapidit`a generando grandi basi di dati, con particolare riferimento alle osservazioni microarray
riferite all’ “espressione ” di geni. Sorge quindi l’esigenza di sviluppare analisi
statistiche capaci di raccogliere questa sfida, anche se finora queste rimangono spesso confinate
in un ambito descrittivo. Recentemente tuttavia sono stati proposti modelli ispirati
all’impostazione bayesiana che hanno il pregio di fornire una base probabilistica coerente
alle categorie concettuali impiegate (quali raggruppamento, profilo molecolare etc), oltre
a consentire stime pi`u efficienti, grazie al cosiddetto effetto di borrowing strength. In
particolare sono stati proposti modelli gerarchici bayesiani nei quali le osservazioni sono
generate da una distribuzione mistura a tre componenti (a seconda che il gene sia sottoespresso,
normalmente espresso e sovraespresso); le distribuzioni iniziali dei parametri
sono invece basate sull’ipotesi tradizionale di scambiabilit`a. In questo lavoro proponiamo
un modello gerarchico nel quale i parametri che rappresentano le probabilit`a che i
geni provengano dalla componente sotto- o sovraespressa non sono pi`u contraddistinti
dall’ipotesi di scambiabilit`a, ma piuttosto da una distribuzione mistura con un numero
aleatorio di componenti. In questo modo il modello consente di cogliere la presenza di
aspetti di eterogeneit`a conducendo di conseguenza ad un modello bayesiano di clustering
sia per quanto attiene ai geni che alle unit`a. Il modello viene applicato ad un insieme di
dati simulati e ad uno di osservazioni reali.
Lingua originale | English |
---|---|
Titolo della pubblicazione ospite | Atti della XLII Riunione Scientifica della Società Italiana di Statistica |
Pagine | 187-198 |
Numero di pagine | 12 |
Volume | Sessioni plenarie e specializz |
Stato di pubblicazione | Pubblicato - 2004 |
Evento | Riunione Scientifica della Società Italiana di Statistica - Bari Durata: 9 giu 2004 → 11 giu 2004 |
Convegno
Convegno | Riunione Scientifica della Società Italiana di Statistica |
---|---|
Città | Bari |
Periodo | 9/6/04 → 11/6/04 |
Keywords
- Bayesian clustering
- Microarray data