Les réseaux bayésiens, application à la Bioinformatique

Badih Ghattas
Laboratoire : IML
Contact : Badih Ghattas : ghattas@iml.univ-mrs.fr
Objectif du stage :
Les réseaux bayésiens (RB) constituent un outil puissant pour la modélisation les dépendances entre différentes
variables observées dans un système. Il s’agit de techniques à cheval sur la théorie des graphes et celle des
probabilités.
Les noeuds du graphe recherché représente les différentes variables d’intérêt. Les arcs caractérisent des dépendances
conditionnelles entre les variables. La construction dun RB nécessite l’optimisation dune structure
(celle du graphe) et le calcul de probabilités conditionnelles.
Les RB ont bénéficié dun succès considérable en BioInformatique essentiellement pour la modélisation d’interaction
entre gênes ou entre protéines. Cette modélisation utilise les données d’expression.
La difficulté principale dans ce contexte vient du nombre de noeud constituant le graphe à construire. Des
travaux récents ([1]) ont suggéré des algorithmes permettant l’accélération de la procédure d’optimisation.
Une variante des RB consiste à analyser des données qui évoluent dans le temps, il s’agit des RB dynamiques.
Ce type de modèles est en cours d’étude, les procédures proposées pour leur mise en oeuvre sont trop ´n lourdes
˙z.
Description du travail proposé :
– Etudier les algorithmes d’optimisation des structures des RB quand on dispose dun grand nombre de variables
( quelques milliers de noeuds)
– Proposer une procédure basé sur du ´n Clustering ˙z permettant de réduire le nombre de nSuds utilisés dans le
graphe.
– Appliquer ces techniques à des données réelles fournies par le LGPD (Denis Thieffry)
– Faire l’état des lieux de l’approche dynamique.
Ce mémoire sera réalisé en collaboration avec Denis Thieffry du LGPD.
Bibliographie :
[1] N. Friedman, I. Nachman, D. Peér. Learning of Bayesian Network Structure from Massive Datasets : ´n The
Sparse Candidate ˙z Algorithm.
[2] K. Murphy, S. Mian. Modelling Gene Expression Data using Dynamic Bayesian Networks. (1999)
[3] B.E. Perrin, L. Ralaivola, A. Mazurie, S. Bottani, J. Mallet, F. D’Alché-Buc. Gene Networks inference using
dynamic Bayesian networks. BioInformatics Vol. 19 Suppl. 3 2003, pp. ii138-ii148.
[4] Y. Tamada, S.Y. Kim, H. Bannai, S. Imoto, K. Tashiro, S. Kuhara, S. Miyano. Estimating Gene networks
from gene expression data by combining Bayesian Network model with promoter element detection. BioInformatics,
Vol 19 Suppl. 3 2003 pp. ii227-ii236.
Poursuite en thèse : Ce sujet pourra donner suite à une thèse de doctorat sur le thème réseaux bayésiens et leur
application en BioInformatique.
18 décembre 2003 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s