Nguyen Hoai Tuong

Personal blog/notes

Réseaux Bayésiens: DAG, PDAG et CPDAG

C’est un petit résumé de lecture concernant le sujet de l’apprentissage de la structure de réseaux Bayésiens (RB) dans l’espace des classes d’équivalence de Markov.  Il vise aux lecteurs qui sont familiers des méthodes basées sur le score et la recherche.  Les trois mots clés envisagés sont (1) DAG (Directed Acycle Graph: graphe dirigé sans circuit), (2) PDAG (Partially Directed Acycle Graph: graphe partiellement dirigé sans circuit) et (3) CPDAG (Completed Partially Directed Acycle Graph: graphe complété partiellement dirigé sans circuit). Le but de ce résumé est de comprendre la différence entre ces termes. Le point important à retenir est le principe de la classe d’équivalence de Markov.

Comme leur nom déjà indiqué, il s’agit de la même famille de DAG. C’est un groupe de termes bien connus dans l’apprentissage de la structure de réseaux Bayésiens (RB). En général, la différence entre eux est la règle (la restriction) qui détermine l’orientation des arcs de chaque type de graphe:

1) DAG : seulement des arcs dirigés

2) PDAG: arcs non-dirigés et dirigés

3) CPDAG: arcs non-dirigés et dirigés respectant la V-structure  X -> Y <- Z

Le dernier nous intéresse. C’est le concept qui représente la classe d’équivalence de Markov. Elle consiste à définir une graphe unique (aussi connu sous le nom: graphe essentiel) qui représente tous les graphes dit “équivalents“. Deux graphes sont équivalents si seulement s’ils ont même squelette et v-structure (arcs essentiels). Les arcs essentiels sont les arcs que leurs flèches ne pourront pas être inversés.

En effet, étant donné trois variables X, Y, Z. Supposons qu’on a quatre types de relations suivantes:

(a) X -> Y -> Z         Pa(X,Y,Z) = P(X) * P(Y|X) * P(Z|Y) 

(b) X <- Y -> Z         Pb(X,Y,Z) = P(X|Y) * P(Y) * P(Z|Y) 

(c) X <- Y <- Z         Pc(X,Y,Z) = P(X|Y) * P(Y|Z) * P(Z)

(d) X -> Y <- Z         Pd(X,Y,Z) = P(Y|X,Y) * P(X) * P(Y)

D’après la définition d’une probabilité conditionnelle, on a:

 

P(X|Y) * P(Y) = P(Y|X) * P(X)
P(Z|Y) * P(Y) = P(Y|Z)  * P(Z)

donc,

Pa(X,Y,Z) = P(X) * P(Y|X) * P(Z|Y) 

= P(X|Y) * P(Y) * P(Z|Y) = Pb(X,Y,Z)

= P(X|Y) * P(Y|Z)  * P(Z) = Pc(X,Y,Z)

alors (a), (b), (c) sont équivalents. Pourtant, avec Pd(X,Y,Z), c’est P(Y|X,Y) qui ne peut pas se simplifier. Donc, (d) n’est pas équivalent par rapport aux trois autres.

 

Voilà, quelques explications pour mieux comprendre la différence entre DAG, PDAG et CPDAG.

 

Pour conclure, la motivation de la définition de CPDAG et le principe de la classe d’équivalence de Markov est:

(1) la réduction de l’espace de structures possibles:  En effet, il y a plusieurs structures qui représentent les mêmes relations d’indépendance conditionnelle. La classe d’équivalence permet d’optimiser la recherche en évitant des redondances de structure équivalentes. Par contre, puisque le taux de nombre de DAG et de nombre de CPDAG est 0.267, donc l’amélioration en terme d’efficacité de l’algorithme apprentissage de la structure est petite.

(2) la possibilité d’obtenir un optima global de la recherche de meilleures structures:  En effet, il y a plusieurs structures qui ont même score. La classe d’équivalence de ces structures pourrait éventuellement permettre de trouver plus facilement la meilleure structure.

Pourtant, il y a également de désavantages de la classe d’équivalence de Markov :

(1) il faudrait plus d’opérations pour vérifier si la structure représente la classe d’équivalence.

(3) il est possible d’avoir besoin d’une mesure d’évaluation plus compliquée si on ne peut pas utiliser le score équivalent.

(2) l’espace de CPDAG pourrait produire un autre optima local qu’il n’y a pas dans l’espace de DAG.

 

Ce résumé s’arrête ici. Le prochain sera l’algorithme pour la recherche dans l’espace CPDAG.

 

Je vous souhaite bon vent pour la suite et à très bientôt!

Tutu

 

 

 

June 2, 2010 Posted by | Bioinformatics, Dissertation, Français, Informatics | Leave a Comment

Cytokie và cơ bão Cytokine

BsCk2, Ths Phan Quận, biên tập từ Wikipedia, the free encyclopedia

Lời biên tập
Trong thời gian gần đây cúm gà tái xuất hiện ở ta và nhiều nước trên thế gới, để có thêm sự hiểu biết tại sao bệnh cúm ở người do H5N1 gây ra bệnh cảnh lâm sàng nặng trong khi các thể cúm mùa thông thường thì nhẹ hơn ở những người không mắc các bệnh mãn tính trước. Đoạn y văn sau giải thích điều đó, xin giới thiệu cùng các bạn

CYTOKINE
Cytokine là một nhóm các protein và peptide, được các cơ quan tổ chức cơ thể sử dụng như những hổn hợp các tín hiệu. Các tín hiệu hoá học này tương tự như các hormone và các chất trung gian dẫn truyền thần kinh, và các cơ quan – tổ chức dùng các tín hiệu này cho phép một tế bào nào đó thông tin cho tế bào khác. Họ cytokine chủ yếu gồm các protein hoà tan trong nước có trọng lượng nhỏ và các glycoprotein (các protein có gắn thêm cấu trúc chuổi đường) với một khối lượng 8 – 30 kDa.
Trong khi các hormone do các cơ quan cụ thể giải phóng vào máu và các chất trung gian dẫn truyền thần kinh được các thần kinh phóng thích thì các cytokine được nhiều loại tế bào giải phóng. Chúng đặc biệt quan trọng cho cả đáp ứng miễn dịch bẩm sinh lẫn miễn dịch thụ đắc. Do nằm ở vị trí trung tâm của chúng trong chức năng của hệ miễn dịch, cho nên các cytokine liên quan đến một loạt các bệnh về miễn dịch, bệnh gây viêm và các bệnh nhiễm trùng. Tuy nhiên, không phải toàn bộ các chức năng của chúng được giới hạn trong hệ miễn dịch, mà chúng cũng liên quan đến nhiều tiến trình phát triển trong quá trình hình thành thai nhi.
Cytokine do nhiều dạng tế bào sản xuất ra (cả hệ các tế bào máu và tế bào không thuộc hệ tế bào máu) và có thể tác dụng lên cả các tế bào ở gần hoặc các cơ quan toàn khắp cơ thể. Đôi khi các tác dụng lệ thuộc mạnh mẽ vào sự hiện diện của các hoá chất khác và các cytokine khác.

read more…

October 20, 2008 Posted by | Bioinformatics, Tiếng Việt | Leave a Comment

   

Follow

Get every new post delivered to your Inbox.