Réseaux de régulation génique

Un réseau de régulation génique (ou génétique ) ( RRG ), réseau de régulation des gènes ou réseaux de régulation transcriptionnelle est un ensemble de régulateurs moléculaires qui interagissent entre eux et avec d'autres substances dans une cellule pour moduler l'expression génique de l'ARNm et des protéines qui, à leur tour, déterminent la fonction de la cellule. Les RRGs jouent un rôle central dans la morphogenèse, la création de structures corporelles, qui est un sujet phare de la biologie évolutive du développement.

Structure d'un réseau de régulation génique
Processus de contrôle d'un réseau de régulation génique

L'ADN, l'ARN, les protéines ou des assemblage de celles-ci peuvent agir comme des régulateurs de manière directe ou indirecte (via l'ARN transcrit ou la protéine traduite).

En général, chaque molécule d'ARNm produit une protéine spécifique (ou un ensemble de protéines). Dans certains cas, cette protéine sera structurelle et s'accumulera au niveau de la membrane cellulaire ou à l'intérieur de la cellule pour lui conférer des propriétés structurelles particulières. Dans d'autres cas, la protéine sera une enzyme, c'est-à-dire une micro-machine qui catalyse une certaine réaction, telle que la dégradation d'une source alimentaire ou d'une toxine. Certaines protéines ne servent cependant qu'à activer d'autres gènes, et ce sont les facteurs de transcription qui sont les principaux acteurs des réseaux ou cascades de régulation. En se liant à la région promotrice au début d'autres gènes, ils les activent, initiant la production d'une autre protéine, et ainsi de suite. Certains facteurs de transcription sont inhibiteurs[1].

Dans les organismes unicellulaires, les réseaux de régulation répondent à l'environnement extérieur, optimisant la cellule à un instant donné pour sa survie dans cet environnement. Ainsi, une cellule de levure, se trouvant dans une solution sucrée, activera des gènes pour fabriquer des enzymes qui transforment le sucre en alcool[2]. Ce processus, que nous associons à la vinification, est la façon dont la cellule de levure gagne sa vie, gagnant de l'énergie pour se multiplier, ce qui, dans des circonstances normales, améliorerait ses perspectives de survie.

Chez les animaux multicellulaires, le même principe a été mis au service des cascades de gènes qui contrôlent la forme du corps[3]. Chaque fois qu'une cellule se divise, il en résulte deux cellules qui, bien qu'elles contiennent le même génome dans son intégralité, peuvent différer quant aux gènes qui sont activés et fabriquent des protéines. Parfois, une «boucle de rétroaction auto-entretenue» garantit qu'une cellule conserve son identité et la transmet. Le mécanisme de l'épigénétique par lequel la modification de la chromatine peut fournir une mémoire cellulaire en bloquant ou en permettant la transcription est moins compris. Une caractéristique majeure des animaux multicellulaires est l'utilisation de gradients de morphogènes, qui fournissent en fait un système de positionnement qui indique à une cellule où elle se trouve dans le corps, et donc quel type de cellule devenir. Un gène qui est activé dans une cellule peut fabriquer un produit qui quitte la cellule et se diffuse à travers les cellules adjacentes, y pénétrant et n'activant les gènes que lorsqu'il est présent au-dessus d'un certain seuil. Ces cellules sont ainsi induites dans un nouveau destin et peuvent même générer d'autres morphogènes qui renvoient un signal à la cellule d'origine. Sur de plus longues distances, les morphogènes peuvent utiliser le processus actif de transduction du signal. Une telle signalisation contrôle l'embryogenèse, la construction d'un plan corporel à partir de zéro à travers une série d'étapes séquentielles. Ils contrôlent et entretiennent également les corps adultes par le biais de processus de rétroaction, et la perte de cette rétroaction en raison d'une mutation peut être responsable de la prolifération cellulaire observée dans le cancer. Parallèlement à ce processus de construction de la structure, la cascade de gènes active des gènes qui fabriquent des protéines structurelles qui confèrent à chaque cellule les propriétés physiques dont elle a besoin.

Aperçu

modifier

À un certain niveau, les cellules biologiques peuvent être considérées comme des "sacs partiellement mélangés" de produits chimiques biologiques - dans la discussion sur les réseaux de régulation des gènes, ces produits chimiques sont principalement les ARN messagers (ARNm) et les protéines qui découlent de l'expression des gènes. Ces ARNm et protéines interagissent les uns avec les autres avec divers degrés de spécificité. Certains diffusent autour de la cellule. D'autres sont liés aux membranes cellulaires, interagissant avec les molécules de l'environnement. D'autres encore traversent les membranes cellulaires et véhiculent des signaux à longue portée vers d'autres cellules dans un organisme multicellulaire. Ces molécules et leurs interactions forment un réseau de régulation génique.

 
Exemple de réseau de régulation

Les nœuds de ce réseau peuvent représenter des gènes, des protéines, des ARNm, des complexes protéine/protéine ou des processus cellulaires. Les nœuds représentés comme étant situés le long de lignes verticales sont associés aux interfaces cellule/environnement, tandis que les autres sont flottants et peuvent diffuser. Les bords entre les nœuds représentent des interactions entre les nœuds, qui peuvent correspondre à des réactions moléculaires individuelles entre l'ADN, l'ARNm, le miARN, les protéines ou les processus moléculaires par lesquels les produits d'un gène affectent ceux d'un autre, bien que le manque d'informations obtenues expérimentalement implique souvent que certains les réactions ne sont pas modélisées à un niveau de détail aussi fin. Ces interactions peuvent être inductives (généralement représentées par des pointes de flèches ou le signe +), avec une augmentation de la concentration de l'une entraînant une augmentation de l'autre, inhibitrices (représentées par des cercles pleins, des flèches mousses ou le signe moins), avec une augmentation dans l'un conduisant à une diminution de l'autre, ou double, lorsque selon les circonstances le régulateur peut activer ou inhiber le nœud cible. Les nœuds peuvent se réguler directement ou indirectement, créant des boucles de rétroaction, qui forment des chaînes cycliques de dépendances dans le réseau topologique. La structure du réseau est une abstraction de la dynamique moléculaire ou chimique du système, décrivant les multiples façons dont une substance affecte toutes les autres auxquelles elle est connectée. En pratique, de tels RRG sont déduits de la littérature biologique sur un système donné et représentent une distillation des connaissances collectives sur un ensemble de réactions biochimiques connexes. Pour accélérer la conservation manuelle des RRG, certains efforts récents tentent d'utiliser l'exploration de texte, les bases de données organisées, l'inférence de réseau à partir de données massives, la vérification de modèles et d'autres technologies d'extraction d'informations à cette fin[4].

Les gènes peuvent être considérés comme des nœuds dans le réseau, les entrées étant des protéines telles que les facteurs de transcription et les sorties étant le niveau d'expression des gènes. La valeur du nœud dépend d'une fonction qui dépend de la valeur de ses régulateurs dans les pas de temps précédents (dans le réseau booléen décrit ci-dessous, ce sont des fonctions booléennes, typiquement ET, OU et NON). Ces fonctions ont été interprétées comme effectuant une sorte de traitement de l'information au sein de la cellule, qui détermine le comportement cellulaire. Les moteurs de base dans les cellules sont les concentrations de certaines protéines, qui déterminent à la fois les coordonnées spatiales (emplacement dans la cellule ou le tissu) et temporelles (cycle cellulaire ou stade de développement) de la cellule, comme une sorte de "mémoire cellulaire". Les réseaux de gènes commencent seulement à être compris, et c'est une prochaine étape pour la biologie de tenter de déduire les fonctions de chaque "nœud" de gène, pour aider à comprendre le comportement du système dans des niveaux de complexité croissante, du gène à la voie de signalisation., au niveau cellulaire ou tissulaire[5].

Des modèles mathématiques de RRG ont été développés pour capturer le comportement du système modélisé et, dans certains cas, générer des prédictions correspondant aux observations expérimentales. Dans certains autres cas, les modèles se sont avérés faire de nouvelles prédictions précises, qui peuvent être testées expérimentalement, suggérant ainsi de nouvelles approches à explorer dans une expérience qui parfois ne seraient pas prises en compte dans la conception du protocole d'un laboratoire expérimental. Les techniques de modélisation comprennent les équations différentielles (ODE), les réseaux booléens, les réseaux de Petri, les réseaux bayésiens, les modèles graphiques de réseaux gaussiens, les stochastiques et les calculs de processus[6]. À l'inverse, des techniques ont été proposées pour générer des modèles de RRG qui expliquent au mieux un ensemble d'observations de séries chronologiques. Récemment, il a été montré que le signal ChIP-seq de la modification des histones est plus corrélé avec les motifs des facteurs de transcription au niveau des promoteurs par rapport au niveau de l'ARN[7]. Par conséquent, il est proposé que la modification des histones en série chronologique ChIP-seq pourrait fournir une inférence plus fiable des réseaux de régulation des gènes par rapport aux méthodes basées sur les niveaux d'expression.

Structure et évolution

modifier

Fonctionnalité globale

modifier

On pense généralement que les réseaux de régulation des gènes sont constitués de quelques nœuds hautement connectés ( hubs ) et de nombreux nœuds mal connectés imbriqués dans un régime de régulation hiérarchique. Ainsi, les réseaux de régulation des gènes se rapprochent d'une topologie de réseau sans échelle hiérarchique[8]. Ceci est cohérent avec l'idée que la plupart des gènes ont une pléiotropie limitée et fonctionnent dans des modules de régulation[9]. On pense que cette structure évolue en raison de l' attachement préférentiel des gènes dupliqués à des gènes plus fortement connectés[8]. Des travaux récents ont également montré que la sélection naturelle tend à favoriser les réseaux à faible connectivité[10].

Les réseaux peuvent évoluer principalement de deux manières, les deux pouvant se produire simultanément. La première est que la topologie du réseau peut être modifiée par l'ajout ou la soustraction de nœuds (gènes) ou que des parties du réseau (modules) peuvent être exprimées dans différents contextes. La voie de signalisation de Drosophila Hippo en est un bon exemple. La voie de signalisation Hippo contrôle à la fois la croissance mitotique et la différenciation cellulaire post-mitotique[11]. Récemment, il a été découvert que le réseau dans lequel la voie de signalisation Hippo fonctionne diffère entre ces deux fonctions, ce qui modifie à son tour le comportement de la voie de signalisation Hippo. Cela suggère que la voie de signalisation Hippo fonctionne comme un module de régulation conservé qui peut être utilisé pour de multiples fonctions selon le contexte[11]. Ainsi, la modification de la topologie du réseau peut permettre à un module conservé de remplir plusieurs fonctions et de modifier la sortie finale du réseau. La deuxième façon dont les réseaux peuvent évoluer consiste à modifier la force des interactions entre les nœuds, comme la force avec laquelle un facteur de transcription peut se lier à un élément cis-régulateur. Il a été démontré qu'une telle variation de la force des bords du réseau sous-tend la variation entre les espèces dans le schéma du destin des cellules vulvaires des vers Caenorhabditis[12].

Caractéristique locale

modifier

Une autre caractéristique largement citée du réseau de régulation des gènes est leur abondance de certains sous-réseaux répétitifs appelés motifs de réseau . Les motifs de réseau peuvent être considérés comme des motifs topologiques répétitifs lors de la division d'un grand réseau en petits blocs. Une analyse précédente a trouvé plusieurs types de motifs qui apparaissaient plus souvent dans les réseaux de régulation des gènes que dans les réseaux générés de manière aléatoire[13],[14],[15]. À titre d'exemple, un tel motif est appelé boucles de rétroaction, qui consistent en trois nœuds. Ce motif est le plus abondant parmi tous les motifs possibles constitués de trois nœuds, comme le montrent les réseaux de régulation des gènes de la mouche, du nématode et de l'homme[15].

Les motifs enrichis ont été proposés pour suivre une évolution convergente, suggérant qu'ils sont des "conceptions optimales" à certaines fins réglementaires[16]. Par exemple, la modélisation montre que les boucles d'anticipation sont capables de coordonner le changement du nœud A (en termes de concentration et d'activité) et la dynamique d'expression du nœud C, créant différents comportements d'entrée-sortie[17],[18]. Le système d'utilisation du galactose d' E. coli contient une boucle prédictive qui accélère l'activation de l'opéron d'utilisation du galactose galETK, facilitant potentiellement la transition métabolique vers le galactose lorsque le glucose est épuisé[19]. La boucle d'alimentation dans les systèmes d'utilisation de l'arabinose d'E. coli retarde l'activation de l'opéron et des transporteurs du catabolisme de l'arabinose, évitant potentiellement une transition métabolique inutile en raison de fluctuations temporaires dans les voies de signalisation en amont[20]. De même, dans la voie de signalisation Wnt de Xenopus, la boucle d'action directe agit comme un détecteur de changement de pli qui répond au changement de pli, plutôt qu'au changement absolu, du niveau de β-caténine, augmentant potentiellement la résistance aux fluctuations de β -niveaux de caténine[21]. Suivant l'hypothèse d'évolution convergente, l'enrichissement des boucles d'anticipation serait une adaptation pour une réponse rapide et une résistance au bruit. Une recherche récente a révélé que la levure cultivée dans un environnement de glucose constant développait des mutations dans les voies de signalisation du glucose et la voie de régulation de la croissance, suggérant que les composants régulateurs répondant aux changements environnementaux sont inutiles dans un environnement constant[22].

D'autre part, certains chercheurs émettent l'hypothèse que l'enrichissement des motifs de réseau est non adaptatif[23]. En d'autres termes, les réseaux de régulation des gènes peuvent évoluer vers une structure similaire sans sélection spécifique sur le comportement d'entrée-sortie proposé. Le soutien de cette hypothèse provient souvent de simulations informatiques. Par exemple, les fluctuations de l'abondance des boucles d'anticipation dans un modèle qui simule l'évolution des réseaux de régulation des gènes en recâblant de manière aléatoire des nœuds peuvent suggérer que l'enrichissement des boucles d'anticipation est un effet secondaire de l'évolution[24]. Dans un autre modèle d'évolution des réseaux de régulateurs de gènes, le rapport des fréquences de duplication et de suppression de gènes montre une grande influence sur la topologie du réseau : certains rapports conduisent à l'enrichissement des boucles d'alimentation et créent des réseaux qui présentent des caractéristiques de réseaux sans échelle hiérarchique. L'évolution de novo des boucles d'alimentation cohérentes de type 1 a été démontrée par calcul en réponse à la sélection de leur fonction hypothétique de filtrage d'un court signal parasite, prenant en charge l'évolution adaptative, mais pour le bruit non idéalisé, un système d'alimentation basé sur la dynamique. une régulation directe avec une topologie différente a été privilégiée[25].

Réseaux de régulation bactérienne

modifier

Les réseaux de régulation permettent aux bactéries de s'adapter à presque toutes les niches environnementales de la planète[26],[27]. Un réseau d'interactions entre divers types de molécules, notamment l'ADN, l'ARN, les protéines et les métabolites, est utilisé par les bactéries pour réguler l'expression des gènes. Chez les bactéries, la fonction principale des réseaux de régulation est de contrôler la réponse aux changements environnementaux, par exemple l'état nutritionnel et le stress environnemental[28]. Une organisation complexe de réseaux permet au micro-organisme de coordonner et d'intégrer de multiples signaux environnementaux[26].

La modélisation

modifier

Équations différentielles ordinaires couplées

modifier

Il est courant de modéliser un tel réseau avec un ensemble d'équations différentielles ordinaires couplées (ODE) ou SDE, décrivant la cinétique de réaction des parties constituantes. Supposons que notre réseau réglementaire ait   nœuds, et laissez   représentent les concentrations de   substances correspondantes au moment   . Alors l'évolution temporelle du système peut être décrite approximativement par

 

où les fonctions   exprimer la dépendance de   sur les concentrations d'autres substances présentes dans la cellule. Les fonctions   sont finalement dérivés des principes de base de la cinétique chimique ou d'expressions simples dérivées de ceux-ci, par exemple Cinétique enzymatique de Michaelis-Menten. Ainsi, les formes fonctionnelles des   sont généralement choisis comme polynômes d'ordre inférieur ou fonctions de Hill qui servent d'ansatz pour la dynamique moléculaire réelle. De tels modèles sont ensuite étudiés à l'aide des mathématiques de la dynamique non linéaire. Les informations spécifiques au système, telles que les constantes de vitesse de réaction et les sensibilités, sont codées sous forme de paramètres constants[29].

En résolvant pour le point fixe du système :

 

pour tous  , on obtient (éventuellement plusieurs) profils de concentration de protéines et d'ARNm qui sont théoriquement durables (mais pas nécessairement stables ). Les états stationnaires des équations cinétiques correspondent donc à des types cellulaires potentiels, et les solutions oscillatoires de l'équation ci-dessus à des types cellulaires naturellement cycliques. La stabilité mathématique de ces attracteurs peut généralement être caractérisée par le signe de dérivées supérieures aux points critiques, et correspond alors à la stabilité biochimique du profil de concentration. Les points critiques et les bifurcations dans les équations correspondent à des états cellulaires critiques dans lesquels de petites perturbations d'état ou de paramètre pourraient faire basculer le système entre l'un des plusieurs destins de différenciation stables. Les trajectoires correspondent au déroulement des voies biologiques et des transitoires des équations aux événements biologiques à court terme. Pour une discussion plus mathématique, voir les articles sur la non- linéarité, les systèmes dynamiques, la théorie de la bifurcation et la théorie du chaos.

Réseau booléen

modifier

L'exemple suivant illustre comment un réseau booléen peut modéliser un RRG avec ses produits géniques (les sorties) et les substances de l'environnement qui l'affectent (les entrées). Stuart Kauffman a été parmi les premiers biologistes à utiliser la métaphore des réseaux booléens pour modéliser les réseaux de régulation génétique[30],[31].

  1. Chaque gène, chaque entrée et chaque sortie est représenté par un nœud dans un graphe orienté dans lequel il y a une flèche d'un nœud à l'autre si et seulement s'il existe un lien de causalité entre les deux nœuds.
  2. Chaque nœud du graphique peut être dans l'un des deux états suivants : activé ou désactivé.
  3. Pour un gène, « on » correspond au gène exprimé ; pour les entrées et les sorties, "off" correspond à la substance présente.
  4. Le temps est considéré comme s'écoulant par étapes discrètes. A chaque étape, le nouvel état d'un nœud est une fonction booléenne des états antérieurs des nœuds avec des flèches pointant vers lui.

La validité du modèle peut être testée en comparant les résultats de simulation avec des observations de séries chronologiques. Une validation partielle d'un modèle de réseau booléen peut également provenir du test de l'existence prédite d'une connexion régulatrice encore inconnue entre deux facteurs de transcription particuliers qui sont chacun des nœuds du modèle[32].

Réseaux continus

modifier

Les modèles de réseaux continus de RRG sont une extension des réseaux booléens décrits ci-dessus. Les nœuds représentent toujours les gènes et les connexions entre eux influencent la régulation de l'expression des gènes. Les gènes dans les systèmes biologiques affichent une gamme continue de niveaux d'activité et il a été avancé que l'utilisation d'une représentation continue capture plusieurs propriétés des réseaux de régulation des gènes non présentes dans le modèle booléen[33]. Formellement, la plupart de ces approches sont similaires à un réseau de neurones artificiels, car les entrées d'un nœud sont additionnées et le résultat sert d'entrée à une fonction sigmoïde, par exemple [34] mais les protéines contrôlent souvent l'expression des gènes de manière synergique, c'est-à-dire non. -linéaire, manière[35]. Cependant, il existe maintenant un modèle de réseau continu [36] qui permet le regroupement des entrées vers un nœud réalisant ainsi un autre niveau de régulation. Ce modèle est formellement plus proche d'un réseau neuronal récurrent d'ordre supérieur. Le même modèle a également été utilisé pour mimer l'évolution de la différenciation cellulaire [37] et même la morphogenèse multicellulaire[38].

Réseaux de gènes stochastiques

modifier

Des résultats expérimentaux récents [39],[40] ont démontré que l'expression des gènes est un processus stochastique. Ainsi, de nombreux auteurs utilisent maintenant le formalisme stochastique, après les travaux d'Arkin et al[41]. Les travaux sur l'expression d'un seul gène [42] et les petits réseaux génétiques synthétiques[43],[44], tels que l'interrupteur à bascule génétique de Tim Gardner et Jim Collins, ont fourni des données expérimentales supplémentaires sur la variabilité phénotypique et la nature stochastique de l'expression des gènes. Les premières versions des modèles stochastiques d'expression génique n'impliquaient que des réactions instantanées et étaient pilotées par l' algorithme de Gillespie[45].

Étant donné que certains processus, tels que la transcription génique, impliquent de nombreuses réactions et ne peuvent pas être correctement modélisés comme une réaction instantanée en une seule étape, il a été proposé de modéliser ces réactions en une seule étape plusieurs réactions retardées afin de tenir compte du temps qu'il faut pour l'ensemble du processus soit terminé[46].

À partir de là, un ensemble de réactions ont été proposées [47] qui permettent de générer des RRG. Ceux-ci sont ensuite simulés à l'aide d'une version modifiée de l'algorithme de Gillespie, qui peut simuler plusieurs réactions retardées (réactions chimiques où chacun des produits reçoit un délai qui détermine quand il sera libéré dans le système en tant que "produit fini") .

Par exemple, la transcription de base d'un gène peut être représentée par la réaction en une seule étape suivante (RNAP est l'ARN polymérase, RBS est le site de liaison du ribosome à l'ARN et Pro i est la région promotrice du gène i ) :

 

De plus, il semble y avoir un compromis entre le bruit dans l'expression des gènes, la vitesse à laquelle les gènes peuvent changer et le coût métabolique associé à leur fonctionnement. Plus précisément, pour un niveau donné de coût métabolique, il existe un compromis optimal entre le bruit et la vitesse de traitement et l'augmentation du coût métabolique conduit à de meilleurs compromis vitesse-bruit[48],[49],[50].

Un travail récent a proposé un simulateur (SGNSim, Stochastic Gene Networks Simulator )[51], qui peut modéliser les RRG où la transcription et la traduction sont modélisées comme de multiples événements retardés dans le temps et sa dynamique est pilotée par un algorithme de simulation stochastique (SSA) capable de traiter plusieurs événements retardés. Les temporisations peuvent être tirées de plusieurs distributions et les vitesses de réaction de fonctions complexes ou de paramètres physiques. SGNSim peut générer des ensembles de RRG dans un ensemble de paramètres définis par l'utilisateur, tels que la topologie. Il peut également être utilisé pour modéliser des RRG spécifiques et des systèmes de réactions chimiques. Les perturbations génétiques telles que les suppressions de gènes, la surexpression de gènes, les insertions, les mutations de décalage de cadre peuvent également être modélisées.

Le RRG est créé à partir d'un graphe avec la topologie souhaitée, imposant des distributions en degré et hors degré. Les activités de promoteur de gènes sont affectées par d'autres produits d'expression de gènes qui agissent comme entrées, sous forme de monomères ou combinés en multimères et définis comme directs ou indirects. Ensuite, chaque entrée directe est affectée à un site opérateur et différents facteurs de transcription peuvent être autorisés ou non à concourir pour le même site opérateur, tandis que les entrées indirectes se voient attribuer une cible. Enfin, une fonction est attribuée à chaque gène, définissant la réponse du gène à une combinaison de facteurs de transcription (état promoteur). Les fonctions de transfert (c'est-à-dire la façon dont les gènes répondent à une combinaison d'entrées) peuvent être attribuées à chaque combinaison d'états de promoteur comme souhaité.

Dans d'autres travaux récents, des modèles multi-échelles de réseaux de régulation des gènes ont été développés qui se concentrent sur les applications de la biologie synthétique. Des simulations ont été utilisées pour modéliser toutes les interactions biomoléculaires dans la transcription, la traduction, la régulation et l'induction des réseaux de régulation des gènes, guidant la conception de systèmes synthétiques[52].

Prédiction

modifier

D'autres travaux se sont concentrés sur la prédiction des niveaux d'expression génique dans un réseau de régulation génique.

Les approches utilisées pour modéliser les réseaux de régulation des gènes ont été contraintes d'être interprétables et, par conséquent, sont généralement des versions simplifiées du réseau. Par exemple, les réseaux booléens ont été utilisés en raison de leur simplicité et de leur capacité à gérer des données bruitées mais perdent des informations sur les données en ayant une représentation binaire des gènes. De plus, les réseaux de neurones artificiels omettent d'utiliser une couche cachée afin qu'ils puissent être interprétés, perdant la capacité de modéliser des corrélations d'ordre supérieur dans les données. En utilisant un modèle qui n'est pas contraint d'être interprétable, un modèle plus précis peut être produit.

Être capable de prédire les expressions des gènes avec plus de précision fournit un moyen d'explorer comment les médicaments affectent un système de gènes et permet de connaître à l'avance les gènes interdépendants dans un processus. Cela a été encouragé par le concours DREAM [53]dont le but est de promouevoir de meilleurs algorithmes de prédiction[54]. Récemment, d'autres travaux ont utilisé des réseaux de neurones artificiels avec une couche cachée[55].

Applications

modifier

Sclérose en plaques

modifier

Le réseau de régulation des gènes (RRG) joue un rôle essentiel pour comprendre les mécanismes de la maladie pour chacune des scléroses en plaques : récurrente-rémittente (RRMS), primaire progressive (PPMS) et secondaire progressive (SPMS)[56].

Références

modifier
  1. « Inhibitory transcription factors », The International Journal of Biochemistry & Cell Biology, vol. 28, no 9,‎ , p. 965–74 (PMID 8930119, DOI 10.1016/1357-2725(96)00039-8)
  2. « Transcriptional regulatory networks in Saccharomyces cerevisiae », Science, Young Lab, vol. 298, no 5594,‎ , p. 799–804 (PMID 12399584, DOI 10.1126/science.1075090, Bibcode 2002Sci...298..799L, lire en ligne)
  3. « Gene regulatory networks », Proceedings of the National Academy of Sciences of the United States of America, vol. 102, no 14,‎ , p. 4935 (PMID 15809445, PMCID 556010, DOI 10.1073/pnas.0502024102, Bibcode 2005PNAS..102.4935D)
  4. « Mining cis-regulatory transcription networks from literature. », Proceedings of BioLINK SIG 2013,‎ , p. 5–12
  5. « The combination of the functionalities of feedback circuits is determinant for the attractors' number and size in pathway-like Boolean networks », Scientific Reports, vol. 7,‎ , p. 42023 (PMID 28186191, PMCID 5301197, DOI 10.1038/srep42023, Bibcode 2017NatSR...742023A)
  6. Banf et Rhee, « Computational inference of gene regulatory networks: Approaches, limitations and opportunities », Biochimica et Biophysica Acta (BBA) - Gene Regulatory Mechanisms, vol. 1860, no 1,‎ , p. 41–52 (ISSN 1874-9399, PMID 27641093, DOI 10.1016/j.bbagrm.2016.09.003)
  7. « Uniform, optimal signal processing of mapped deep-sequencing data », Nature Biotechnology, vol. 31, no 7,‎ , p. 615–22 (PMID 23770639, DOI 10.1038/nbt.2596)
  8. a et b (en) « Network biology: understanding the cell's functional organization », Nature Reviews. Genetics, vol. 5, no 2,‎ , p. 101–13 (PMID 14735121, DOI 10.1038/nrg1272)
  9. (en) « The pleiotropic structure of the genotype–phenotype map: the evolvability of complex organisms », Nature Reviews. Genetics, vol. 12, no 3,‎ , p. 204–13 (PMID 21331091, DOI 10.1038/nrg2949)
  10. (en) « Survival of the sparsest: robust gene networks are parsimonious », Molecular Systems Biology, vol. 4, no 1,‎ , p. 213 (PMID 18682703, PMCID 2538912, DOI 10.1038/msb.2008.52)
  11. a et b (en) « Opposite feedbacks in the Hippo pathway for growth control and neural fate », Science, vol. 342, no 6155,‎ , p. 1238016 (PMID 23989952, PMCID 3796000, DOI 10.1126/science.1238016)
  12. (en) « Quantitative variation in autocrine signaling and pathway crosstalk in the Caenorhabditis vulval network », Current Biology, vol. 21, no 7,‎ , p. 527–38 (PMID 21458263, PMCID 3084603, DOI 10.1016/j.cub.2011.02.040)
  13. (en) « Network motifs in the transcriptional regulation network of Escherichia coli », Nature Genetics, vol. 31, no 1,‎ , p. 64–8 (PMID 11967538, DOI 10.1038/ng881)
  14. (en) « Transcriptional regulatory networks in Saccharomyces cerevisiae », Science, vol. 298, no 5594,‎ , p. 799–804 (PMID 12399584, DOI 10.1126/science.1075090, Bibcode 2002Sci...298..799L)
  15. a et b « Comparative analysis of regulatory information and circuits across distant species », Nature, vol. 512, no 7515,‎ , p. 453–6 (PMID 25164757, PMCID 4336544, DOI 10.1038/nature13668, Bibcode 2014Natur.512..453B)
  16. « Convergent evolution of gene circuits », Nature Genetics, vol. 34, no 3,‎ , p. 264–6 (PMID 12819781, DOI 10.1038/ng1181)
  17. « Structure and function of the feed-forward loop network motif », Proceedings of the National Academy of Sciences of the United States of America, vol. 100, no 21,‎ , p. 11980–5 (PMID 14530388, PMCID 218699, DOI 10.1073/pnas.2133841100, Bibcode 2003PNAS..10011980M)
  18. « The incoherent feedforward loop can provide fold-change detection in gene regulation », Molecular Cell, vol. 36, no 5,‎ , p. 894–9 (PMID 20005851, PMCID 2896310, DOI 10.1016/j.molcel.2009.11.018)
  19. « The incoherent feed-forward loop accelerates the response-time of the gal system of Escherichia coli », Journal of Molecular Biology, vol. 356, no 5,‎ , p. 1073–81 (PMID 16406067, DOI 10.1016/j.jmb.2005.12.003)
  20. « The coherent feedforward loop serves as a sign-sensitive delay element in transcription networks », Journal of Molecular Biology, vol. 334, no 2,‎ , p. 197–204 (PMID 14607112, DOI 10.1016/j.jmb.2003.09.049)
  21. « Evidence that fold-change, and not absolute level, of beta-catenin dictates Wnt signaling », Molecular Cell, vol. 36, no 5,‎ , p. 872–84 (PMID 20005849, PMCID 2921914, DOI 10.1016/j.molcel.2009.11.017)
  22. « Whole genome, whole population sequencing reveals that loss of signaling networks is the major adaptive strategy in a constant environment », PLOS Genetics, vol. 9, no 11,‎ , e1003972 (PMID 24278038, PMCID 3836717, DOI 10.1371/journal.pgen.1003972)
  23. « The evolution of genetic networks by non-adaptive processes », Nature Reviews. Genetics, vol. 8, no 10,‎ , p. 803–13 (PMID 17878896, DOI 10.1038/nrg2192)
  24. « Feed-forward loop circuits as a side effect of genome evolution », Molecular Biology and Evolution, vol. 23, no 10,‎ , p. 1931–6 (PMID 16840361, DOI 10.1093/molbev/msl060)
  25. Xiong, Lancaster, Siegal et Masel, « Feed-forward regulation adaptively evolves via dynamics rather than topology when there is intrinsic noise », Nature Communications, vol. 10, no 1,‎ , p. 2418 (PMID 31160574, PMCID 6546794, DOI 10.1038/s41467-019-10388-6, Bibcode 2019NatCo..10.2418X)
  26. a et b Bacterial Regulatory Networks, Caister Academic Press, (ISBN 978-1-908230-03-4)
  27. Two-Component Systems in Bacteria, Caister Academic Press, (ISBN 978-1-908230-08-9)
  28. Stress Response in Microbiology, Caister Academic Press, (ISBN 978-1-908230-04-1)
  29. (en) « Models of transcription factor binding: sensitivity of activation functions to model assumptions », Journal of Theoretical Biology, vol. 257, no 3,‎ , p. 419–29 (PMID 19121637, DOI 10.1016/j.jtbi.2008.11.026, lire en ligne)
  30. The Origins of Order, (ISBN 978-0-19-505811-6)
  31. « Metabolic stability and epigenesis in randomly constructed genetic nets », Journal of Theoretical Biology, vol. 22, no 3,‎ , p. 437–67 (PMID 5803332, DOI 10.1016/0022-5193(69)90015-0)
  32. « Boolean modelling reveals new regulatory connections between transcription factors orchestrating the development of the ventral spinal cord », PLOS ONE, vol. 9, no 11,‎ , e111430 (PMID 25398016, PMCID 4232242, DOI 10.1371/journal.pone.0111430, Bibcode 2014PLoSO...9k1430L)
  33. « Neural model of the genetic network », The Journal of Biological Chemistry, vol. 276, no 39,‎ , p. 36168–73 (PMID 11395518, DOI 10.1074/jbc.M104391200)
  34. « A gene network model for developing cell lineages », Artificial Life, vol. 11, no 3,‎ , p. 249–67 (PMID 16053570, DOI 10.1162/1064546054407202)
  35. « Modelling the Regulation of Gene Expression in Genetic Regulatory Networks » [archive du ], Biocomputation group, University of Hertfordshire,
  36. « Evolving Biological Clocks using Genetic Regulatory Networks » ()
    « (ibid.) », dans Proceedings of the Artificial Life X Conference (Alife 10), MIT Press, p. 15–21
  37. « Evolutionary Robustness of Differentiation in Genetic Regulatory Networks » ()
    « (ibid.) », dans Proceedings of the 7th German Workshop on Artificial Life 2006 (GWAL-7), Berlin, Akademische Verlagsgesellschaft AKA, p. 75–84
  38. « Evolution and Morphogenesis of Differentiated Multicellular Organisms: Autonomously Generated Diffusion Gradients for Positional Information » () (lire en ligne)
    « (ibid.) », dans Artificial Life XI: Proceedings of the Eleventh International Conference on the Simulation and Synthesis of Living Systems, MIT Press
  39. (en) « Stochastic gene expression in a single cell », Science, vol. 297, no 5584,‎ , p. 1183–6 (PMID 12183631, DOI 10.1126/science.1070919, Bibcode 2002Sci...297.1183E, lire en ligne)
  40. (en) « Noise in eukaryotic gene expression », Nature, vol. 422, no 6932,‎ , p. 633–7 (PMID 12687005, DOI 10.1038/nature01546, Bibcode 2003Natur.422..633B)
  41. (en) « Stochastic kinetic analysis of developmental pathway bifurcation in phage lambda-infected Escherichia coli cells », Genetics, vol. 149, no 4,‎ , p. 1633–48 (PMID 9691025, PMCID 1460268, DOI 10.1093/genetics/149.4.1633)
  42. (en) « Noise in gene expression: origins, consequences, and control », Science, vol. 309, no 5743,‎ , p. 2010–3 (PMID 16179466, PMCID 1360161, DOI 10.1126/science.1105891, Bibcode 2005Sci...309.2010R)
  43. (en) « A synthetic oscillatory network of transcriptional regulators », Nature, vol. 403, no 6767,‎ , p. 335–8 (PMID 10659856, DOI 10.1038/35002125, Bibcode 2000Natur.403..335E)
  44. (en) « Construction of a genetic toggle switch in Escherichia coli », Nature, vol. 403, no 6767,‎ , p. 339–42 (PMID 10659857, DOI 10.1038/35002131, Bibcode 2000Natur.403..339G)
  45. (en) Gillespie DT, « A general method for numerically simulating the stochastic time evolution of coupled chemical reactions », J. Comput. Phys., vol. 22, no 4,‎ , p. 403–34 (DOI 10.1016/0021-9991(76)90041-3, Bibcode 1976JCoPh..22..403G)
  46. (en) « Validation of an algorithm for delay stochastic simulation of transcription and translation in prokaryotic gene expression », Physical Biology, vol. 3, no 4,‎ , p. 274–84 (PMID 17200603, DOI 10.1088/1478-3975/3/4/005, Bibcode 2006PhBio...3..274R)
  47. « A general modeling strategy for gene regulatory networks with stochastic dynamics », Journal of Computational Biology, vol. 13, no 9,‎ , p. 1630–9 (PMID 17147485, DOI 10.1089/cmb.2006.13.1630)
  48. « Computational limits to binary genes », Journal of the Royal Society, Interface, vol. 7, no 47,‎ , p. 945–54 (PMID 20007173, PMCID 2871807, DOI 10.1098/rsif.2009.0474)
  49. « Optimal parameter settings for information processing in gene regulatory networks », Bio Systems, vol. 104, nos 2–3,‎ may–jun 2011, p. 99–108 (PMID 21256918, DOI 10.1016/j.biosystems.2011.01.006, lire en ligne)
  50. « Negative feedback and physical limits of genes », Journal of Theoretical Biology, vol. 284, no 1,‎ , p. 82–91 (PMID 21723295, DOI 10.1016/j.jtbi.2011.06.021, arXiv 1408.1869)
  51. « SGN Sim, a stochastic genetic networks simulator », Bioinformatics, vol. 23, no 6,‎ , p. 777–9 (PMID 17267430, DOI 10.1093/bioinformatics/btm004)
  52. « Models for synthetic biology », BMC Systems Biology, vol. 1,‎ , p. 47 (PMID 17986347, PMCID 2194732, DOI 10.1186/1752-0509-1-47)
  53. « The DREAM Project », Columbia University Center for Multiscale Analysis Genomic and Cellular Networks (MAGNet)
  54. « Gene expression prediction by soft integration and the elastic net-best performance of the DREAM3 gene expression challenge », PLOS ONE, vol. 5, no 2,‎ , e9134 (PMID 20169069, PMCID 2821917, DOI 10.1371/journal.pone.0009134, Bibcode 2010PLoSO...5.9134G)
  55. « Time Series Gene Expression Prediction using Neural Networks with Hidden Layers » () (lire en ligne)
    « (ibid.) », dans Proceedings of the 7th Biotechnology and Bioinformatics Symposium (BIOT 2010), p. 67–69
  56. Gnanakkumaar, Murugesan et Ahmed, « Gene Regulatory Networks in Peripheral Mononuclear Cells Reveals Critical Regulatory Modules and Regulators of Multiple Sclerosis », Scientific Reports, vol. 9, no 1,‎ , p. 12732 (PMID 31484947, PMCID 6726613, DOI 10.1038/s41598-019-49124-x, Bibcode 2019NatSR...912732G)

Voir aussi

modifier

Dans wikipédia

modifier

Liens externes

modifier