Informations

Pourquoi la nature utilise-t-elle un système à 4 niveaux pour coder les informations dans l'ADN ?

Pourquoi la nature utilise-t-elle un système à 4 niveaux pour coder les informations dans l'ADN ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Tout d'abord, je ne suis pas biologiste, donc cette question est peut-être naïve :

Le traitement et le stockage des informations informatiques sont basés sur un système de bits à 2 chiffres avec les valeurs 0 et 1. Désormais, l'ADN stocke les informations dans un système à 4 chiffres : A, C, G, T. Trois paires de bases forment un codon et peuvent coder 43 acides aminés.

Y a-t-il une bonne raison pour laquelle un système à 4 niveaux (pouvant stocker 2 bits par entité de codage) a évolué plutôt qu'un système à 2 niveaux ou un système avec un plus grand nombre de symboles dans l'alphabet ?

En d'autres termes : pourquoi un système binaire n'a-t-il pas été préféré pour le stockage et le traitement des données ? En informatique, le binaire est beaucoup plus facile, et les très rares tests de traitement de données exotiques de haut niveau n'ont pas vraiment été couronnés de succès.


L'hypothèse actuelle est que l'ARN est venu en premier, l'ADN et les protéines sont venus plus tard. Ainsi, la raison pour laquelle quatre bases sont utilisées pourrait être liée au monde d'ARN initial, puis l'ADN a simplement réutilisé les bases d'ARN déjà existantes sous une forme légèrement modifiée. Dans le monde de l'ARN, toutes les fonctions devaient être exécutées par l'ARN. Avoir plus de bases disponibles que deux serait probablement important pour pouvoir adopter diverses structures et créer des poches de liaison ou des sites actifs pour les ribozymes.

Vous ne pouvez pas vraiment considérer le code génétique comme un dispositif de stockage de données abstrait. Le choix de l'encodage a des conséquences physiques et chimiques. Par exemple, les protéines doivent être capables de se lier à l'ADN et de reconnaître des modèles particuliers. Avec votre code binaire, la séquence de reconnaissance devrait être plus longue, car chaque paire de bases contient moins d'informations. Les anticodons d'ARNt devraient être plus gros pour que la biosynthèse des protéines fonctionne avec le code binaire. Un autre problème qui joue un rôle dans certains processus est que les paires de bases GC sont plus stables que les paires de bases AU/AT.

Ce ne sont que des hypothèses. Evolution ne choisit pas nécessairement la meilleure option, parfois c'est juste la plus pratique qui fonctionne toujours bien.

J'ai également trouvé une critique intitulée "Pourquoi y a-t-il quatre lettres dans l'alphabet génétique ?" cela fait un point similaire à mon premier.

Tous présentent des modèles pour expliquer le fait que nous avons quatre types de bases dans notre alphabet génétique, sous forme secrète ou manifeste, en supposant que l'alphabet génétique a évolué dans un monde d'ARN.

Un autre facteur auquel je n'ai pas pensé et qui y est mentionné est que si plus de bases produisent de meilleurs ribozymes, plus de bases diminuent également la précision de la réplication.

En résumé, les structures bidimensionnelles de type ARN (et, vraisemblablement aussi, les structures tridimensionnelles) deviennent mieux définies à mesure que la taille de l'alphabet augmente, tandis que la précision de la réplication diminue.


Pourquoi la nature utilise-t-elle un système à 4 niveaux (ADN) pour coder les informations ?

Réponse courte : Facilité de fabrication, simplicité d'appariement, suffisance aux exigences. Moins de bases simples demandent moins d'efforts à créer, fournissent moins de correspondances possibles, mais sont suffisamment complexes pour coder ce qui est requis tout en conservant une dégénérescence suffisante pour réussir. C'était aussi la coïncidence de la co-évolution de l'alphabet répliqué, les deux se produisant au même endroit en même temps.

Réponse plus longue :

Tout d'abord, je ne suis pas biologiste, donc cette question est peut-être naïve :

Débutants et experts sont les bienvenus à SE.

Tous nos traitements et stockages d'informations sont basés sur une logique à 2 niveaux, des bits avec 0 et 1.

nombre d'Euler ($e$) est défini comme la somme d'une série infinie $sum_{n=0}^infty frac{1}{n!}$ et a l'économie de base la plus faible, mais ce n'est pas pratique à mettre en œuvre dans des circuits logiques. Avec l'économie de base de $e$ fixé à 1.000, ternaire est 1.0046 et binaire est 1.0615.

Les ordinateurs ternaires ont été construits à l'aide de la logique ternaire et, bien qu'ils soient rares, la logique ternaire est utilisée dans SQL ; même dans les ordinateurs binaires.

Plus, mais pas tout de notre traitement et stockage d'informations est basé sur une logique à 2 niveaux.

Maintenant, l'ADN stocke les informations dans un système à 4 niveaux : A, C, G, T. Trois paires de bases forment un codon et peuvent coder 4^3 acides aminés.

La plupart, mais pas tous.

Les cinq les bases nucléiques canoniques ou primaires sont : l'adénine (A), la cytosine (C), la guanine (G), la thymine (T) et l'uracile (U). L'ADN utilise A, G, C et T tandis que l'ARN utilise A, G, C et U.

Au laboratoire, l'ADN a été créé avec 6 et 8 bases, il est fonctionnel.

Voir le rapport (paywall) : « Hachimoji DNA and RNA : A genene system with huit blocs de construction", 22 février 2019, par Shuichi Hoshika, Nicole A. Leal, Myong-Jung Kim, Myong-Sang Kim, Nilesh B. Karalkar, Hyo-Joong Kim, Alison M. Bates, Norman E. Watkins Jr., Holly A. SantaLucia, Adam J. Meyer, Saurja DasGupta, Joseph A. Piccirilli, Andrew D. Ellington, John SantaLucia Jr., Millie M. Georgiadis et Steven A. Benner (version Google Cache).

"Fig. 4 Structure et propriétés fluorescentes des molécules d'ARN hachimoji.
(A) Schéma montrant l'aptamère complet de la variante d'épinards hachimoji; des composants nucléotidiques supplémentaires du système hachimoji sont représentés par des lettres noires aux positions 8, 10, 76 et 78 (B, Z, P et S, respectivement). Le fluor se fixe dans la boucle L12 (25). (B à E) Fluorescence de diverses espèces en quantités égales déterminée par UV. La fluorescence a été visualisée sous une lumière bleue (470 nm) avec un filtre ambre (580 nm).
(B) Contrôle avec fluor uniquement, sans ARN.
(C) épinards Hachimoji avec la séquence indiquée en (A).
(D) Aptamère d'épinards natif avec fluor.
(E) Aptamère de fluor et d'épinards contenant Z à la position 50, remplaçant la paire A:U aux positions 53:29 par G:C pour restaurer le triple observé dans la structure cristalline. Cela place le chromophore Z d'extinction près du fluor; Les spectres CD suggèrent que cette variante avait le même pli que les épinards indigènes (fig. S8).".

Tube à centrifuger C contient les épinards avec l'ADN contenant huit bases.

Y a-t-il une bonne raison pour laquelle au début de l'évolution, un système à 4 niveaux (qui peut stocker 2 bits par entité de codage) est favorisé par rapport à un système à 2 niveaux ou à des systèmes plus grands ?

Oui.

  • Copie fidèle diminue à peu près de façon exponentielle avec l'augmentation de la taille (N paires) de l'alphabet (en gardant la longueur du génome fixe). La raison en est qu'au fur et à mesure que l'on ajoute plus de lettres à l'alphabet, elles se ressemblent de plus en plus, et donc le risque de désappariement et de mutagenèse augmente.

  • Efficacité métabolique globale et aptitude sont déterminés par la taille, nous avons 20 acides aminés à coder (les plus petites marques 16 ou moins) et 3 codons d'arrêt. Nous avons donc un espace pour 64, et comptons sur la dégénérescence pour fournir un degré de 'correction des erreurs' (synonymisation) où les erreurs sont converties, généralement pour produire des erreurs non fatales. Bien que des erreurs de traduction rarement fatales puissent toujours provoquer des maladies rares.

Nous fonctionnons déjà de manière inefficace, aller vers un plus grand nombre de paires introduit une complexité inutile et aller plus petit n'est pas disponible pour le nombre d'acides aminés qui doivent être codés. L'augmentation de la longueur du codon rend l'ADN plus gros, car il doit déjà être enroulé pour le bourrer dans les cellules; un tiers d'ADN plus gros conviendrait mieux à des cellules qui sont également un tiers plus grosses.

Dans l'article d'opinion "Pourquoi y a-t-il quatre lettres dans l'alphabet génétique?", Nature Reviews Genetics volume 4, pages 995-1001 (2003), par Eörs Szathmáry, il y a les observations suivantes :

Page 995 :

"Il y a quatre contraintes principales sur l'incorporation réussie d'une nouvelle paire de bases$^{[6-8]}$:

  • stabilité chimique (la base ne doit pas se décomposer facilement);

  • stabilité thermodynamique (les nouvelles paires de bases ne doivent pas déstabiliser les structures d'acide nucléique);

  • aptitude au traitement enzymatique (les polymérases doivent accepter les paires de bases comme substrats, catalyser l'addition à l'amorce et être capables de poursuivre le processus); et

  • sélectivité cinétique (orthogonalité aux autres paires de bases).

Les quatre critères sont importants mais la combinaison des deux derniers, que l'on pourrait appeler réplicabilité, a fait l'objet d'une attention particulière car c'est le principal obstacle à l'enrichissement de l'alphabet génétique".

Page 997 :

"Arguments théoriques
La faisabilité de paires de bases alternatives soulève la question : pourquoi y a-t-il quatre bases dans l'alphabet génétique naturel ? Comme l'a souligné Orgel, il existe deux types de réponse : soit l'évolution n'a jamais expérimenté de paires de bases alternatives, soit quatre bases « étaient suffisantes »$^{[20]}$. La première option pourrait être valable pour les paires de bases hydrophobes discutées ci-dessus (une synthèse précoce adéquate pourrait faire défaut), mais il est peu probable qu'elle soit vraie pour toutes les bases de liaison hydrogène dans un « chaos chimique » prébiotique. En tout cas, cela n'explique pas pourquoi nous n'avons pas que deux bases$^{[21-24]}$. Il semble donc intéressant de poursuivre la seconde option : pourquoi quatre bases pourraient-elles suffire ? Si « assez » est compris en termes de stabilité évolutive, cela signifie l'optimalité dans le cadre des contraintes structurelles offertes par la sélection naturelle. Ici, je décris des tentatives pour montrer que quatre bases sont optimales sous STABILISATION DE LA SÉLECTION, en particulier lorsque l'on considère l'ÉQUILIBRE DE MUTATION-SÉLECTION. Je discute ensuite des preuves de la taille optimale du code génétique obtenu à partir de in silico SÉLECTION DIRECTIONNELLE et enfin analyser une contribution plus abstraite de ce qu'on appelle la THÉORIE DU CODAGE D'ERREUR.".

Page 1000 :

"Les recherches théoriques basées sur des études structurelles, énergétiques et théoriques de l'information confirment l'opinion selon laquelle une taille accrue de l'alphabet diminue la fidélité de copie tout en augmentant la densité de l'information. Cela indique qu'il doit y avoir une taille d'alphabet optimale en termes de fitness, que nous supposions que la génétique. alphabet a été fixé dans un monde ARN ou non.

Selon la vision du monde basée sur l'ARN, l'alphabet génétique s'est fixé il y a plus de 3 milliards d'années$^{[31]}$, et l'origine du code génétique et de la traduction s'est produite par la suite$^{[42]}$. Ce raisonnement indique que la division informationnelle/opérationnelle du travail entre les acides nucléiques et les protéines$^{[43}]$ a découplé l'alphabet génétique des contraintes de fonctionnalité enzymatique. Comme le code génétique a évolué dans le contexte d'un certain alphabet génétique, tout autre changement de l'alphabet aurait été inutile et/ou extrêmement improbable.

Si, cependant, le code génétique a pour origine la co-évolution simultanée d'acides nucléiques et de protéines (un modèle beaucoup plus compliqué), alors la fixation de l'alphabet génétique doit être considérée dans ce contexte complexe. Ici, l'aperçu général de Mac Donail$^{[38]}$ aide : la densité d'information de l'alphabet est un concept utile, que la fonction exercée soit ribozymique ou une fonction messagère dans la synthèse des protéines. Dans ce cas, le problème de la taille de « l'alphabet catalytique » (le nombre d'acides aminés codés) se pose aisément : pourquoi en a-t-on 20 plutôt que, par exemple, 16 ou 25 acides aminés différents ? Il a été souligné que certaines des considérations discutées dans cet article (effets sur l'efficacité catalytique et la fidélité de la traduction) s'appliquent à ce problème connexe.$^{[32}]$. Cependant, un autre facteur crucial est susceptible d'être impliqué : le coût métabolique de la production d'acides aminés. Un acide aminé qui appartient à la même famille biosynthétique$^{[43]}$ devrait n'augmenter que modestement l'efficacité catalytique et son coût métabolique est susceptible d'être faible. En revanche, un acide aminé d'une nouvelle famille biosynthétique est susceptible de conférer un avantage enzymatique élevé, mais devrait entraîner des coûts métaboliques élevés (par exemple, de nombreuses nouvelles étapes nécessitant de l'ATP). ».

Les références:

$[6.]$ Mathis, G. & Hunziker, J. Vers un duplex de type ADN sans paires de bases à liaison hydrogène. Angew. Chem. Int. Éd. 41, 3203-3205 (2002).

$[7.]$ Ogawa, A. K., Wu, Y., Berger, M., Schultz, P. G. & Romesberg, F. E. Conception rationnelle d'une paire de bases non naturelle avec une sélectivité cinétique accrue. Confiture. Chem. Soc. 122, 8803-8804 (2000).

$[8.]$ Kool, E. T. ADN modifiés synthétiquement comme substrats pour les polymérases. Cour. Avis. Chem. Biol. 4, 602-608 (2000).

$[20.]$ Orgel, L. E. Acides nucléiques - ajout à l'alphabet génétique. Nature 343, 18-20 (1990).

$[21.]$ Orgel, L. E. Evolution de l'appareil génétique. J. Mol. Bio. 38, 381-393 (1968).

$[22.]$ Crick, F. H. C. L'origine du code génétique. J. Mol. Biol. 38, 367-379 (1968).

$[23.]$ Wächtershäuser, G. Un précurseur tout purine d'acides nucléiques. Proc. Natl Acad. Sci. États-Unis 85, 1134-1135 (1988).

$[24.]$ Zubay, G. Un précurseur tout purine d'acides nucléiques. Chemtracts 2, 439-442 (1991).

$[31.]$ Szathmáry, E. Quatre lettres de l'alphabet génétique : un optimum évolutif figé ? Proc. R. Soc. Londres. B 245, 91-99 (1991).

$[32.]$ Szathmáry, E. Quelle est la taille optimale de l'alphabet génétique ? Proc. Natl Acad. Sci. États-Unis 89, 2614-2618 (1992).

$[38.]$ Mac Donail, D. A. Pourquoi la nature a choisi A, C, G et U/T : une perspective de codage d'erreur de la composition de l'alphabet nucléotidique. Orig. Évolution de la vie. Biosphère 33, 433-455 (2003).

$[42.]$ Szathmáry, E. L'origine du code génétique : les acides aminés comme cofacteurs dans un monde d'ARN. Tendances Genet. 15, 223-229 (1999).

$[43.]$ Wong, J. T. Une théorie de la coévolution du code génétique. Proc. Natl Acad. Sci. États-Unis 72, 1909-1912 (1975).

Informations complémentaires :

La page Web Wikipédia d'Eörs Szathmáry
http://www.colbud.hu/fellows/szathmary.shtml- Le Collegium Budapest est fermé.

Institut de recherche Scripps

La page Web de Steven Benner
http://www.chem.ufl.edu/benner.html- Le Dr Benner a quitté l'UoF en 2005.

Question différente : pourquoi l'évolution n'a-t-elle pas préféré avoir un système binaire pour stocker et traiter les données ? Pour nous, le binaire est beaucoup plus facile, et les très rares tests de traitement de données exotiques de haut niveau n'ont pas vraiment réussi.

Le binaire n'a rien à voir avec l'évolution. Peu d'entre nous peuvent compter jusqu'à 255 en binaire, nous préférons la décimale. Les ordinateurs ternaires et SQL sont "vraiment réussis", les gens préfèrent les alternatives.

Ceci est destiné à être une réponse adaptée à un profane. L'article d'Eörs Szathmáry et ses références associées peuvent être consultés pour plus de détails.


Réponse générale

L'utilisation du binaire dans les ordinateurs découle principalement de considérations pratiques sur la façon de représenter les chiffres à l'aide de courant ou de tension électrique (c'est-à-dire que « on » ou « arrêt » est le moins équivoque). Une telle représentation n'était pas seulement - ou même principalement - pour stocker des informations de différents types numériques, mais pour programmer la logique en utilisant l'algèbre booléenne. Le stockage physique des données peut se faire sous différents formats (magnétiques, optiques, électriques), mais ceux-ci sont fonctionnellement équivalents et la récupération et la conversion de données binaires en nombres réels entiers, en texte ou en images sont principalement une préoccupation mathématique plutôt que physique.

L'ADN a diverses fonctions, mais celles-ci ne concernent pas la logique de programmation. Lors du stockage de données de différents types, il n'y a aucun problème à représenter différentes bases ou bases - suffisamment de bases d'acides nucléiques différentes sont disponibles pour représenter les chiffres de la base-4. La question la plus pertinente en matière de stockage est celle qui ne se pose pas dans la mémoire informatique, c'est-à-dire la transformation physique de l'information en d'autres molécules. Cela peut prendre la forme d'une copie inverse d'un acide nucléique génomique (ADN ou, peut-être à l'origine, ARN) en réplication, la copie d'un brin d'information dans un duplex d'ADN en un seul brin d'un acide nucléique apparenté mais non identique dans le la transcription en ARNm (ARN messager) et la « lecture » (traduction) de l'information contenue dans les bases chimiques de l'ARNm pour produire une protéine composée d'acides aminés - des molécules chimiques assez différentes.

Ainsi, les considérations électroniques ou mathématiques qui conduisent à l'énoncé "En informatique, le binaire est beaucoup plus facile" n'ont aucune pertinence pour l'ADN et le code génétique, où les considérations moléculaires chimiques et structurelles sont primordiales. L'hypothèse selon laquelle il est nécessaire d'expliquer pourquoi l'information contenue dans l'ADN n'est pas spécifiquement binaire est donc fausse.

Spéculation sur la chimie structurale de l'évolution de l'information génétique

La question de savoir pourquoi le système à 4 chiffres (plutôt que 2 ou 6- etc.) est toujours valable, mais ne peut pas être résolue définitivement. Cependant, il vaut la peine de discuter pour illustrer aux scientifiques du numérique la manière dont des considérations structurelles ont pu déterminer le choix du système d'information. Je considérerai deux stades précoces de l'évolution biochimique auxquels le système à 4 chiffres peut avoir été choisi, après quoi - il faut le reconnaître - il pourrait y avoir eu de sérieux obstacles à d'autres changements. Abandonner Java et passer à Python (ou même simplement passer de Java I à Java II) n'était probablement pas une option.

LA CHIMIE DU GÉNOME AUTORÉPLICABLE

Je supposerai l'un des principes principaux de l'hypothèse mondiale de l'ARN - que l'ARN a précédé l'ADN en tant que génome cellulaire. Même si le génome d'origine était de l'ADN, la question est la même - pourquoi quatre bases d'acides nucléiques plutôt que deux ou six etc. - et les exigences de sa constitution chimique sont similaires : permettre l'auto-réplication (d'où la nécessité de considérer des nombres pairs ).

On pourrait considérer qu'un ARN avec deux bases est apparu en premier - supposons l'adénine (A) et l'uracile (U) pour les besoins de l'argumentation. Plus tard, la cellule a acquis la capacité catalytique de synthétiser la guanine (G) et la cytosine (C), de sorte que le développement d'un génome AU auto-répliquant à un génome AUGC est devenu possible. En supposant que cela se soit produit avant l'apparition du potentiel de codage des acides aminés de l'ARN, qu'est-ce qui aurait pu favoriser le génome plus complexe ? Cela pourrait avoir quelque chose à voir avec le fait qu'il y a trois, plutôt que deux, liaisons hydrogène dans une paire de bases GC, produisant peut-être une structure ARN:ARN différente qui était soit plus stable, soit plus facile à répliquer pour une raison quelconque. Alternativement, cela n'a peut-être rien à voir avec la structure de l'hélice ARN:ARN, mais était un effet secondaire de l'acquisition de bases supplémentaires dont la plus grande polyvalence chimique a amélioré les fonctions enzymatiques (activité ribozymique) de l'ARN primitif.

Si plus signifiait mieux, pourquoi pas six bases plutôt que quatre ? Il pourrait y avoir des raisons chimiques spécifiques comme le développement plus lent des activités enzymatiques pour produire d'autres bases d'acides nucléiques, ou qu'avec plus de bases, la possibilité de mésappariement des bases était plus élevée. (Le 'principe de la boucle d'or' prend un long chemin.) Ou il se peut que le système ait fonctionné assez bien, a été suivi par le développement d'un code triplet, auquel stade le système a été gelé.

LA CHIMIE STRUCTURELLE DE LA TRADUCTION

Les dés ont peut-être déjà été jetés dans le génome, ci-dessus, mais il serait dommage de ne pas regarder la chimie du décodage de l'information génétique, car ce n'est guère une considération pour les systèmes informatiques. Considérons donc une compétition entre des organismes étroitement apparentés, l'un avec un génome à deux bases et un autre avec un génome à quatre bases (et même un génome à six bases). L'exigence est de coder les informations pour un certain nombre d'acides aminés qui peuvent donner aux protéines une polyvalence fonctionnelle - quelque part environ les 20 (plus les signaux de terminaison) que nous avons aujourd'hui. La taille du codon (la taille du mot), est de 3 dans un système à 4 bits, pouvant accueillir 64 (43) des codons possibles dans un code génétique (standard).Si un système de stockage de données à 2 bits était utilisé, une taille de mot de 5 serait nécessaire pour générer 32 (25) codons possibles, alors qu'un système à 6 bits pourrait réduire la taille des mots à 2 avec 36 (62) possibles codons.

Les conséquences physiques de ces systèmes différents seraient visibles dans le processus de décodage où une molécule adaptatrice - l'ARN de transfert (ARNt) - délivre des acides aminés au centre peptidyl transférase du ribosome (à une extrémité) tout en interagissant avec l'ARN messager (ARNm) à l'autre extrémité par appariement de bases codon-anticodon. On pourrait soutenir que l'anticodon d'ARNt de trois bases s'insère dans la boucle à l'extrémité de la tige hélicoïdale de l'anticodon d'une manière qui lui permet d'adopter une position relativement précise (oui, je connais l'oscillation) où il peut établir un contact approprié avec l'ARNm bases de codons (voir schéma ci-dessous).

Un anticodon quintuplet et une interaction à cinq bases (bien que pas impossible) sembleraient moins naturellement adaptés à la chimie structurale de l'ARN. Des objections similaires ne s'appliqueraient pas à une interaction à deux bases, bien que l'on puisse soutenir que l'énergie totale d'interaction entre deux paires de bases était insuffisante pour éviter les erreurs. La considération d'erreur s'applique également à un système binaire où la différence d'énergie entre une interaction à cinq bases et une interaction à quatre bases (c'est-à-dire un simple décalage) serait faible. En effet, si la compétition hypothétique entre les organismes à 2 et 4 bits s'était produite, le système à 2 bits aurait également été plus sujet à la fréquence d'erreur par glissement lors de la réplication.

Le dernier mot…

… revient à Steven Benner, dont le groupe a construit un ADN à 8 bases en laboratoire :

« La capacité de stocker des informations n'est pas très intéressante pour l'évolution. Vous devez être capable de transférer cette information dans une molécule qui fait quelque chose.


Recombinaison V(D)J

Recombinaison V(D)J est le mécanisme de recombinaison somatique qui se produit uniquement dans les lymphocytes en développement pendant les premiers stades de la maturation des cellules T et B. Il en résulte un répertoire très diversifié d'anticorps/immunoglobulines et de récepteurs des cellules T (TCR) trouvés dans les cellules B et les cellules T, respectivement. Le processus est une caractéristique déterminante du système immunitaire adaptatif.

La recombinaison V(D)J chez les mammifères se produit dans les organes lymphoïdes primaires (moelle osseuse pour les cellules B et thymus pour les cellules T) et réarrange de manière presque aléatoire la variable (V), la jonction (J) et, dans certains cas, la diversité ( D) segments de gènes. Le processus aboutit finalement à de nouvelles séquences d'acides aminés dans les régions de liaison aux antigènes des immunoglobulines et des TCR qui permettent la reconnaissance des antigènes de presque tous les agents pathogènes, y compris les bactéries, les virus, les parasites et les vers ainsi que les « cellules du soi altérées » comme on le voit dans cancer. La reconnaissance peut aussi être de nature allergique (par exemple. au pollen ou à d'autres allergènes) ou peuvent correspondre aux tissus de l'hôte et conduire à une auto-immunité.

En 1987, Susumu Tonegawa a reçu le prix Nobel de physiologie ou médecine « pour sa découverte du principe génétique pour la génération de la diversité des anticorps ». [1]


Qu'est-ce que l'uracile ?

L'uracile est l'une des quatre bases azotées de la molécule d'ARN représentée par la lettre U. C'est une pyrimidine et a une grande structure à cycle unique.

La formule chimique de l'uracile est C4H4N2O2 et son nom IUPAC est Pyrimidine-2,4(1H,3H)-dione.

Un uracile est une forme déméthylée d'une thymine, ce qui signifie qu'un groupe méthyle (CH3) est retiré d'une molécule de thymine au carbone 5'.

Dans l'ARN, l'uracile se lie à l'adénine en utilisant deux liaisons hydrogène. Ainsi, l'uracile agit à la fois comme un accepteur de liaisons hydrogène et un donneur de liaisons hydrogène lorsqu'il est lié à l'adénine.

Cet uracile se lie à un sucre ribose pentose pour former le ribonucléoside uridine. Et, dès que le groupe phosphate s'attache à l'uridine, alors l'uridine 5'-monophosphate est produit.

L'uracile est un acide faible et il est très résistant à l'oxydation et permet ainsi à l'ARN d'exister librement en dehors du noyau sans aucun problème. Cet ADN ne peut pas faire.

L'uracile avec sa liaison avec les riboses et les phosphates remplit diverses fonctions biologiques comme agir comme régulateurs allostériques, coenzymes pour les réactions, impliquées dans la biosynthèse des polysaccharides, et le transport des sucres contenant des aldéhydes, etc.

La présence d'uracile dans l'ARN comme l'ARNm aide à la production de chaînes d'acides aminés pour produire des protéines. Près de 37 codons sur les 64 codons totaux de l'ARNm contiennent de l'uracile qui aide à coder les protéines.

La fonction d'Uracil pour la terminaison de la synthèse des protéines ne peut pas non plus être ignorée. L'uracile est présent dans les 3 codons stop : UAA, UAG et UGA.


Les avantages de la biologie synthétique

La biologie, c'est la chimie ! Les systèmes biologiques sont souvent utilisés pour s'inspirer de la recherche de nouvelles réactions et catalyseurs. Il suffit de penser à la cellule d'un micro-organisme. À l'intérieur, des enzymes métaboliques incroyablement efficaces sont utilisées pour transformer des matières premières simples et abondantes en produits naturels magnifiquement complexes. Les chimistes ne peuvent tout simplement pas rivaliser avec la nature à cet égard.

Un bioréacteur utilisé pour fermenter l'éthanol à partir de déchets d'épis de maïs chargés de levure

Source : Département de l'agriculture des États-Unis

Qu'est-ce que la biologie synthétique ?

La biologie synthétique consiste à construire des systèmes artificiels qui peuvent ensuite faire quelque chose d'utile. Par exemple, nous pouvons utiliser nos connaissances en chimie enzymatique pour coder génétiquement une voie de synthèse au sein d'une séquence d'ADN. Une fois à l'intérieur d'un microbe, cet ADN forcera ensuite la cellule à produire la molécule que nous désirons. Pour faire une analogie, c'est l'équivalent d'un ballon de réaction qui produit tous les catalyseurs et réactifs pour une synthèse totale souhaitée au point exact de la voie de synthèse où ils sont nécessaires, réalisé dans l'eau à l'aide de matériaux renouvelables et achevé en moins d'un journée. Si nous pouvions le faire en laboratoire ou à l'échelle industrielle, cela rendrait tout processus chimique incroyablement efficace.

Microphotographie d'une section transversale d'une graine

Quels sont les avantages de la biologie synthétique ?

Il y a plein. Pour commencer, les produits que nous voulons peuvent être dérivés directement de matières premières telles que le glucose, le CO2 ou le méthane. Une fois que les meilleures enzymes ont été identifiées, elles peuvent être déplacées entre différentes espèces, nous pouvons même connecter des voies entières en utilisant l'ingénierie du génome. Les intermédiaires réactifs et toxiques peuvent être contenus dans des compartiments subcellulaires, réduisant ainsi les déchets dangereux. Et le produit final peut être exporté de la cellule en utilisant des voies de sécrétion naturelles, ce qui signifie que nous n'avons pas à effectuer de purifications difficiles.

Pourquoi la biologie synthétique n'est-elle pas plus largement utilisée ?

Nous n'avons pas d'enzymes qui peuvent correspondre à toutes les réactions connues en chimie organique, donc la biologie synthétique ne peut pas commencer à rivaliser avec la diversité des composés accessibles via les méthodes traditionnelles. De plus, de nombreuses molécules commercialement importantes contiennent des motifs structurels qui ne peuvent pas être fabriqués à l'aide de la chimie enzymatique connue. Pour cette raison, de nombreux bioprocédés actuels produisent des intermédiaires synthétiques, qui sont ensuite extraits puis développés dans un laboratoire de chimie synthétique pour obtenir le produit fini.

Pouvons-nous développer les enzymes dont nous avons besoin ?

Nous l'espérons. La biologie moderne cherche actuellement à combler cette lacune de réactivité en utilisant l'outil même qui lui a permis en premier lieu - l'évolution.

L'évolution dirigée est une méthode qui essaie d'imiter la sélection naturelle pour obtenir les gènes/fonctions que nous voulons. Les chercheurs peuvent identifier des similitudes entre les réactions enzymatiques et les réactions chimiques en laboratoire, puis essayer à plusieurs reprises de sélectionner des gènes qui présentent cette fonction. Il en résulte d'énormes bibliothèques de gènes mutés, à partir desquels des variantes hautement actives peuvent être identifiées.

Il existe maintenant des enzymes capables de remplir des fonctions inconnues de la nature mais qui sont très utiles aux chimistes. Ce n'est qu'une question de temps avant que ces nouvelles familles d'enzymes de conception soient intégrées dans des voies métaboliques conçues.

Prélèvement d'échantillon de bio-réacteur biotechnologique en laboratoire microbiologique.

Cela signifie-t-il que les chimistes ne seront pas nécessaires ?

Pas du tout – en fait, cela signifie le contraire. Les chimistes offrent une compréhension moléculaire unique de la biologie. Ils sont indispensables à la biologie synthétique, et la meilleure approche pour créer les molécules dont nous avons besoin passera probablement par l'utilisation d'outils des deux domaines. Il y a beaucoup de travail que les chimistes peuvent faire, comme l'utilisation de sources de carbone durables dans les processus existants, le développement de catalyseurs biocompatibles ou la conception de nouveaux cofacteurs catalytiques à utiliser dans les métalloenzymes artificielles. Ce sont tous des développements passionnants pour les biologistes synthétiques – et cela signifie que l'avenir des deux sciences est susceptible d'être encore plus lié.


Un rôle pour l'ARN

Un principe fondamental de la génétique moléculaire - son dogme central - était que la machinerie cellulaire transcrit fidèlement l'information génétique d'une matrice d'ADN double brin en un messager ARN simple brin, qui est ensuite traduit en une protéine. Mais dans les années 1980, une poignée de laboratoires ont remarqué que certains transcrits d'ARNm contenaient des lettres altérées ou supplémentaires qui n'étaient pas codées dans l'ADN. Les résultats ont été controversés jusqu'à ce que les scientifiques découvrent une famille d'enzymes appelées adénosine désaminases agissant sur l'ARN (ADAR). Ces protéines se lient aux ARN et modifient leur séquence en changeant une base connue sous le nom d'adénosine en une molécule appelée inosine. Bien qu'elle ne fasse pas partie des bases canoniques de l'ARN, l'inosine est lue par la machinerie de traduction des protéines de la cellule comme la guanosine familière. Une poignée d'autres enzymes d'édition d'ARN ont fait surface à peu près au même moment.

Les scientifiques ont lutté au cours des trois dernières décennies pour comprendre exactement ce que l'édition d'ARN accomplit. Les éditeurs ne travaillent que sur les ARN double brin, qui apparaissent parfois dans la cellule sous forme d'éléments régulateurs - ou sous forme de virus. Certains ont émis l'hypothèse que les protéines ADAR ont évolué en tant que défense contre les virus, mais de nombreux virus à ARN double brin ne sont pas affectés par les enzymes. L'édition peut remplir une fonction de régulation, mais la plupart des tissus adultes ne produisent pas les niveaux élevés de protéines nécessaires pour que l'édition se produise.

Le kill-switch pour CRISPR qui pourrait rendre l'édition de gènes plus sûre

Brenda Bass, biochimiste à l'Université de l'Utah à Salt Lake City, a été parmi les premières à identifier les ADAR dans les embryons de grenouille 2 . Elle dit que personne n'a trouvé de rôle spécifique pour les modifications apportées aux ARN non codant pour les protéines, qui représentent la majorité des molécules éditées. L'édition pourrait servir à protéger les ARN double brin d'une attaque immunitaire. Bass soupçonne que les ADAR éditent les transcriptions double brin, ajoutant des inosines comme moyen de dire au corps de les laisser tranquilles. Les enzymes semblent également jouer un rôle dans le développement embryonnaire : les souris dépourvues des gènes ADAR meurent avant la naissance ou ne vivent pas longtemps après. Les éditeurs semblent également avoir une certaine fonction dans certains tissus d'organismes adultes, tels que le système nerveux des céphalopodes.

C'est cette activité qui a attiré le biologiste marin Joshua Rosenthal à l'édition d'ARN au début des années 2000. Il semble que les céphalopodes très intelligents, tels que les calmars, les seiches et les poulpes, utilisent largement l'édition d'ARN pour ajuster les gènes impliqués dans le développement des cellules nerveuses et la transmission du signal. Aucun autre animal n'est connu pour utiliser l'édition d'ARN de cette manière. Inspiré par ces observations, Rosenthal s'est demandé s'il était possible d'utiliser le système pour corriger les messages produits par des gènes dysfonctionnels dans un cadre thérapeutique. En 2013, son groupe de l'Université de Porto Rico à San Juan a repensé les enzymes ADAR et les a attachées pour guider les ARN qui se lieraient à un point spécifique d'un ARNm, créant ainsi un double brin. Avec ceux-ci, ils ont pu éditer des transcriptions dans des embryons de grenouilles, et même dans des cellules humaines en culture 3 .

Semblable à Stafforst, Rosenthal, maintenant au Marine Biological Laboratory à Woods Hole, Massachusetts, a vu sa publication presque ignorée. Un sort similaire, a-t-il appris, s'était abattu sur le travail des chercheurs d'une société appelée Ribozyme, qui en 1995 a proposé une « édition thérapeutique » de séquences d'ARN mutées en insérant des séquences complémentaires dans des embryons de grenouille et en permettant aux ADAR d'éditer la molécule double brin résultante et corriger la mutation 4 .

Mais au cours des dernières années, de multiples facteurs ont convergé pour mettre en évidence les conclusions de Rosenthal et Stafforst. Peter Beal, chimiste à l'Université de Californie à Davis, affirme que la publication en 2016 5 de la structure moléculaire de l'ADAR lié à l'ARN double brin a rendu le système plus compréhensible et a permis aux scientifiques de mieux concevoir l'enzyme pour améliorer sa livraison ou faire c'est plus efficace. Et en 2018, la Food and Drug Administration (FDA) américaine a approuvé la première thérapie utilisant l'interférence ARN (ARNi) : une technique dans laquelle un petit morceau d'ARN est inséré dans une cellule dans laquelle il se lie aux ARNm natifs et accélère leur dégradation. L'approbation a ouvert la porte à d'autres thérapies impliquant des interactions avec l'ARNm, déclare Gerard Platenburg, directeur de l'innovation de ProQR Therapeutics à Leiden, aux Pays-Bas, qui poursuit diverses thérapies à base d'ARN. « En tirant les leçons du passé et avec l'augmentation du nombre d'approbations, le domaine a beaucoup mûri », déclare Platenburg.

Beaucoup voient l'édition d'ARN comme une alternative importante à l'édition d'ADN en utilisant des techniques telles que CRISPR. La technologie CRISPR s'améliore, mais la modification de l'ADN peut provoquer des mutations indésirables dans d'autres parties du génome – des « effets hors cible » – ce qui pourrait créer de nouveaux problèmes.

Un nouvel outil CRISPR ultra-précis pourrait s'attaquer à une pléthore de maladies génétiques

Rosenthal s'attend en outre à ce que l'édition d'ARN s'avère utile pour les maladies sans origine génétique. Il utilise actuellement des ADAR pour modifier l'ARNm d'un gène codant pour le canal sodique Nav1.7, qui contrôle la façon dont les signaux de douleur sont transmis au cerveau. Changer de façon permanente le gène Nav1.7 par l'édition d'ADN pourrait éliminer la capacité de ressentir de la douleur et perturber d'autres fonctions nécessaires de la protéine dans le système nerveux, mais le réduire par l'édition d'ARN dans certains tissus pendant une durée limitée pourrait aider à soulager douleur sans le risque de dépendance ou d'addiction associé aux analgésiques conventionnels.

De même, l'édition d'ARN pourrait permettre aux chercheurs d'imiter des variantes génétiques qui offrent un avantage pour la santé. Par exemple, les personnes atteintes de certaines mutations du gène PCSK9, qui régule le cholestérol dans le sang, a tendance à avoir des taux de cholestérol plus bas et à modifier PCSK9 L'ARNm pourrait conférer un avantage similaire sans perturber de façon permanente les autres fonctions de la protéine. L'immunologue Nina Papavasiliou du Centre allemand de recherche sur le cancer à Heidelberg affirme que l'édition d'ARN pourrait être utilisée pour lutter contre les tumeurs. Certains cancers détournent d'importantes voies de signalisation cellulaire, telles que celles impliquées dans la mort ou la prolifération cellulaire. Si les éditeurs d'ARN pouvaient être enrôlés pour désactiver temporairement les molécules de signalisation clés, dit-elle, « nous pourrions voir la tumeur mourir ». Ensuite, le patient pourrait arrêter la thérapie, permettant à la voie de reprendre ses fonctions normales.

En tant que traitement, l'édition d'ARN pourrait être moins susceptible de provoquer une réaction immunitaire potentiellement dangereuse que les approches basées sur CRISPR. Contrairement à l'enzyme d'édition d'ADN Cas9, qui provient de bactéries, les ADAR sont des protéines humaines qui ne déclenchent pas d'attaque du système immunitaire. "Vous n'avez vraiment pas besoin de machinerie lourde pour cibler l'ARN", explique Prashant Mali, bio-ingénieur à l'Université de Californie à San Diego.

Dans un article publié l'année dernière 6 , Mali et ses collègues ont injecté des ARN guides à des souris nées avec une mutation génétique qui cause la dystrophie musculaire. Les ARN guides ont été conçus pour déclencher la production d'une protéine manquante appelée dystrophine. Bien que le système n'ait édité qu'une petite quantité d'ARN codant pour la dystrophine, il a restauré la protéine à environ 5 % de son niveau normal dans le tissu musculaire des animaux, une quantité qui a montré un potentiel thérapeutique.

Illustration par Joanna Gębal

Dans d'autres maladies qui résultent d'une protéine manquante ou dysfonctionnelle, comme certains types d'hémophilie, « cela fait une énorme différence de passer de rien à quelque chose », explique Stafforst, et il n'est peut-être pas nécessaire de modifier l'ARN dans chaque cellule du corps. L'édition d'ARN pourrait être plus performante que les formes de thérapie génique qui impliqueraient l'injection d'un nouveau gène. Le Mali et d'autres affirment que diriger les ADAR natifs pour qu'ils opèrent sur le propre ARNm de la cellule pourrait fournir une réponse plus naturelle que l'introduction d'un gène externe modifié.

Cependant, la technologie d'édition d'ARN est loin d'être parfaite, même lorsqu'il s'agit d'applications en laboratoire. "C'est le début", dit Bass. « Il y a beaucoup de questions. » Parce que les ADAR sont beaucoup moins efficaces que CRISPR, ils pourraient être moins utiles pour fabriquer des plantes et des animaux génétiquement modifiés. "En tant qu'outil de recherche, c'est très limitatif", explique Jin Billy Li, généticien à l'Université de Stanford en Californie.

Un autre inconvénient majeur est que les ADAR ne peuvent apporter que quelques types de modifications à l'ARN. Les systèmes CRISPR agissent comme des ciseaux en coupant l'ADN à un endroit désigné et en supprimant ou en insérant une nouvelle séquence.

Bien que ce processus soit moins susceptible de provoquer des mutations involontaires, il limite les enzymes à apporter des modifications spécifiques - de l'adénosine à l'inosine dans le cas des ADAR et de la cytosine à l'uridine par un ensemble d'enzymes appelées APOBEC (voir « Les corrections de l'ARN »). Il y a quelques autres possibilités. Les plants de raisin, par exemple, peuvent changer les cytidines en uridines, et certaines tumeurs peuvent changer les guanosines en adénosines. « La biodiversité nous donne des tonnes de réponses à ces questions », déclare Rosenthal. "Je pense que sur toute la ligne, des choses comme le calmar vont nous apprendre beaucoup." Mais il dit que le domaine est sous-étudié – les chercheurs ne comprennent pas le processus qui sous-tend cette édition. Et il reste à voir si une enzyme végétale, par exemple, pourrait fonctionner dans les cellules humaines.

Les scientifiques recherchent déjà des moyens de concevoir de nouvelles enzymes qui pourraient étendre les capacités d'édition d'ARN. "C'est tout un processus où vous ne savez pas ce que vous allez trouver", explique Omar Abudayyeh, ingénieur en biologie au Massachusetts Institute of Technology (MIT) à Cambridge. En collaboration avec Feng Zhang, un pionnier du CRISPR au MIT, Abudayyeh et ses collègues ont lié une enzyme ADAR à Cas13 7 . Une enzyme bactérienne similaire à la protéine associée à CRISPR Cas9, Cas13 coupe l'ARN au lieu de l'ADN. Les chercheurs ont modifié la séquence de l'ADAR jusqu'à ce qu'il puisse convertir les cytidines en uridines. Ils ont ensuite utilisé le nouveau système dans des cellules humaines pour modifier les bases des ARNm codés par plusieurs gènes, notamment APOE. Une variante génétique naturelle de ce gène est associée à la maladie d'Alzheimer, et sa modification pourrait faire passer la variante à la forme inoffensive.

Abudayyeh et son collaborateur du MIT, l'ingénieur biologiste Jonathan Gootenberg, admettent qu'il est possible que la modification de la protéine ADAR puisse empêcher le système immunitaire de la reconnaître comme une protéine humaine naturelle et attaquer les cellules qui la contiennent. Mais ils disent que parce que ces modifications sont petites, ce risque n'est rien à côté des préoccupations connues concernant le système immunitaire attaquant Cas13 ou le virus utilisé pour fournir les outils d'édition dans les cellules.

Les chercheurs voient prometteur dans un processus naturel appelé pseudouridylation, dans lequel un ensemble d'enzymes protéiques et ARN modifient chimiquement la structure des uridines dans l'ARNm. Contrairement aux modifications ADAR, la pseudouridylation ne modifie pas la séquence de l'ARNm ou de la protéine. Au lieu de cela, pour des raisons qui ne sont pas tout à fait claires, le processus stabilise la molécule d'ARN et amène la machinerie de traduction à ignorer les signaux lui ordonnant d'arrêter de fabriquer des protéines.

La capacité de transformer ces feux rouges moléculaires en feux verts pourrait être puissante. Yi-Tao Yu, biochimiste à l'Université de Rochester à New York, affirme que des centaines de maladies génétiques sont causées par des mutations de l'ADN qui créent des signaux d'arrêt incorrects dans les ARNm, entraînant une protéine raccourcie qui ne fonctionne pas normalement dans le corps. « La liste est très longue », dit Yu, et comprend la mucoviscidose, la maladie oculaire, le syndrome de Hurler et de nombreux cancers.

Malgré son stade précoce, les chercheurs - et les investisseurs en biotechnologie - sont enthousiasmés par le vaste potentiel de l'édition d'ARN. "Je m'y suis mis bien avant qu'il ne devienne cool", explique Papavasiliou, qui essaie de cartographier où les ADAR naturels fonctionnent dans le corps. "Pendant de nombreuses années, c'était un marigot, et tout d'un coup, une entreprise apparaît toutes les deux semaines."

De nombreuses start-ups et sociétés d'édition d'ADN établies ont annoncé leur intention de passer à l'ARN. Ils incluent Beam Therapeutics à Boston, Massachusetts, qui a été co-fondé par Zhang et Liu et a développé l'édition d'ADN CRISPR comme thérapie pour plusieurs maladies du sang. Locana, basée à San Diego, poursuit également l'édition d'ARN basée sur CRISPR qui, espère-t-elle, pourrait traiter des affections telles que la maladie des motoneurones et la maladie de Huntington.

Bébés CRISPR : quand le monde sera-t-il prêt ?

Le défi pour l'industrie est de trouver le meilleur moyen d'introduire les ARN guides dans la cellule sans déclencher de réaction immunitaire ni amener la cellule à les dégrader. Beal dit que cela pourrait inclure des modifications chimiques stratégiques aux ARN modifiés qui les stabilisent, ou les intégrer dans une nanoparticule ou un virus qui peut se faufiler dans les cellules.

Et bien que les ADAR soient déjà dans les cellules humaines, le corps humain n'en fabrique que de petites quantités dans la plupart des tissus, ce qui signifie que toute thérapie peut nécessiter l'ajout d'ADAR ou d'autres enzymes pour augmenter les capacités d'édition des cellules. Emballer des virus avec les gènes qui codent pour toute la machinerie nécessaire à l'édition de l'ARN pourrait ne pas être efficace. Beaucoup espèrent que ce ne sera pas nécessaire.

Platenburg espère ajouter des ARN et s'appuyer sur les ADAR naturels pour aider à corriger le lettrage des ARNm qui contribuent aux troubles rétiniens. « Nous utilisons le système qui nous est donné par la nature et l'exploitons », dit-il.

Des chercheurs, dont Stafforst, élaborent des ARN guides avec des modifications chimiques qui attirent les ADAR dans la cellule vers le site d'édition. Mais certains chercheurs craignent que la conscription des ADAR naturels pour éditer des ARNm spécifiques puisse les éloigner de leurs tâches normales et causer d'autres problèmes de santé. La modification de l'expression des gènes dans une partie du corps pourrait affecter d'autres parties de manière imprévue. Dans l'étude sur la dystrophie musculaire au Mali, par exemple, des souris ont développé des problèmes de foie pour des raisons inconnues. « C’est encore un outil en développement », dit-il.

"ADAR a évolué pour permettre au corps de modifier les bases de manière très ciblée", explique Nessan Bermingham, directeur général et co-fondateur avec Rosenthal et d'autres de la société de biotechnologie Korro Bio à Cambridge, Massachusetts. Bermingham est optimiste quant aux perspectives de l'édition d'ARN, mais prudent de ne pas devancer la biologie. « Nous avons beaucoup de travail à faire alors que nous commençons à mûrir ces techniques », dit-il. « Nous ne laissons rien de côté, mais nous devons reconnaître certaines limites. »

La nature 578, 24-27 (2020)


Junk ou non découvert?

Faire une protéine n'est pas aussi simple que de suivre une recette d'un livre de cuisine. Les protéines se forment lorsque l'ADN subit un processus appelé transcription. Ceci est nécessaire, car les enzymes qui fabriquent les protéines peuvent lire l'ADN. L'information codée dans l'ADN est copiée sur une nouvelle molécule appelée ARN messager (ARNm). Comme l'ADN, l'ARNm possède également 4 bases nucléotidiques, mais la thymine (T) est remplacée par l'uracile (U). Une autre différence est que l'ARNm est une molécule simple brin.

ADN et ARN (Crédit photo : ShadeDesign/Shutterstock)

Pendant la transcription, l'ARNm est haché et rejoint. C'est ce qu'on appelle l'épissage d'ARN. Ceci est dû au fait que des sections du gène n'ont pas de sens pour les protéines, elles sont appelées introns. Lors de l'épissage de l'ARN, ces bits sont découpés et jetés. On pourrait dire que ces morceaux sont perdus dans la transcription !

Mécanisme d'épissage de l'ARNm (Crédit photo : Udayadaithya M V)/Shutterstock)

Ces segments non codants mis au rebut ont déconcerté les scientifiques pendant des décennies. Les introns étaient brouillés entre les gènes. N'ayant aucun but apparent, de nombreux scientifiques pensaient que cela ne valait rien. En 1972, Susumu Ohno, un généticien, a inventé le terme &lsquojunk DNA&rsquo pour expliquer de manière accrocheuse ce gaspillage d'ADN. Parfois, on l'appelait aussi « ADN égoïste », car il semblait n'exister que pour lui-même, sans rien contribuer à la survie de l'organisme.

Le dogme central de l'expression des gènes (Crédit photo : udaix/Shutterstock)

Cependant, plusieurs scientifiques pensaient que ces gros morceaux d'ADN ne devraient pas être étiquetés aussi hâtivement comme "sans aucune". Si vous lisez cet article et que vous ne connaissiez que dix mots de la langue anglaise, penseriez-vous que tout dans cet article, à l'exception de ces dix mots, était un non-sens ? De la même manière, les scientifiques pensaient que la fonction de ce soi-disant ADN « lsquojunk » restait tout simplement à découvrir.


Pourquoi avons-nous encore de l'ADN mitochondrial ?

La mitochondrie n'est pas la bactérie qu'elle était à son apogée, disons il y a deux milliards d'années. Depuis qu'il est consommé par notre ancêtre unicellulaire commun, l'organite « centrale énergétique » a perdu la plupart de ses plus de 2 000 gènes, probablement au profit du noyau. Il en reste encore une poignée - selon l'organisme - mais la question est de savoir pourquoi. Une explication, dit un mathématicien et biologiste qui a analysé la perte de gènes dans les mitochondries au cours de l'évolution, est que l'ADN mitochondrial est trop important pour être codé à l'intérieur du noyau et a donc évolué pour résister à l'environnement dommageable à l'intérieur de la mitochondrie. Leur étude paraît le 18 février dans Systèmes cellulaires.

"Ce n'est pas que les gènes 'perdus' n'existent plus dans de nombreux cas, c'est que le noyau produit les protéines et que les protéines vont dans les mitochondries, mais pourquoi s'embêter à avoir quoi que ce soit dans les mitochondries quand on pourrait tout avoir dans le noyau ?" déclare le co-auteur Ben Williams, chercheur postdoctoral au Whitehead Institute for Biomedical Research. "C'est comme dire que vous avez une bibliothèque centrale avec tous vos livres, mais nous allons en garder 10 hors site dans un hangar qui fuit."

Malgré notre relation à long terme avec les mitochondries, une grande partie de la façon dont nos cellules et ces organites commensaux fonctionnent ensemble est encore mystérieuse et controversée. Nous savons que l'acquisition de mitochondries a peut-être déclenché l'un des événements évolutifs les plus importants de l'histoire en donnant à l'ancêtre commun des eucaryotes (notre royaume de la vie) l'énergie nécessaire pour devenir multicellulaire. Et nous savons que chacune de nos cellules peut posséder des dizaines ou des centaines de mitochondries, qui sont essentielles pour tout alimenter, de nos muscles à notre cerveau. Mais ce qui est étrange, c'est que dans presque tous les organismes multicellulaires, les mitochondries sont restées indépendantes en conservant quelques gènes vitaux - malgré le fait qu'il peut être plus sûr pour la cellule de stocker ces gènes dans le noyau.

Pour comprendre ce qui rend les quelques gènes des mitochondries si essentiels, Williams et l'auteur principal Iain Johnston, chercheur à l'Université de Birmingham, ont pris toutes les données générées sur les gènes mitochondriaux et les ont jetées dans un ordinateur. Après quelques semaines, avec l'algorithme développé par Johnston, l'ordinateur a repoussé une chronologie de la perte de gènes mitochondriaux au cours de l'histoire de l'évolution.

"Les hypothèses sous-jacentes aux raisons potentielles pour lesquelles les mitochondries conservent leurs propres gènes sont débattues depuis des décennies, et il s'agit de la première approche basée sur les données pour répondre à cette question", a déclaré Johnston. "Cela est facilité par le fait qu'il existe des milliers de génomes mitochondriaux provenant d'un ensemble très diversifié de taxons disponibles, nous pouvons donc maintenant exploiter les données et les laisser parler d'elles-mêmes."

L'analyse a révélé que les gènes qui sont retenus dans les mitochondries sont liés à la construction de la structure interne de l'organite, risquent sinon d'être égarés par la cellule, et l'ADN de ces gènes utilise un modèle très ancien qui permet à l'ADN mitochondrial de fortement lier ensemble et résister à la rupture. Williams et Johnston pensent que cette conception, que l'on ne trouve généralement pas dans notre propre ADN, est probablement ce qui empêche les gènes mitochondriaux de se séparer pendant la production d'énergie mitochondriale.

Au fur et à mesure que l'énergie est produite dans les mitochondries, sous forme d'ATP, des radicaux libres sont émis - les mêmes radicaux libres qui sont un sous-produit courant des radiations. En substance, la puissance produite par les mitochondries s'accompagne d'une certaine destruction, et il se pourrait que les mitochondries soient capables de résister à ces dommages. "Vous avez besoin de spécialistes capables de travailler dans cet environnement ridiculement extrême, car le noyau n'est pas nécessairement le meilleur ajustement", explique Williams.

Les enquêteurs ont également observé que la perte de gènes mitochondriaux qui s'est produite dans le royaume eucaryote a suivi le même schéma. C'est une leçon que l'évolution peut suivre le même chemin plusieurs fois, et ce n'est pas toujours ce processus entièrement aléatoire. Dans l'environnement cellulaire, l'évolution de la perte de gènes mitochondriaux est devenue presque prévisible entre différents organismes. "Si nous pouvons exploiter les données sur ce que l'évolution a fait dans le passé et faire des déclarations prédictives sur la prochaine étape, la possibilité d'explorer la biologie synthétique et les maladies est énorme", déclare Johnston.

À l'aide de leur algorithme, le duo prévoit ensuite d'explorer les raisons des chloroplastes ainsi que les endroits où les maladies mitochondriales, qui sont souvent assez dévastatrices, s'intègrent dans cette image plus large. Bien que cette étude ne ferme pas la porte sur la raison pour laquelle nous avons encore de l'ADN mitochondrial, les auteurs disent qu'elle trouve un terrain d'entente pour de nombreux arguments différents dans le débat.

Systèmes cellulaires, Johnston et Williams : « L'inférence évolutive entre les eucaryotes identifie de multiples pressions favorisant la rétention du gène de l'ADNmt » http://dx. est ce que je. org/ 10. 1016/ j. cellules. 2016. 01. 013

Systèmes cellulaires (@CellSystemsCP), publié par Cell Press, est une revue mensuelle présentant des articles qui fournissent, soutiennent ou appliquent une compréhension au niveau des systèmes dans les sciences de la vie et les disciplines connexes. La recherche décrit les nouvelles découvertes, les réalisations marquantes, la recherche appliquée, les résultats translationnels, les outils ou ressources largement utiles, ou les informations sur l'utilisation de la technologie. Pour plus d'informations, veuillez visiter http://www. cellule. com/cell-systems. Pour recevoir les alertes médias de Cell Press, contactez [email protected]

Clause de non-responsabilité: AAAS et EurekAlert ! ne sont pas responsables de l'exactitude des communiqués de presse publiés sur EurekAlert! par les institutions contributrices ou pour l'utilisation de toute information via le système EurekAlert.


Qui sont les leaders dans ce domaine ? Que font-ils?

Les scientifiques à la pointe de la révolution informatique de l'ADN sont en effet une race brillante. Tout a commencé par un professeur d'informatique à l'USC du nom de Leonard M. Adleman, qui a utilisé l'ADN recombinant pour résoudre un problème de chemin hamiltonien simple qui est classé comme NP-complet. Son article dans le numéro de novembre 1994 du magazine Science, Molecular Computations of Solutions to Combinatorial Problems, a déclenché la vague actuelle d'intérêt pour le calcul moléculaire. Le problème du chemin hamiltonien, à grande échelle, est effectivement insoluble par les systèmes informatiques conventionnels (c'est théoriquement possible, mais cela prendrait un certain temps extrêmement Longtemps).

Son travail a été repris par le Dr Donald Beaver, entre autres, qui a analysé l'approche et l'a organisé en une page Web très accessible qui comprend une bibliographie concise annotée. L'un des principaux contributeurs à cette page est le groupe de recherche du Dr Richard Lipton, Dan Boneh et Christopher Dunworth, professeur d'informatique et deux étudiants diplômés de l'Université de Princeton. Ils utilisent actuellement un ordinateur ADN pour briser la norme de cryptage des données (DES) du gouvernement, comme décrit dans l'article Briser le DES à l'aide d'un ordinateur moléculaire.


23.2 : Régulation des gènes : Eucaryote

Comme nous l'avons mentionné précédemment, la réglementation est une question de prise de décision. La régulation des gènes, en tant que sujet général, est liée à la prise de décisions concernant l'expression fonctionnelle du matériel génétique. Que le produit final soit une espèce d'ARN ou une protéine, la production du produit final exprimé nécessite des processus qui prennent plusieurs étapes. Nous avons passé un certain temps à discuter de certaines de ces étapes (c'est-à-dire de la transcription et de la traduction) et de certains des mécanismes que la nature utilise pour détecter les informations cellulaires et environnementales afin de réguler l'initiation de la transcription.

Lorsque nous avons discuté du concept de promoteurs forts et faibles, nous avons introduit l'idée que la régulation de la quantité (nombre de molécules) de transcrit produit à partir d'un promoteur dans une certaine unité de temps pourrait également être importante pour la fonction. Cela ne devrait pas être tout à fait surprenant. Pour un gène codant pour une protéine, plus il y a de transcrit produit, plus il y a de potentiel pour fabriquer plus de protéines. Cela peut être important dans les cas où la production d'une grande quantité d'une enzyme particulière est essentielle à la survie. En revanche, dans d'autres cas, seule une petite quantité de protéines est nécessaire et en faire trop serait un gaspillage de ressources cellulaires. Dans ce cas, de faibles niveaux de transcription pourraient être préférés. Des promoteurs de forces différentes peuvent répondre à ces besoins variés. En ce qui concerne le nombre de transcrits, nous avons également brièvement mentionné que la synthèse n'est pas le seul moyen de réguler l'abondance. Les processus de dégradation sont également importants à considérer.

Dans cette section, nous ajoutons à ces thèmes en nous concentrant sur les processus de régulation eucaryotes. Plus précisément, nous examinons - et réexaminons parfois - certaines des multiples étapes nécessaires à l'expression du matériel génétique chez les organismes eucaryotes dans le contexte de la régulation. Nous voulons que vous pensiez non seulement aux processus, mais aussi que vous reconnaissiez que chaque étape du processus d'expression est également l'occasion d'affiner non seulement l'abondance d'un transcrit ou d'une protéine, mais également son état fonctionnel, sa forme (ou variante), et/ou stabilité. Chacun de ces facteurs supplémentaires peut également être d'une importance vitale à prendre en compte pour influencer l'abondance de variantes fonctionnelles conditionnellement spécifiques.

Différences structurelles entre les cellules bactériennes et eucaryotes influençant la régulation des gènes

La marque distinctive de la cellule eucaryote est le noyau, une double membrane qui renferme le matériel héréditaire de la cellule. Afin d'adapter efficacement l'ADN de l'organisme dans l'espace confiné du noyau, l'ADN est d'abord emballé et organisé par protéine dans une structure appelée chromatine. Cet emballage de la matière nucléaire réduit l'accès à des parties spécifiques de la chromatine. En effet, certains éléments de l'ADN sont si serrés que la machinerie transcriptionnelle ne peut pas accéder aux sites de régulation comme les promoteurs. Cela signifie que l'un des premiers sites de régulation transcriptionnelle chez les eucaryotes doit être le contrôle d'accès à l'ADN lui-même. Les protéines de la chromatine peuvent être soumises à des modifications enzymatiques qui peuvent influencer si elles se lient étroitement (accès transcriptionnel limité) ou plus lâchement (accès transcriptionnel plus important) à un segment d'ADN. Ce processus de modification - quelle que soit la direction considérée en premier - est réversible. Par conséquent, l'ADN peut être séquestré de manière dynamique et rendu disponible lorsque le "temps est venu".

La régulation de l'expression des gènes chez les eucaryotes implique également certains des mêmes mécanismes fondamentaux supplémentaires discutés dans le module sur la régulation bactérienne (c'est-à-dire l'utilisation de promoteurs forts ou faibles, de facteurs de transcription, de terminateurs, etc.), mais le nombre réel de protéines impliquées est généralement beaucoup plus plus grande chez les eucaryotes que les bactéries ou les archées.

Le traitement enzymatique post-transcriptionnel de l'ARN qui se produit dans le noyau et l'exportation de l'ARNm mature vers le cytosol sont deux différences supplémentaires entre la régulation des gènes bactériens et eucaryotes. Nous examinerons ce niveau de réglementation plus en détail ci-dessous.

Représentation de certaines différences clés entre les processus d'expression des gènes bactériens et eucaryotes. Notez dans ce cas la présence d'histones et de modificateurs d'histones, l'épissage du pré-ARNm et l'exportation de l'ARN mature du noyau en tant que différenciateurs clés entre les systèmes bactérien et eucaryote.
Attribution : Marc T. Facciotti (propre œuvre)

Emballage d'ADN et marqueurs épigénétiques

L'ADN des cellules eucaryotes est précisément enroulé, plié et compacté en chromosomes afin qu'il s'insère dans le noyau. Il est également organisé de manière à ce que des segments spécifiques des chromosomes soient facilement accessibles selon les besoins de la cellule. Les zones des chromosomes qui sont plus étroitement compactées seront plus difficiles à lier pour les protéines et conduiront donc à une expression génique réduite des gènes codés dans ces zones. Les régions du génome qui sont peu compactées seront plus faciles d'accès pour les protéines, augmentant ainsi la probabilité que le gène soit transcrit. On discute ici des façons dont les cellules régulent la densité de compactage de l'ADN.

Emballage d'ADN

Le premier niveau d'organisation, ou d'emballage, est l'enroulement des brins d'ADN autour des protéines. Les histones conditionnent et ordonnent l'ADN en unités structurelles appelées , qui peuvent contrôler l'accès des protéines à des régions spécifiques de l'ADN. Au microscope électronique, cet enroulement d'ADN autour des protéines histones pour former des nucléosomes ressemble à de petites billes sur une ficelle. Ces billes (complexes de nucléosomes) peuvent se déplacer le long de la chaîne (ADN) pour modifier les zones de l'ADN accessibles à la machinerie transcriptionnelle. Alors que les nucléosomes peuvent se déplacer pour ouvrir la structure chromosomique pour exposer un segment d'ADN, ils le font de manière très contrôlée.

L'ADN est replié autour des protéines histones pour créer (a) des complexes de nucléosomes. Ces nucléosomes contrôlent l'accès des protéines à l'ADN sous-jacent. Lorsqu'ils sont observés au microscope électronique (b), les nucléosomes ressemblent à des perles sur une ficelle. (crédit &ldquomicrograph&rdquo : modification du travail par Chris Woodcock)

Modification des histones

La façon dont les protéines histones se déplacent dépend des signaux chimiques trouvés à la fois sur les protéines histones et sur l'ADN. Ces signaux chimiques sont des marqueurs chimiques ajoutés aux protéines histones et à l'ADN qui indiquent aux histones si une région chromosomique doit être "ouverte" ou "fermée". La figure ci-dessous illustre les modifications apportées aux protéines histones et à l'ADN. Ces balises ne sont pas permanentes, mais peuvent être ajoutées ou supprimées au besoin. Ce sont des modifications chimiques (groupes phosphate, méthyle ou acétyle) qui sont attachées à des acides aminés spécifiques dans les protéines histones ou aux nucléotides de l'ADN. Les balises ne modifient pas la séquence de base de l'ADN, mais elles modifient le degré d'enroulement de l'ADN autour des protéines histones.L'ADN est une molécule chargée négativement, par conséquent, les changements dans la charge de l'histone changeront la façon dont la molécule d'ADN sera étroitement enroulée. Lorsqu'elles ne sont pas modifiées, les protéines histones ont une grande charge positive en ajoutant des modifications chimiques comme des groupes acétyle, la charge devient moins positive.

Les nucléosomes peuvent glisser le long de l'ADN. Lorsque les nucléosomes sont étroitement espacés (en haut), les facteurs de transcription ne peuvent pas se lier et l'expression des gènes est désactivée. Lorsque les nucléosomes sont très espacés (en bas), l'ADN est exposé. Les facteurs de transcription peuvent se lier, permettant à l'expression des gènes de se produire. Les modifications des histones et de l'ADN affectent l'espacement des nucléosomes.

Pourquoi les protéines histones ont-elles normalement une grande quantité de charges positives (les histones contiennent un nombre élevé d'acides aminés de lysine). La suppression des charges positives provoquerait-elle un resserrement ou un relâchement de l'interaction histone-ADN ?

Prédire l'état des histones dans les zones du génome qui sont transcrites régulièrement. En quoi ces zones diffèrent-elles des zones qui ne connaissent pas des niveaux élevés de transcription ?

Modification de l'ADN

La molécule d'ADN elle-même peut également être modifiée. Cela se produit dans des régions très spécifiques appelées îlots CpG. Ce sont des tronçons avec une fréquence élevée de paires d'ADN dinucléotidiques (CG) de cytosine et de guanine que l'on trouve souvent dans les régions promotrices des gènes. Lorsque cette configuration existe, le membre cytosine de la paire peut être méthylé (un groupe méthyle est ajouté). Cette modification change la façon dont l'ADN interagit avec les protéines, y compris les protéines histones qui contrôlent l'accès à la région. Les régions d'ADN hautement méthylées (hyperméthylées) avec des histones désacétylées sont étroitement enroulées et transcriptionnellement inactives.

Les changements épigénétiques n'entraînent pas de changements permanents dans la séquence d'ADN. Les changements épigénétiques modifient la structure de la chromatine (complexe protéine-ADN) pour autoriser ou interdire l'accès à la transcription des gènes. La modification de l'ADN telle que la méthylation sur les nucléotides de la cytosine peut soit recruter des protéines répresseurs qui bloquent l'accès de l'ARN polymérase pour transcrire un gène, soit aider à compacter l'ADN pour bloquer l'accès de toutes les protéines à cette zone du génome. Ces changements sont réversibles alors que les mutations ne le sont pas, cependant, les changements épigénétiques du chromosome peuvent également être hérités.
Source : modifié à partir de https://researcherblogski.wordpress. r/dudiwarsito/

La régulation de l'expression des gènes par le remodelage de la chromatine est appelée régulation épigénétique. L'épigénétique signifie "autour de la génétique". Au lieu de cela, ces changements sont temporaires (bien qu'ils persistent souvent à travers plusieurs cycles de division cellulaire et peuvent être hérités) et modifient la structure chromosomique (ouverte ou fermée) selon les besoins.

Regardez cette vidéo qui décrit comment la régulation épigénétique contrôle l'expression des gènes.

Structure des gènes eucaryotes et traitement de l'ARN

Structure du gène eucaryote

De nombreux gènes eucaryotes, en particulier ceux codant pour des produits protéiques, sont codés sur le génome. C'est-à-dire que la région codante est brisée en morceaux en intervenant des éléments de gène non codants. Les régions codantes sont appelées tandis que les éléments non codants intermédiaires sont appelés . La figure ci-dessous représente un gène eucaryote générique.

Les parties d'un gène eucaryote discontinu typique. Attribution : Marc T. Facciotti (propre œuvre)

Les parties d'un gène eucaryote générique comprennent des éléments familiers comme un promoteur et un terminateur. Entre ces deux éléments, la région codant pour tous les éléments du gène qui ont le potentiel d'être traduits (ils n'ont pas de codons d'arrêt), comme dans les systèmes bactériens, est appelée le cadre de lecture ouvert (ORF). Les éléments activateurs et/ou silencieux sont des régions de l'ADN qui servent à recruter des protéines régulatrices. Ceux-ci peuvent être relativement proches du promoteur, comme dans les systèmes bactériens, ou à des milliers de nucléotides. Également présentes dans de nombreux transcrits bactériens, des régions non traduites 5' et 3' (UTR) existent également. Ces régions du gène codent pour des segments du transcrit, qui, comme leurs noms l'indiquent, ne sont pas traduits et se situent respectivement en 5' et 3' de l'ORF. Les UTR codent généralement pour certains éléments régulateurs essentiels à la régulation de la transcription ou des étapes de l'expression génique qui se produisent après la transcription.

Les espèces d'ARN résultant de la transcription de ces gènes sont également discontinues et doivent donc être traitées avant de sortir du noyau pour être traduites ou utilisées dans le cytosol en tant qu'ARN matures. Dans les systèmes eucaryotes, cela comprend l'épissage de l'ARN, le coiffage 5', le clivage de l'extrémité 3' et la polyadénylation. Cette série d'étapes est un processus moléculaire complexe qui doit se produire dans les limites fermées du noyau. Chacune de ces étapes permet de réguler l'abondance des transcrits exportés et les formes fonctionnelles que ces transcrits prendront. Bien qu'il s'agisse de sujets pour des cours plus avancés, réfléchissez à la manière d'encadrer certains des sujets suivants en tant que sous-problèmes du défi de conception de la régulation génétique. À tout le moins, commencez à apprécier la danse moléculaire hautement orchestrée qui doit se produire pour exprimer un gène et à quel point il s'agit d'un morceau étonnant d'ingénierie évolutive.

Plafonnement 5'

Comme dans les systèmes bactériens, les systèmes eucaryotes doivent assembler un complexe de pré-initiation au niveau et autour de la séquence promotrice pour initier la transcription. Les complexes qui s'assemblent chez les eucaryotes remplissent en grande partie la même fonction que ceux des systèmes bactériens, mais ils sont nettement plus complexes, impliquant beaucoup plus de protéines régulatrices. Cette complexité supplémentaire permet un plus grand degré de régulation et pour l'assemblage de protéines avec des fonctions qui se produisent principalement dans les systèmes eucaryotes. L'une de ces fonctions supplémentaires est le "coiffage" des transcrits naissants.

Dans les gènes codant pour les protéines eucaryotes, l'ARN produit en premier est appelé pré-ARNm. Le préfixe "pré" signifie que ce n'est pas l'ARNm complètement mature qui sera traduit et qu'il nécessite d'abord un traitement. La modification connue sous le nom de 5'-coiffage se produit après que le pré-ARNm ait une longueur d'environ 20 à 30 nucléotides. À ce stade, le pré-ARN reçoit généralement sa première modification post-transcriptionnelle, une coiffe 5'. Le "cap" est une modification chimique - une 7-méthylguanosine - dont l'ajout à l'extrémité 5' du transcrit est catalysé enzymatiquement par plusieurs enzymes appelées le complexe enzymatique de coiffage (CEC), un groupe d'enzymes multiples qui effectuent des étapes séquentielles impliquées dans l'ajout du 5'-cap. Le CEC se lie à l'ARN polymérase très tôt dans la transcription et effectue une modification du 5' triphosphate, le transfert ultérieur de au GTP à cette fin (reliant les deux nucléotides à l'aide d'une liaison 5'-to-5' unique), le la méthylation de la guanine nouvellement transférée et, dans certains transcrits, les modifications supplémentaires des premiers nucléotides. Cette coiffe 5' semble fonctionner en protégeant le transcrit émergent de la dégradation et est rapidement liée par des protéines de liaison à l'ARN connues sous le nom de complexe de liaison à la coiffe (CBC). Il existe des preuves que cette modification et les protéines qui y sont liées jouent un rôle dans le ciblage du transcrit pour l'exportation à partir du noyau. Protéger l'ARN naissant de la dégradation n'est pas seulement important pour conserver l'énergie investie dans la création du transcrit, mais est clairement impliqué dans la régulation de l'abondance du transcrit entièrement fonctionnel qui est produit. De plus, le rôle du capuchon 5' dans le guidage du transcrit pour l'exportation aidera directement à réguler non seulement la quantité de transcrit qui est produite mais, peut-être plus important encore, la quantité de transcrit qui est exportée vers le cytoplasme qui a le potentiel à traduire.

La structure d'une coiffe typique de 7-méthylguanylate. Attribution : Marc T. Facciotti (propre œuvre)

Épissage de transcription

Les transcrits naissants doivent être transformés en ARN matures en joignant les exons et en supprimant les introns intermédiaires. Ceci est accompli par un complexe à plusieurs composants d'ARN et de protéines appelé spliceosome. Le complexe spliceosome s'assemble sur le transcrit naissant et, dans de nombreux cas, les décisions concernant les introns à combiner en un transcrit mature sont prises à ce stade. La façon dont ces décisions sont prises n'est pas encore complètement comprise, mais implique la reconnaissance de séquences d'ADN spécifiques aux sites d'épissage par des espèces d'ARN et de protéines et plusieurs événements catalytiques. Il est intéressant de noter que la partie catalytique du spliceosome est constituée d'ARN plutôt que de protéines. Rappelons que le ribosome est un autre exemple de complexe ARN-protéine où l'ARN sert de composant catalytique primaire. Le choix du variant d'épissage à réaliser est une forme de régulation de l'expression des gènes. Dans ce cas, plutôt que d'influencer simplement l'abondance d'un transcrit, l'épissage alternatif permet à la cellule de prendre des décisions sur la forme de transcrit à réaliser.

Les formes d'épissage alternatives des gènes qui donnent lieu à des produits protéiques de structure apparentée mais de fonction variable sont connues sous le nom de . La création d'isoformes est courante dans les systèmes eucaryotes et est connue pour être importante à différents stades de développement dans les organismes multicellulaires et dans la définition des fonctions de différents types cellulaires. En codant plusieurs produits géniques possibles à partir d'un seul gène dont l'initiation de la transcription est codée à partir d'un seul site de régulation transcriptionnelle (en décidant quel produit final produire de manière post-transcriptionnelle) évite la nécessité de créer et de maintenir des copies indépendantes de chaque gène dans différentes parties du génome et des sites de régulation indépendants en évolution. Par conséquent, la capacité de former plusieurs isoformes à partir d'une seule région codante est considérée comme avantageuse sur le plan de l'évolution car elle permet une certaine efficacité dans le codage de l'ADN, minimise la complexité de la régulation transcriptionnelle et peut réduire la charge énergétique liée au maintien de plus d'ADN et à sa protection contre les mutations. Quelques exemples de résultats possibles de l'épissage alternatif peuvent inclure : la génération de variantes enzymatiques avec une affinité de substrat ou des taux catalytiques différentiels les séquences de signal qui ciblent les protéines vers divers compartiments sous-cellulaires peuvent être modifiées des fonctions entièrement nouvelles, via l'échange de domaines protéiques peuvent être créées . Ce ne sont que quelques exemples.

Un autre résultat possible intéressant de l'épissage alternatif est l'introduction de codons stop qui peuvent, par un mécanisme qui semble nécessiter une traduction, conduire à la désintégration ciblée du transcrit. Cela signifie qu'en plus du contrôle de l'initiation de la transcription et du coiffage 5', l'épissage alternatif peut également être considéré comme l'un des mécanismes régulateurs pouvant influencer l'abondance des transcrits. Les effets de l'épissage alternatif sont donc potentiellement larges - de la perte complète de la fonction à la fonction nouvelle et diversifiée aux effets régulateurs.

Une figure illustrant certains des différents modes d'épissage alternatif illustrant comment différentes variantes d'épissage peuvent conduire à différentes formes de protéines.
Attribution : Marc T. Facciotti (propre œuvre)

Clivage de l'extrémité 3' et polyadénylation

Une dernière modification est apportée aux pré-ARNm naissants avant qu'ils ne quittent le noyau - le clivage de l'extrémité 3' et sa polyadénylation. Ce processus en deux étapes est catalysé par deux enzymes différentes (comme illustré ci-dessous) et peut décorer l'extrémité 3' des transcrits avec jusqu'à près de 200 nucléotides. Cette modification améliore la stabilité du transcrit. En règle générale, plus l'As dans l'étiquette polyA est élevé, plus la durée de vie du transcrit est longue. Le tag polyA semble également jouer un rôle dans l'export du transcrit à partir du noyau. Par conséquent, l'étiquette polyA 3' joue un rôle dans l'expression des gènes en régulant l'abondance des transcrits fonctionnels et la quantité exportée du noyau pour la traduction.

Un processus en deux étapes est impliqué dans la modification des extrémités 3' des transcrits avant les exportations nucléaires. Il s'agit notamment de couper des transcrits juste en aval d'une séquence conservée (AAUAAA) et de transférer des groupes adénylates. Les deux processus sont catalysés par voie enzymatique.
Attribution : Marc T. Facciotti (propre œuvre)

MicroARN

Stabilité de l'ARN et microARN

En plus des modifications du pré-ARN décrites ci-dessus et des protéines associées qui se lient au naissant et aux transcrits, il existe d'autres facteurs qui peuvent influencer la stabilité de l'ARN dans la cellule. Un exemple sont les éléments appelés microARN. Les microARN, ou miARN, sont de courtes molécules d'ARN qui ne mesurent que 21&ndash24 nucléotides. Les miARN sont transcrits dans le noyau en tant que pré-miARN plus longs. Ces pré-miARN sont ensuite découpés en miARN matures par une protéine appelée dicer. Ces miARN matures reconnaissent une séquence spécifique d'un ARN cible par appariement de bases complémentaires. Les miARN, cependant, s'associent également à un complexe ribonucléoprotéique appelé complexe de silençage induit par l'ARN (RISC). RISC lie un ARNm cible, ainsi que le miARN, pour dégrader l'ARNm cible. Ensemble, les miARN et le complexe RISC détruisent rapidement la molécule d'ARN. Comme on pouvait s'y attendre, la transcription des pré-miARN et leur traitement ultérieur sont également étroitement régulés.

Exportation nucléaire

Exportation nucléaire

Les transcrits matures entièrement traités doivent être exportés à travers le noyau. Il n'est pas surprenant que ce processus implique la coordination d'une espèce d'ARN mature à laquelle sont liées de nombreuses protéines accessoires - dont certaines ont été intimement impliquées dans les modifications décrites ci-dessus - et un complexe protéique appelé . Le transport à travers le NPC permet au flux de protéines et d'espèces d'ARN de se déplacer dans les deux sens et est médié par un certain nombre de protéines. Ce processus peut être utilisé pour réguler sélectivement le transport de divers transcrits en fonction des protéines associées au transcrit en question. Cela signifie que tous les transcrits ne sont pas traités de la même manière par le NPC - en fonction de l'état de modification et des protéines associées à une espèce spécifique d'ARN, ils peuvent être déplacés plus ou moins efficacement à travers la membrane nucléaire. Étant donné que le taux de mouvement à travers le pore influencera l'abondance du transcrit mature qui est exporté dans le cytosol pour le contrôle de l'exportation de la traduction, c'est un autre exemple d'étape dans le processus de régulation génique qui peut être modulée. De plus, des recherches récentes ont impliqué des interactions entre le NPC et les facteurs de transcription dans la régulation de l'initiation de la transcription, probablement par le biais d'un mécanisme par lequel les facteurs de transcription s'attachent aux pores nucléaires. Ce dernier exemple montre à quel point la régulation de l'expression des gènes est interconnectée à travers les multiples étapes de ce processus complexe.

De nombreux détails supplémentaires des processus décrits ci-dessus sont connus à un certain niveau de détail, mais de nombreuses autres questions restent sans réponse. Pour le bien de Bis2a, il suffit de commencer à former un modèle des étapes qui se produisent dans la production d'un transcrit mature dans les organismes eucaryotes. Nous avons peint un tableau avec des traits très larges, en essayant de présenter une scène qui reflète ce qui se passe généralement chez tous les eucaryotes. En plus d'apprendre les principales caractéristiques différenciatrices de la régulation des gènes eucaryotes, nous aimerions également que les étudiants de Bis2a commencent à considérer chacune de ces étapes comme une opportunité pour la nature de réguler l'expression des gènes d'une manière ou d'une autre et d'être en mesure de rationaliser la façon dont les déficiences ou les changements dans ces voies - potentiellement introduites par mutation - pourrait influencer l'expression des gènes.

Bien que nous n'ayons pas explicitement évoqué le défi de conception ou l'histoire de l'énergie ici, ces formalismes sont également aptes à vous aider à donner un sens à ce qui est décrit. Nous vous encourageons à essayer de créer une histoire énergétique pour divers processus. Nous vous encourageons également à utiliser la rubrique Design Challenge pour réexaminer les histoires ci-dessus : identifier les problèmes qui doivent être résolus, émettre des hypothèses sur les solutions potentielles et les critères de réussite. Utilisez ces formalismes pour approfondir et poser de nouvelles questions/identifier de nouveaux problèmes ou des choses que vous ne savez pas sur les processus, c'est ce que font les experts. Il y a de fortes chances que cet exercice suggéré vous amène à identifier une direction de recherche que quelqu'un a déjà poursuivie (vous vous sentirez assez intelligent à ce sujet !). Alternativement, vous pouvez soulever une toute nouvelle question à laquelle personne n'a encore pensé.

Contrôle de l'abondance de protéines

Une fois qu'un ARNm a été transporté vers le cytoplasme, il est traduit en protéine. Le contrôle de ce processus dépend en grande partie de la molécule d'ARN. Comme discuté précédemment, la stabilité de l'ARN aura un impact important sur sa traduction en une protéine. Au fur et à mesure que la stabilité change, le temps disponible pour la traduction change également.

Le complexe d'initiation et le taux de traduction

Comme la transcription, la traduction est contrôlée par des complexes protéiques de protéines et d'acides nucléiques qui doivent s'associer pour initier le processus. En traduction, l'un des premiers complexes qui doivent s'assembler pour démarrer le processus est appelé complexe d'initiation. La première protéine à se lier à l'ARNm qui aide à initier la traduction est appelée facteur d'initiation eucaryote-2 (eIF-2). L'activité de la protéine eIF-2 est contrôlée par de multiples facteurs. Le premier est de savoir s'il est ou non lié à une molécule de GTP. Lorsque l'eIF-2 est lié au GTP, il est considéré comme étant sous une forme active. La protéine eIF-2 liée au GTP peut se lier à la petite sous-unité ribosomique 40S. Lorsqu'il est lié, le complexe ribosomal eIF-2/40S, apportant avec lui l'ARNm à traduire, recrute également les associés d'ARNt initiateur de la méthionine. À ce stade, lorsque le complexe initiateur est assemblé, le GTP est hydrolysé en GDP créant une « forme quotinactive d'eIF-2 qui est libérée, avec le phosphate inorganique, du complexe. Cette étape, à son tour, permet à la grande sous-unité ribosomique 60S de se lier et de commencer à traduire l'ARN. La liaison de eIF-2 à l'ARN est en outre contrôlée par la phosphorylation des protéines. Lorsque eIF-2 est phosphorylé, il subit un changement de conformation et ne peut pas se lier au GTP, inhibant ainsi la formation du complexe d'initiation - la traduction est donc inhibée (voir la figure ci-dessous). A l'état déphosphorylé, eIF-2 peut se lier au GTP et permettre l'assemblage du complexe d'initiation de la traduction comme décrit ci-dessus. La capacité de la cellule à ajuster l'assemblage du complexe d'invitation à la traduction via une modification chimique réversible (phosphorylation) à une protéine régulatrice est un autre exemple de la façon dont la nature a profité de cette étape apparemment simple pour ajuster l'expression des gènes.

Une augmentation des niveaux de phosphorylation d'eIF-2 a été observée chez des patients atteints de maladies neurodégénératives telles que Alzheimer, Parkinson et Huntington. Quel impact pensez-vous que cela pourrait avoir sur la synthèse des protéines?

Modifications chimiques, activité protéique et longévité

Pour ne pas être surpassées par les acides nucléiques, les protéines peuvent également être modifiées chimiquement avec l'ajout de groupes comprenant des groupes méthyle, phosphate, acétyle et ubiquitine. L'ajout ou l'élimination de ces groupes des protéines peut réguler leur activité ou la durée de leur existence dans la cellule. Parfois, ces modifications peuvent réguler l'endroit où une protéine se trouve dans la cellule, par exemple, dans le noyau, le cytoplasme ou attachée à la membrane plasmique.

Des modifications chimiques peuvent se produire en réponse à des stimuli externes tels que le stress, le manque de nutriments, la chaleur ou l'exposition à la lumière ultraviolette. En plus de réguler la fonction des protéines elles-mêmes, si ces changements se produisent sur des protéines spécifiques, ils peuvent altérer l'accessibilité épigénétique (dans le cas de la modification des histones), la transcription (facteurs de transcription), la stabilité de l'ARNm (protéines de liaison à l'ARN) ou la traduction (eIF -2) alimentant ainsi et régulant diverses parties du processus d'expression des gènes. Dans le cas d'une modification des protéines régulatrices, cela peut être un moyen efficace pour la cellule de modifier rapidement les niveaux de protéines spécifiques en réponse à l'environnement en régulant diverses étapes du processus.

L'ajout d'un groupe ubiquitine a une autre fonction - il marque cette protéine pour la dégradation. L'ubiquitine est une petite molécule qui agit comme un drapeau indiquant que les protéines marquées doivent être ciblées sur un organite appelé protéasome. Cet organite est un grand complexe multiprotéique qui fonctionne pour cliver les protéines en morceaux plus petits qui peuvent ensuite être recyclés. L'ubiquitination (l'ajout d'un tag ubiquitine), permet donc de contrôler l'expression des gènes en modifiant la durée de vie fonctionnelle du produit protéique.

Les protéines avec des étiquettes d'ubiquitine sont marquées pour la dégradation dans le protéasome.


Concepts clés et résumé

  • Tout le contenu génétique d'une cellule est son génome.
  • Gènes code pour des protéines, ou molécules d'ARN stables, dont chacune remplit une fonction spécifique dans la cellule.
  • Bien que le génotype qu'une cellule possède reste constante, l'expression des gènes dépend des conditions environnementales.
  • UNE phénotype est les caractéristiques observables d'une cellule (ou d'un organisme) à un instant donné et résulte du complément de gènes actuellement utilisé.
  • La majorité du matériel génétique est organisé en chromosomes qui contiennent l'ADN qui contrôle les activités cellulaires.
  • Les procaryotes sont généralement haploïdes, ayant généralement un seul chromosome circulaire trouvé dans le nucléoïde. Les eucaryotes sont un ADN diploïde organisé en plusieurs chromosomes linéaires trouvés dans le noyau.
  • Le superenroulement et l'emballage d'ADN à l'aide de protéines de liaison à l'ADN permettent à de longues molécules de s'adapter à l'intérieur d'une cellule. Les eucaryotes et les archées utilisent des protéines histones, et les bactéries utilisent des protéines différentes ayant une fonction similaire.
  • Les génomes procaryotes et eucaryotes contiennent tous deux ADN non codant, dont la fonction n'est pas bien comprise. Certains ADN non codants semblent participer à la formation de petites molécules d'ARN non codantes qui influencent l'expression des gènes, certains semblent jouer un rôle dans le maintien de la structure chromosomique et dans l'encapsidation de l'ADN.
  • ADN extrachromosomique chez les eucaryotes comprend les chromosomes trouvés dans les organites d'origine procaryote (mitochondries et chloroplastes) qui ont évolué par endosymbiose. Certains virus peuvent également se maintenir extrachromosomiquement.
  • L'ADN extrachromosomique chez les procaryotes est généralement maintenu comme plasmides qui codent pour quelques gènes non essentiels qui peuvent être utiles dans des conditions spécifiques. Les plasmides peuvent se propager à travers une communauté bactérienne par transfert horizontal de gènes.
  • Les génomes viraux présentent des variations importantes et peuvent être composés d'ARN ou d'ADN, et peuvent être soit doubles, soit simple brin.

Pourquoi presque tout dans la nature est-il symétrique ?

L'explication évolutionniste est qu'il a rarement l'avantage d'être asymétrique. Si votre jambe gauche était plus longue que votre jambe droite, par exemple, vous manqueriez de Mank. Et c'est d'une esthétique "naturelle" que l'on trouve les visages symétriques plus beaux que les visages asymétriques. Après tout, l'asymétrie peut être causée par une blessure ou une infection dans une partie du visage. Les personnes aux visages symétriques ont donc plus de choix de partenaires et ont donc des enfants plus nombreux et/ou en meilleure santé. Il en va de même pour de nombreux autres animaux.

De plus, si la symétrie n'a pas d'inconvénients majeurs, c'est la valeur par défaut car il est génétiquement et embryonnairement moins cher de construire un corps symétrique. Car pour coder la recette de la construction d'un corps symétrique dans l'ADN, il suffit de décrire la moitié du corps . Ainsi, un corps asymétrique nécessiterait un génome plus grand, ce qui nécessiterait plus de production d'ADN, et une plus grande probabilité que quelque chose se passe mal.

Là où l'asymétrie a un grand avantage, par exemple dans la structure du cœur et du système digestif, nous sommes effectivement asymétriques. Mais il doit y avoir une bonne raison. Les constructeurs de machines, les constructeurs de meubles, etc. choisissent également la symétrie s'il n'y a aucune bonne raison de ne pas le faire. Pour à peu près les mêmes raisons.

Pourtant, l'argument ci-dessus n'est pas convaincant, et nous devons y réfléchir plus profondément. Il existe un livre très intéressant écrit sur ce sujet : Main droite, main gauche. Le livre explique pourquoi il est très difficile de décrire un corps asymétrique dans l'ADN. . Il commence par cette expérience de pensée :

Imaginez entrer en contact radio avec une civilisation extraterrestre. Vous leur parlez de choses que vous avez en commun, comme les mathématiques et les matières premières. Il y a cependant une règle du jeu : vous ne pouvez pas vous référer à des choses que les extraterrestres peuvent également voir, comme des images d'étoiles spécifiques. Seulement à la connaissance universelle.

Vous pouvez expliquer aux extraterrestres ce que vous savez dans “future” et “past”.”Above” et “down” est également un succès. Mais “gauche” et “droit”? Vous pouvez peut-être expliquer ce que signifie la dialectique gauche/droite, mais vous ne pouvez pas distinguer “left” de “right”. Vous pouvez en choisir un pour nommer “Glubs” et l'autre “zluchts”, mais vous ne pouvez pas expliquer de quel lien il s'agit. Si vous envoyez un plan de construction d'un objet asymétrique aux extraterrestres, vous n'avez aucune garantie qu'ils le construiront comme vous le pensez. Il se peut bien qu'ils en construisent l'image miroir.

Le développement d'un embryon pose le même problème. Un utérus symétrique peut construire des structures asymétriques, mais pour chaque composant, il y a 50 % de chances d'obtenir une image miroir. Un corps asymétrique présente donc un risque très élevé de malformations congénitales.

Le livre interroge alors la question : comment se fait-il que nous ayons encore des organes asymétriques, et effectivement, qu'il n'y ait pas 50/50 de chance d'être gaucher, ou d'avoir un cœur droit ?Très tôt dans l'évolution il y a & #8220choisi” pour le glucose D au lieu du glucose L. Cela aura un impact sur la direction dans laquelle l'ADN s'exécute, et de nombreuses autres structures biochimiques. Sur une autre planète, ce pourrait être l'inverse. Ou peut être pas. Il y a des indications dans les particules physiquement qu'il y a une différence subtile entre la gauche et la droite. Que cette différence soit trop subtile pour influencer le "choix" évolutionnaire entre les molécules de liaison et à rotation droite n'est pas tout à fait clair. Du moins, quand le livre a été écrit.