Informations

Combien de gènes co-exprimés seraient attendus dans un tissu ?

Combien de gènes co-exprimés seraient attendus dans un tissu ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je travaille avec des puces à ADN d'expression de gènes de tissus tumoraux et je souhaite utiliser un programme pour trouver les groupes de gènes co-exprimés afin de savoir si certains gènes particuliers sont co-exprimés avec d'autres gènes et quels gènes sont ceux-là.

Comme je dois le faire pour de nombreuses expériences de microarray et j'ai lu qu'il y a beaucoup de gènes qui ont une expression constante dans un tissu, j'ai classé le gène par sa variabilité (coefficient de variation) qu'ils avaient dans les expériences et garder le premier 3000 gènes pour rechercher leur co-expression. Ensuite, j'ai utilisé un programme (un paquet de bioconducteurs) pour trouver la co-expression.

Maintenant, je m'attendais à trouver plusieurs groupes de gènes (aucune raison particulière pour cela) dans l'expérience que j'utilisais comme exemple, mais au lieu de cela, je ne trouve qu'un groupe de gènes co-exprimés d'environ cent, et le d'autres gènes n'ont pas été co-exprimés.

Ma question est : ce résultat pourrait avoir un sens biologique, ou je fais une terrible erreur quelque part ?, Merci d'avance.


  • Consultez la belle publication de Daniel Ramsköld et al. 2009, qui détient les chiffres de la co-expression généralement attendue.
  • Le niveau spécifique de co-expression, qui s'applique à votre scénario, dépendra de votre tissu, de vos seuils et de votre définition de la co-expression.
  • Si vous recherchez un co-changement de certains gènes sur différents spécimens (plutôt qu'une co-expression), le nombre de gènes qui devraient changer dépendra de la biologie sous-jacente (et empêchera ainsi une réponse générale sans tenir compte des spécificités de votre spécimen) .

Il existe certains groupes de gènes très bien définis que l'on peut s'attendre à voir co-exprimer, par ex. protéines ribosomiques, sous-unités de protéosome, composants d'épissage, sous-unités de VHATPase ; et chacun de ces groupes est co-exprimé dans des circonstances différentes. Il me semble donc que soit vos différents tissus tumoraux (si tel est le cas) sont dans des conditions similaires, vous ne pouvez donc pas différencier ces groupes, soit qu'il y a un problème avec votre analyse.


Identification de réseaux de gènes de co-expression, de gènes régulateurs et de voies pour l'obésité basée sur le séquençage d'ARN de tissu adipeux dans un modèle porcin

L'obésité est une condition métabolique complexe en forte association avec diverses maladies, comme le diabète de type 2, entraînant des implications majeures pour la santé publique et l'économie. L'obésité est le résultat de facteurs environnementaux et génétiques et de leurs interactions, y compris les interactions génétiques à l'échelle du génome. L'identification de gènes co-exprimés et régulateurs dans l'ARN extrait de tissus pertinents représentant des individus maigres et obèses fournit un point d'entrée pour l'identification des gènes et des voies d'importance pour le développement de l'obésité. Le porc, un animal omnivore, est un excellent modèle pour l'obésité humaine, offrant la possibilité d'étudier en profondeur les régulations transcriptomiques de l'obésité au niveau des organes, irréalisables chez l'homme. Notre objectif était de révéler les réseaux de co-expression du tissu adipeux, les voies et les régulations transcriptionnelles de l'obésité en utilisant des approches de biologie systémique basées sur le séquençage d'ARN dans un modèle porcin.

Méthodes

Nous avons sélectionné 36 animaux pour le séquençage de l'ARN à partir d'une population porcine F2 précédemment créée représentant trois groupes extrêmes en fonction de leurs risques génétiques prédits d'obésité. Nous avons appliqué l'analyse de réseau de co-expression de gènes pondérés (WGCNA) pour détecter des grappes de gènes hautement co-exprimés (modules). De plus, des gènes régulateurs ont été détectés à l'aide d'algorithmes Lemon-Tree.

Résultats

WGCNA a révélé cinq modules qui étaient fortement corrélés avec au moins un phénotype lié à l'obésité (corrélations allant de -0,54 à 0,72, P < 0,001). L'annotation fonctionnelle a identifié des voies éclairant l'association entre l'obésité et d'autres maladies, comme l'ostéoporose (différenciation des ostéoclastes, P = 1,4E -7 ), et les complications liées au système immunitaire (par ex. Cytotoxicité médiée par les cellules tueuses naturelles, P = 3,8E -5 Voie de signalisation des récepteurs des cellules B, P = 7,2E -5 ). Lemon-Tree a identifié trois gènes régulateurs potentiels, en utilisant des scores de confiance, pour le module WGCNA qui était associé à différenciation des ostéoclastes: CCR1, MSR1 et SI1 (scores de probabilité respectivement 95,30, 62,28 et 34,58). De plus, la détection de gènes différentiellement connectés a identifié divers gènes précédemment identifiés comme étant associés à l'obésité chez les humains et les rongeurs, par ex. CSF1R et MARC2.

Conclusion

À notre connaissance, il s'agit de la première étude à appliquer des approches de biologie des systèmes utilisant des données de séquençage d'ARN de tissu adipeux porcin dans un modèle porcin génétiquement caractérisé pour l'obésité. Nous avons révélé des réseaux complexes, des voies, des gènes candidats et régulateurs liés à l'obésité, confirmant la complexité de l'obésité et son association avec les troubles immunitaires et l'ostéoporose.


Le regroupement de gènes chez les procaryotes était connu depuis longtemps. Leurs gènes sont regroupés en opérons, les gènes au sein des opérons partagent une unité de promoteur commune. Ces gènes sont pour la plupart fonctionnellement liés. Le génome des procaryotes est relativement très simple et compact. Chez les eucaryotes, le génome est énorme et seule une petite partie de celui-ci est fonctionnellement des gènes, de plus les gènes ne sont pas organisés en opérons. Sauf pour les nématodes et les trypanosomes bien que leurs opérons soient différents des opérons procaryotes. Chez les eucaryotes, chaque gène possède son propre site de régulation de la transcription. Par conséquent, les gènes n'ont pas besoin d'être à proximité pour être co-exprimés. Par conséquent, on a longtemps supposé que les gènes eucaryotes étaient répartis de manière aléatoire dans le génome en raison du taux élevé de réarrangements chromosomiques. Mais parce que la séquence complète des génomes est devenue disponible, il est devenu possible de localiser de manière absolue un gène et de mesurer sa distance par rapport aux autres gènes.

Le premier génome eucaryote jamais séquencé était celui de Saccharomyces cerevisiae, ou levure bourgeonnante, en 1996. Six mois plus tard, Velculescu et al. (1997) ont publié une recherche dans laquelle ils avaient intégré les données SAGE avec la carte du génome désormais disponible. Au cours d'un cycle cellulaire, différents gènes sont actifs dans une cellule. Par conséquent, ils ont utilisé les données SAGE de trois moments du cycle cellulaire (phase log, cellules arrêtées en phase S et cellules arrêtées en phase G2/M). Parce que dans la levure, tous les gènes ont une unité promotrice qui leur est propre, on ne soupçonnait pas que les gènes se regrouperaient les uns à côté des autres, mais ils l'ont fait. Des grappes étaient présentes sur les 16 chromosomes de levure. [2] Un an plus tard, Cho et al. ont également signalé (bien que plus en détail) que certains gènes sont situés à proximité les uns des autres dans la levure. [3]

Co-expression Modifier

Cho et al. ont été les premiers à déterminer que les gènes regroupés ont les mêmes niveaux d'expression. Ils ont identifié des transcrits qui présentent une périodicité dépendante du cycle cellulaire. Parmi ces gènes, 25 % étaient situés à proximité immédiate d'autres gènes qui étaient transcrits dans le même cycle cellulaire. Cohen et al. (2000) ont également identifié des groupes de gènes co-exprimés.

Caron et al. (2001) ont réalisé une carte du transcriptome humain de 12 tissus différents (cellules cancéreuses) et ont conclu que les gènes ne sont pas répartis au hasard sur les chromosomes. Au lieu de cela, les gènes ont tendance à se regrouper en groupes de parfois 39 gènes à proximité immédiate. Les grappes n'étaient pas seulement denses en gènes. Ils ont identifié 27 groupes de gènes avec des niveaux d'expression très élevés et les ont appelés RIDGE. Un RIDGE commun compte 6 à 30 gènes par centiray. Cependant, il y avait de grandes exceptions, 40 à 50% des RIDGE n'étaient pas aussi denses en gènes, tout comme chez la levure, ces RIDGE étaient situés dans les régions des télomères. [1]

Lercher et al. (2002) ont souligné certaines faiblesses dans l'approche de Caron. Des grappes de gènes à proximité et des niveaux de transcription élevés peuvent facilement être générés par des doublons en tandem. Les gènes peuvent générer des doublons d'eux-mêmes qui sont incorporés dans leur voisinage. Ces doublons peuvent soit devenir une partie fonctionnelle de la voie de leur gène parent, soit (car ils ne sont plus favorisés par la sélection naturelle) acquérir des mutations délétères et se transformer en pseudogènes. Étant donné que ces doublons sont des faux positifs dans la recherche de groupes de gènes, ils doivent être exclus. Lercher a exclu les gènes voisins présentant une grande ressemblance entre eux, après quoi il a recherché avec une fenêtre glissante des régions avec 15 gènes voisins. [4]

Il était clair qu'il existait des régions denses en gènes. Il y avait une corrélation frappante entre la densité génétique et une teneur élevée en CG. Certains clusters avaient en effet des niveaux d'expression élevés. Mais la plupart des régions fortement exprimées étaient constituées de gènes de ménage qui sont fortement exprimés dans tous les tissus car ils codent pour les mécanismes basaux. Seule une minorité des clusters contenait des gènes limités à des tissus spécifiques.

Versteeg et al. (2003) ont tenté, avec une meilleure carte du génome humain et de meilleures taqs SAGE, de déterminer les caractéristiques des RIDGEs plus spécifiques. Les gènes chevauchants ont été traités comme un seul gène et les gènes sans intron ont été rejetés comme pseudogènes. Ils ont déterminé que les RIDGE sont très denses en gènes, ont une expression génique élevée, des introns courts, une densité de répétitions SINE élevée et une faible densité de répétitions LINE. Les clusters contenant des gènes avec des niveaux de transcription très faibles avaient des caractéristiques opposées aux RIDGE, c'est pourquoi ces clusters ont été appelés antiridges. [5] Les répétitions LINE sont de l'ADN indésirable qui contient un site de clivage de l'endonucléase (TTTTA). Leur rareté dans les RIDGE peut s'expliquer par le fait que la sélection naturelle favorise la rareté des répétitions LINE dans les ORF car leurs sites d'endonucléases peuvent provoquer des mutations délétères sur les gènes. On ne comprend pas encore pourquoi les répétitions SINE sont abondantes.

Versteeg et al. ont également conclu que, contrairement à l'analyse de Lerchers, les niveaux de transcription de nombreux gènes dans les RIDGE (par exemple un cluster sur le chromosome 9) peuvent varier fortement entre les différents tissus. Lee et al. (2003) ont analysé la tendance du regroupement de gènes entre différentes espèces. ils ont comparé Saccharomyces cerevisiae, Homo sapiens, Caenorhabditis elegans, Arabidopsis thaliana et Drosophila melanogaster, et ont trouvé un degré de clustering, en tant que fraction de gènes dans des clusters lâches, de respectivement (37 %), (50 %) (74 %), (52 %) et (68 %). Ils ont conclu que les voies dont les gènes sont des clusters à travers de nombreuses espèces sont rares. Ils ont trouvé sept voies universellement regroupées : la glycolyse, la biosynthèse d'aminoacyl-ARNt, l'ATP synthase, l'ADN polymérase, la dégradation de l'hexachlorocyclohexane, le métabolisme des acides cyanoaminés et la photosynthèse (synthèse d'ATP chez les espèces non végétales). Il n'est pas surprenant qu'il s'agisse de voies cellulaires de base. [6]

Lee et al. utilisé des groupes d'animaux très divers. Au sein de ces groupes, le regroupement est conservé, par exemple les motifs de regroupement d'Homo sapiens et de Mus musculus sont plus ou moins les mêmes. [7]

Spellman et Rubin (2002) ont réalisé une carte du transcriptome de Drosophile. De tous les gènes analysés, 20 % ont été regroupés. Les clusters se composaient de 10 à 30 gènes sur une taille de groupe d'environ 100 kilobases. Les membres des clusters n'étaient pas fonctionnellement liés et l'emplacement des clusters n'était pas corrélé avec les structures connues de la chromatine. [8]

Cette étude a également montré qu'au sein des clusters, les niveaux d'expression de 15 gènes en moyenne étaient sensiblement les mêmes dans les nombreuses conditions expérimentales utilisées. Ces similitudes étaient si frappantes que les auteurs ont estimé que les gènes des groupes ne sont pas individuellement régulés par leur promoteur personnel mais que des changements dans la structure de la chromatine étaient impliqués. Un modèle de corégulation similaire a été publié la même année par Roy et al. (2002) dans C. elegans. [9]

De nombreux gènes regroupés en grappes présentent les mêmes profils d'expression dans les carcinomes canalaires invasifs du sein humains. Environ 20% des gènes montrent une corrélation avec leurs voisins. Les groupes de gènes co-exprimés ont été divisés par régions avec moins de corrélation entre les gènes. Ces grappes pourraient couvrir un bras chromosomique entier.

Contrairement aux précédents rapports discutés Johnidis et al. (2005) ont découvert que (au moins certains) gènes au sein des clusters ne sont pas co-régulés. Aire est un facteur de transcription qui a un effet de régulation à la hausse et à la baisse sur divers gènes. Il fonctionne dans la sélection négative des thymocytes, qui répondent aux propres épitopes de l'organisme, par les cellules médullaires. [dix]

Les gènes contrôlés par l'aire se sont regroupés. 53 des gènes les plus activés par aire avaient un voisin activé par aire dans les 200 Kb ou moins, et 32 ​​des gènes les plus réprimés par aire avaient un voisin réprimé par aire dans les 200 Kb, c'est moins que prévu par le changement. Ils ont fait le même criblage pour le régulateur transcriptionnel CIITA.

Ces régulateurs de transcription n'ont pas eu le même effet sur les gènes al dans le même cluster. Des gènes activés et réprimés ou non affectés étaient parfois présents dans le même cluster. Dans ce cas, il est impossible que les gènes régulés par l'air aient été regroupés car ils étaient tous co-régulés.

Il n'est donc pas très clair si les domaines sont co-régulés ou non. Un moyen très efficace de tester cela serait d'insérer des gènes synthétiques dans des RIDGE, des antiridges et/ou des endroits aléatoires du génome et de déterminer leur expression. Ces niveaux d'expression doivent être comparés les uns aux autres. Gierman et al. (2007) ont été les premiers à prouver la corégulation en utilisant cette approche. En tant que construction d'insertion, ils ont utilisé un gène GFP fluorescent dirigé par le promoteur de la phosphoglycérate kinase humaine (PGK) exprimé de manière ubiquitaire. Ils ont intégré cette construction dans 90 positions différentes dans le génome des cellules humaines HEK293. Ils ont constaté que l'expression de la construction dans les crêtes était en effet plus élevée que celles insérées dans les anti-crêtes (alors que toutes les constructions ont le même promoteur). [11]

Ils ont cherché à savoir si ces différences d'expression étaient dues à des gènes dans le voisinage direct des constructions ou par le domaine dans son ensemble. Ils ont découvert que les constructions à côté des gènes fortement exprimés étaient légèrement plus exprimées que les autres. Mais lorsqu'ils ont élargi la taille de la fenêtre aux 49 gènes environnants (niveau du domaine), ils ont constaté que les constructions situées dans des domaines avec une expression globale élevée avaient une expression plus de 2 fois supérieure à celles situées dans des domaines avec un faible niveau d'expression.

Ils ont également vérifié si la construction était exprimée à des niveaux similaires à ceux des gènes voisins et si cette co-expression étroite était présente uniquement dans les RIDGE. Ils ont constaté que les expressions étaient fortement corrélées au sein des RIDGE et presque absentes près de la fin et à l'extérieur des RIDGE.

Des observations antérieures et les recherches de Gierman et al. ont prouvé que l'activité d'un domaine a un grand impact sur l'expression des gènes qui s'y trouvent. Et les gènes au sein d'un RIDGE sont co-exprimés. Cependant, les constructions utilisées par Gierman et al. étaient régulés par un promoteur actif à temps plein. Les gènes de la recherche de Johnidis et al. dépendaient de la présence du facteur de transcription aire. L'expression étrange des gènes régulés par aire pourrait en partie avoir été causée par des différences d'expression et de conformation du facteur de transcription aire lui-même.

Relation fonctionnelle Modifier

On savait avant l'ère génomique que les gènes regroupés ont tendance à être fonctionnellement liés. Abderrahim et al. (1994) avaient montré que tous les gènes du complexe majeur d'histocompatibilité étaient regroupés sur le chromosome 6p21. Roy et al. (2002) ont montré que chez le nématode C. elegans les gènes qui sont uniquement exprimés dans le tissu musculaire au stade larvaire ont tendance à se regrouper en petits groupes de 2 à 5 gènes. Ils ont identifié 13 clusters.

Yamashita et al. (2004) ont montré que les gènes liés à des fonctions spécifiques dans les organes ont tendance à se regrouper. Six domaines liés au foie contenaient des gènes pour le métabolisme des xénobiotiques, des lipides et de l'alcool. Cinq domaines liés au côlon avaient des gènes pour l'apoptose, la prolifération cellulaire, le transporteur d'ions et la production de mucine. Ces grappes étaient très petites et les niveaux d'expression étaient faibles. Les gènes liés au cerveau et au sein ne se sont pas regroupés. [12]

Cela montre qu'au moins certains clusters sont constitués de gènes fonctionnellement liés. Cependant, il existe de grandes exceptions. Spellman et Rubin ont montré qu'il existe des groupes de gènes co-exprimés qui ne sont pas fonctionnellement liés. Il semble que les clusters apparaissent sous des formes très différentes.

Règlement Modifier

Cohen et al. ont découvert que d'une paire de gènes co-exprimés, un seul promoteur a une séquence d'activation en amont (UAS) associée à ce modèle d'expression. Ils ont suggéré que les UAS peuvent activer des gènes qui ne leur sont pas immédiatement adjacents. Cette explication pourrait expliquer la co-expression de petits clusters, mais de nombreux clusters contiennent de nombreux gènes à réguler par un seul UAS.

Les changements de chromatine sont une explication plausible de la corégulation observée dans les clusters. La chromatine se compose du brin d'ADN et des histones qui sont attachés à l'ADN. Les régions où la chromatine est très compacte sont appelées hétérochromatine. L'hétérochromatine se compose très souvent de restes de génomes viraux, de transposons et d'autres ADN indésirables. En raison de l'emballage serré, l'ADN est presque inaccessible pour la machinerie de transcription, la couverture de l'ADN délétère avec des protéines est la façon dont la cellule peut se protéger. La chromatine qui se compose de gènes fonctionnels est souvent une structure ouverte où l'ADN est accessible. Cependant, la plupart des gènes n'ont pas besoin d'être exprimés tout le temps.

L'ADN avec des gènes qui ne sont pas nécessaires peut être recouvert d'histones. Lorsqu'un gène doit être exprimé, des protéines spéciales peuvent altérer le produit chimique attaché aux histones (modifications des histones) qui provoquent l'ouverture de la structure par les histones. Lorsque la chromatine d'un gène est ouverte, la chromatine des gènes adjacents l'est également jusqu'à ce que cette modification rencontre un élément limite. De cette façon, les gènes sont à proximité immédiate sont exprimés en même temps. Ainsi, les gènes sont regroupés dans des « centres d'expression ». En comparaison avec ce modèle, Gilbert et al. (2004) ont montré que les RIDGE sont principalement présentes dans les structures ouvertes de la chromatine. [13] [14]

Cependant, Johnidis et al. (2005) ont montré que les gènes d'un même cluster peuvent être exprimés de manière très différente. Le fonctionnement précis de la régulation des gènes eucaryotes et des changements de chromatine associés est encore très flou et il n'y a pas de consensus à ce sujet. Afin d'obtenir une image claire du mécanisme des groupes de gènes, il faut d'abord éclairer le fonctionnement de la chromatine et de la régulation des gènes. De plus, la plupart des articles qui ont identifié des groupes de gènes co-régulés se sont concentrés sur les niveaux de transcription alors que peu se sont concentrés sur des groupes régulés par les mêmes facteurs de transcription. Johnides et al. découvert des phénomènes étranges quand ils l'ont fait.

Les premiers modèles qui ont tenté d'expliquer le regroupement des gènes se sont bien entendu concentrés sur les opérons car ils ont été découverts avant les clusters de gènes eucaryotes. En 1999, Lawrence a proposé un modèle pour les opérons d'origine. Cette modèle d'opéron égoïste suggère que les gènes individuels ont été regroupés par transfert vertical et horizontal et ont été conservés comme une seule unité parce que cela était bénéfique pour les gènes, pas en soi pour l'organisme. Ce modèle prédit que les groupes de gènes doivent avoir été conservés entre les espèces. Ce n'est pas le cas pour de nombreux opérons et groupes de gènes observés chez les eucaryotes. [15]

Selon Eichler et Sankoff, les deux processus moyens dans l'évolution des chromosomes eucaryotes sont 1) les réarrangements des segments chromosomiques et 2) la duplication localisée des gènes. Le regroupement pourrait s'expliquer par le raisonnement selon lequel tous les gènes d'un groupe proviennent de doublons en tandem d'un ancêtre commun. Si tous les gènes co-exprimés dans un cluster avaient évolué à partir d'un gène ancestral commun, on aurait pu s'attendre à ce qu'ils soient co-exprimés car ils ont tous des promoteurs comparables. Cependant, le regroupement de gènes est une démarche très courante dans les génomes et il n'est pas clair comment ce modèle de duplication pourrait expliquer tout le regroupement. De plus, de nombreux gènes présents dans les clusters ne sont pas homologues.

Comment des gènes évolutifs non liés se sont-ils rapprochés en premier lieu ? Soit il y a une force qui rapproche les gènes fonctionnellement apparentés les uns des autres, soit les gènes se sont rapprochés par changement. Singer et al. ont proposé que les gènes se soient rapprochés par recombinaison aléatoire des segments du génome. Lorsque des gènes fonctionnellement apparentés se sont rapprochés les uns des autres, cette proximité a été conservée. Ils ont déterminé tous les sites de recombinaison possibles entre les gènes de l'homme et de la souris. Après cela, ils ont comparé le regroupement du génome de la souris et du génome humain et ont examiné si une recombinaison s'était produite sur les sites potentiellement recombinés. Il s'est avéré que la recombinaison entre les gènes d'un même cluster était très rare. Ainsi, dès qu'un cluster fonctionnel est formé, la recombinaison est supprimée par la cellule. Sur les chromosomes sexuels, la quantité de grappes est très faible chez l'homme et la souris. Les auteurs ont estimé que cela était dû au faible taux de réarrangements chromosomiques des chromosomes sexuels.

Les régions ouvertes de la chromatine sont des régions actives. Il est plus probable que des gènes seront transférés dans ces régions. Les gènes des organites et du génome du virus sont insérés plus souvent dans ces régions. De cette manière, des gènes non homologues peuvent être pressés ensemble dans un petit domaine. [16]

Il est possible que certaines régions du génome soient mieux adaptées pour des gènes importants. Il est important pour la cellule que les gènes responsables des fonctions basales soient protégés de la recombinaison. Il a été observé chez les levures et les vers que les gènes essentiels ont tendance à se regrouper dans des régions avec un faible taux de réplication. [17]

Il est possible que les gènes se soient rapprochés par changement. D'autres modèles ont été proposés mais aucun d'entre eux ne peut expliquer tous les phénomènes observés. Il est clair que dès que les amas se forment, ils sont conservés par la sélection naturelle. Cependant, un modèle précis de la façon dont les gènes se sont rapprochés fait toujours défaut.

La majeure partie des grappes actuelles doit s'être formée relativement récemment, car seulement sept grappes de gènes fonctionnellement apparentés sont conservées entre les phylums. Certaines de ces différences peuvent s'expliquer par le fait que l'expression des gènes est très différemment régulée par différents phylums. Par exemple, chez les vertébrés et les plantes, la méthylation de l'ADN est utilisée, alors qu'elle est absente chez les levures et les mouches. [18]


Combien de gènes co-exprimés seraient attendus dans un tissu ? - La biologie

Chez les bovins de boucherie d'ascendance européenne, le trait d'être sans cornes ou d'avoir des cornes est déterminé par une paire de gènes. Un gène du couple est hérité de la mère et l'autre du père. Le gène sans cornes (P) est dominant par rapport au gène cornu (p). Si un animal possède deux gènes sans cornes (PP), homozygotes, ou un gène sans cornes et un gène cornu (Pp), hétérozygotes, il sera sans cornes. Cependant, s'il est hétérozygote sans cornes (Pp), il peut transmettre le gène sans cornes ou sans cornes à sa progéniture. La seule situation où un animal sera cornu est lorsqu'il possède deux gènes cornus récessifs (pp), homozygote cornu. Le tableau 1 illustre l'expression de l'acié ou des cornes et quels gènes et traits peuvent être transmis à la progéniture à partir des divers accouplements.

Si un animal d'élevage européen, pas d'ascendance Zébu, a des cornes, vous pouvez déterminer par observation visuelle qu'il est homozygote pour le gène cornu récessif. Cependant, si l'animal est sans cornes ou sans cornes, il est impossible de déterminer par observation visuelle s'il est génétiquement homozygote sans cornes (PP) ou hétérozygote sans cornes (Pp). Le taureau homozygote sans cornes avec deux gènes sans cornes engendrera uniquement des veaux sans cornes. Ce n'est qu'à travers la progéniture produite que le nombre de gènes sans cornes peut être déterminé. Le meilleur test d'un taureau accouplé à des vaches à cornes est d'accoupler le taureau sans cornes en question à des vaches à cornes. Un taureau sans cornes accouplé à des vaches à cornes qui produisent un ou plusieurs veaux à cornes est hétérozygote sans cornes (un gène récessif pour les cornes), quel que soit le nombre de veaux sans cornes produits. Le tableau 2 donne la probabilité qu'un taureau sans cornes soit homozygote sans cornes si aucun veau cornu n'est produit à partir d'accouplements avec des vaches cornues.

Tableau 1. Expression génétique des cornes ou des cornes et héritage attendu par la progéniture
Sire Endiguer Veaux
Homozygote sans cornes (PP) Homozygote sans cornes (PP) 100% homozygotes sans cornes (PP)
Homozygote sans cornes (PP) Hétérozygote sans cornes (Pp) 50% Homozygotes sans cornes (PP)
50% hétérozygote sans cornes (Pp)
Homozygote sans cornes (PP) Homozygote cornu (pp) 100% hétérozygotes sans cornes (Pp)
Hétérozygote sans cornes (Pp) Homozygote cornu (pp) 50% hétérozygote sans cornes (Pp)
50% Homozygote cornu (pp)
Hétérozygote sans cornes (Pp) Hétérozygote sans cornes (Pp) 25% homozygotes sans cornes (PP)
50% hétérozygote sans cornes (Pp)
25% Homozygote cornu (pp)

Tableau 2. Probabilité qu'un taureau sans cornes soit homozygote sans cornes si aucun veau cornu n'est produit
Nombre de veaux sans cornes provenant de vaches à cornes Probabilité que le taureau soit homozygote sans cornes
2 75.00%
3 87.50%
4 93.75%
5 96.88%
6 98.44%
7 99.22%
8 99.61%
10 99.90%
12 99.98%
14 99.99%

Il existe d'autres gènes qui affectent la croissance en forme de corne, les scurs, sur la tête d'un animal. Les écuelles sont des cornes incomplètement développées qui sont généralement lâches et mobiles sous la peau, non attachées au crâne. Leur taille varie de petites excroissances ressemblant à des croûtes à parfois presque aussi grosses que des cornes. Étant donné que le gène du scurs est transmis séparément, il n'a aucun effet sur la présence ou l'absence de cornes. Tous les bovins à cornes ne portent pas le gène de la gale et tous les bovins sans cornes ne sont pas dépourvus du gène de la gale.

Le gène des scurs est exprimé différemment du gène des cornes et des cornes. La façon dont le gène de la scur est exprimé dépend du sexe de l'animal. Chez les mâles, le gène de la scur est dominant, ce qui signifie que si un seul des deux gènes est pour la scur, le taureau sera raclé. Par conséquent, il est facile de détecter le gène scur chez le taureau et de l'éliminer du troupeau. Chez les femelles, le gène de la gale est récessif, ce qui signifie qu'elle doit posséder les deux gènes de la gale pour que la vache soit chassée. Si la vache ne possède qu'un seul gène de la gale, elle n'aura pas elle-même la gale mais a 50 % de chances de transmettre le gène de la gale à son veau. La vache à cornes lisses peut avoir le gène de la gale récessif, ce qui rend beaucoup plus difficile l'identification/l'élimination du gène de la gale du troupeau. Le tableau 3 décrit les modèles d'héritage scurred. La présence du gène scur est indiquée par Sc et l'absence du gène scur par Sn. Ces modèles de gènes sont pour les animaux sans cornes, car la croissance de la corne couvrira toute condition sclérifiée si elle existe.

Tableau 3. Modèles d'héritage bloqué
Maquillage génétique de l'animal Vaches Taureaux
ScScPP scruté sondé scruté sondé
ScSnPP Lisse Sondée scruté sondé
SnSnPP Lisse Sondée Lisse Sondée

Un autre facteur qui complique l'héritage des cornes et des cornes est que chez les bovins d'ascendance zébu, comme Brahman, Santa Gertrudis et d'autres, il existe un gène supplémentaire qui affecte l'héritage des cornes. L'héritage des cornes chez les bovins de type Zébu est différent de celui observé dans les races britanniques. Le gène acère (P) et le gène scur (Sc) peuvent tous deux être présents chez les bovins américains d'ascendance zébu. Cependant, un autre gène, le gène de la corne africaine (Af) affecte également l'hérédité des cornes chez ces animaux. L'absence de ce gène est exprimée par le symbole (An).

Les généticiens sont raisonnablement certains que la façon dont le gène Af est exprimé dépend du sexe de l'animal, tout comme la façon dont les scurs sont exprimés. Chez les mâles, le gène Af est dominant par rapport au gène sans cornes, An. Cela signifie qu'un seul gène Af fera qu'un taureau sera cornu, même s'il est hétérozygote ou homozygote sans cornes. Chez les femelles, le gène Af est récessif au gène sans cornes An. Chez les femelles sans cornes hétérozygotes, deux des gènes Af doivent être présents pour que l'animal ait des cornes.

Chez les animaux possédant le gène Af en plus du gène sans cornes (homozygotes ou hétérozygotes), les modèles de transmission indiqués dans le tableau 4 peuvent être attendus.

Comme les scurs, la présence du gène de la corne africaine est facile à détecter chez les mâles puisque la présence d'un seul gène Af fait que le mâle a des cornes. Par conséquent, il n'est pas nécessaire de tester la descendance pour le gène Af chez maleis. Si le taureau est acère, il ne possède pas le gène Af. S'il est cornu alors que son ascendance génétique montre qu'il devrait être interrogé, la raison en est peut-être qu'il possède un gène Af. Les producteurs de bovins doivent également garder à l'esprit qu'un taureau homozygote éprouvé produira des veaux à cornes s'il est accouplé à des vaches à cornes ou sans cornes qui portent le gène de la corne africaine.

Tableau 4. Modèles d'héritage des gènes de la corne africaine
Maquillage génétique des animaux Vaches Taureaux
AfAfPP Cornu Cornu
AfAnPP Sondé Cornu
AnAnPP Sondé Sondé

Comme vous pouvez le voir, il existe en fin de compte trois paires de gènes qui peuvent déterminer si les bovins ont des tissus ressemblant à des cornes sur la tête sous la forme de cornes ou de racailles.


Les scientifiques débattent jusqu'où aller dans l'édition des gènes humains

Le lauréat du prix Nobel David Baltimore de Caltech s'adresse aux journalistes lors du sommet international de la National Academy of Sciences sur l'édition de gènes humains, mardi à Washington, DC Des centaines de scientifiques et d'éthiciens du monde entier débattent de la manière de gérer la technologie qui facilite l'édition des code génétique humain. Susan Walsh/AP masquer la légende

Le lauréat du prix Nobel David Baltimore de Caltech s'adresse aux journalistes lors du sommet international de la National Academy of Sciences sur l'édition de gènes humains, mardi à Washington, DC Des centaines de scientifiques et d'éthiciens du monde entier débattent de la manière de gérer la technologie qui facilite l'édition des code génétique humain.

Le réchauffement climatique n'est pas le seul problème épineux auquel le monde a été confronté cette semaine.

Alors que les délégués se sont réunis à Paris pour discuter du changement climatique, le Sommet international sur l'édition des gènes humains s'est réuni à Washington, D.C., pour débattre d'une autre énigme : jusqu'où les scientifiques devraient-ils aller lorsqu'ils modifient l'ADN humain ?

L'objectif principal était de savoir si les scientifiques devraient être autorisés à utiliser de nouvelles techniques puissantes de génie génétique pour modifier les gènes dans les ovules, les spermatozoïdes ou les embryons humains - une étape extrêmement controversée qui soulève une multitude de problèmes épineux de sécurité et d'éthique.

À la fin de la réunion jeudi, les organisateurs de la conférence ont conclu qu'il serait "irresponsable de procéder" à toute tentative de créer une grossesse ou un bébé à partir d'ovules, de spermatozoïdes ou d'embryons humains qui ont été altérés, pour des raisons de sécurité et d'éthique.

Mais une recherche "de base intensive" est "clairement nécessaire et devrait se poursuivre" pour explorer la sécurité et les avantages potentiels de la modification de ce type d'ADN, a déclaré le comité dans un communiqué.

"Cette déclaration est notre réponse à la question de savoir s'il devrait y avoir une interdiction" de toute autre recherche, a déclaré David Baltimore, un biologiste lauréat du prix Nobel qui a présidé le comité.

Notamment, les organisateurs n'ont pas exclu la possibilité que l'édition de gènes puisse un jour être utilisée pour créer des humains, à mesure que "les connaissances scientifiques progressent et que les opinions sociétales évoluent".

Les organisateurs ont appelé à la création d'un forum permanent pour continuer à évaluer l'état de la recherche et l'état de préparation de la société.

Près de 500 scientifiques, médecins, bioéthiciens, experts juridiques, historiens, défenseurs des patients et autres se sont réunis pour le sommet, qui était parrainé par l'Académie nationale des sciences des États-Unis, l'Académie nationale de médecine des États-Unis, l'Académie chinoise des sciences et la Royal Society du Royaume-Uni. .

Un comité international organisé par les académies américaines a assisté au sommet dans le cadre de son processus d'enquête pour émettre des recommandations concernant d'éventuelles lignes directrices pour l'édition de gènes. Ceux-ci sont attendus l'année prochaine.

La réunion a été convoquée en raison des préoccupations croissantes suscitées par le développement de techniques d'édition de gènes telles que CRISPR-Cas9. Ces techniques permettent aux scientifiques d'effectuer des modifications très précises de l'ADN beaucoup plus facilement que jamais.

Les scientifiques pensent que les nouvelles techniques produiront de nombreux avantages, comme la découverte de nouvelles façons de prévenir et de traiter des maladies, notamment le SIDA, le cancer et la maladie d'Alzheimer.

Mais la possibilité de modifier l'ADN si facilement suscite également de nombreuses craintes, en particulier quant à la perspective de modifier l'ADN humain dès le départ. Les scientifiques ont exploré comment la modification des spermatozoïdes, des ovules et des embryons pourrait apporter de nouvelles informations importantes sur la biologie et le développement humains fondamentaux, et aider à prévenir et à traiter de nombreuses maladies héréditaires, notamment la maladie de Huntington, la mucoviscidose et la maladie de Tay-Sachs.

Mais modifier la soi-disant lignée germinale de cette manière a longtemps été considéré comme interdit. C'est parce que de tels changements peuvent être transmis aux générations futures. Des erreurs pourraient introduire par inadvertance de nouvelles maladies dans le pool génétique humain.

Une autre crainte est que franchir cette étape ouvrirait la porte aux bébés de créateurs – créant des enfants plus intelligents, plus grands, plus intelligents ou ayant d'autres traits prétendument désirables.

Lors de son discours d'ouverture, Baltimore a fait référence au livre d'Aldous Huxley de 1932 Brave Nouveau Monde. "L'avertissement implicite dans son livre est celui que nous devrions prendre à cœur aujourd'hui alors que nous sommes confrontés à la perspective de moyens nouveaux et puissants pour contrôler la nature de la population humaine", a déclaré Baltimore.

Un autre intervenant, Daniel Kevles, historien de la médecine à l'Université de Yale, a rappelé à l'auditoire que l'eugénisme était autrefois largement accepté aux États-Unis. "L'eugénisme n'était pas unique aux nazis, il s'est produit partout", a déclaré Kevles.

De nombreux scientifiques ont souligné qu'ils étaient loin d'avoir la capacité de modifier génétiquement des traits complexes. Mais un généticien éminent a émis l'hypothèse que les tentatives d'amélioration de la race humaine pourraient commencer par la recherche médicale.

George Church, de la Harvard Medical School, écoute une discussion sur la sécurité et l'éthique de l'édition de gènes humains lors d'une réunion au sommet mardi. Susan Walsh/AP masquer la légende

George Church, de la Harvard Medical School, écoute une discussion sur la sécurité et l'éthique de l'édition de gènes humains lors d'une réunion au sommet mardi.

"Je pense que l'amélioration se glissera dans la porte en termes de traitement de maladies graves", a déclaré George Church de l'Université de Harvard. La capacité d'améliorer la mémoire pourrait commencer par la recherche visant à traiter la maladie d'Alzheimer, par exemple, a déclaré Church.

Il semble y avoir un accord général sur le fait que les problèmes de sécurité font qu'il est beaucoup trop tôt pour essayer de faire un bébé en utilisant des ovules, des embryons ou du sperme avec de l'ADN modifié. Mais il y a une division sur ce qui devrait être autorisé en deçà de cela.

Certains, comme la bioéthicienne catholique Hille Haker de l'Université Loyola à Chicago, ont appelé à un moratoire sur toutes les expériences, au moins jusqu'à ce que les scientifiques aient plus de temps pour comprendre comment utiliser les nouvelles techniques d'édition de gènes et que la société ait plus de temps pour débattre des problèmes complexes. ils élèvent.

D'autres craignaient qu'un moratoire n'entrave un domaine prometteur à un moment important. Ils ont fait valoir que les études de base en laboratoire devraient se poursuivre.

"Nous avons tous un devoir moral incontournable : poursuivre la recherche scientifique jusqu'au point où nous pouvons faire un choix rationnel", a déclaré John Harris, professeur de bioéthique à l'Université de Manchester en Angleterre. "Il me semble que l'examen d'un moratoire n'est pas la bonne voie. Des recherches sont nécessaires."

Mais Jennifer Doudna de l'Université de Californie à Berkeley, pionnière dans le développement de CRISPR-Cas9, a réitéré sa position selon laquelle la recherche impliquant la technique doit procéder avec prudence.

L'un des moments les plus émouvants s'est produit lorsque Sarah Gray de l'Association américaine des banques de tissus s'est adressée à un panel de scientifiques du public. Étouffant ses larmes, Gray a décrit comment son fils a souffert avant de mourir d'une maladie génétique six jours après sa naissance. "Si vous avez les compétences et les connaissances nécessaires pour soigner ces maladies", a déclaré Gray, "alors faites-le."


Résultats et discussion

Tous les individus de cette étude étaient sévèrement obèses (IMC > 35) et ont subi une chirurgie bariatrique. Un phénotypage métabolique profond a donné un aperçu de l'état métabolique des individus, montrant que près de la moitié étaient des MHO (définis comme n'ayant ni DT2 ni NASH). Parmi les individus MUO, 18 individus souffraient de DT2 (7 hommes, 11 femmes), 27 souffraient de NASH (8 hommes, 19 femmes) et parmi eux, 13 individus avaient à la fois le DT2 et la NASH (4 hommes, 9 femmes). Les statistiques descriptives des phénotypes métaboliques ont montré une différence significative (P < 0.05) entre les individus MHO et MUO pour le glucose, l'hémoglobine glyquée (HbA1c), les FFA et l'aspartate transaminase (ASAT) (tableau 1). Ces phénotypes métaboliques n'ont pas montré de différence significative entre les hommes et les femmes (P>0,05), bien que nous ayons trouvé une différence significative pour l'IMC, le rapport taille-hanches (rapport WH), l'insuline, le cholestérol total et les lipoprotéines de basse densité (LDL ) niveaux (P<0.05). Une différence significative d'âge a été trouvée : les individus MHO étaient plus jeunes que les individus MUO, ce qui est en accord avec une étude qui a trouvé une diminution de la prévalence de l'obésité métabolique saine avec l'âge [24].

Co-expression inter-tissus se concentrant sur des gènes individuels

Dobrin et al. [25] ont montré que l'étude de la co-expression inter-tissulaire peut conduire à la détection de gènes liés à des changements spécifiques aux tissus dans les maladies et que cela représente la communication entre les tissus. Par conséquent, nous avons identifié des gènes qui sont altérés dans la co-expression inter-tissulaire entre les individus MHO et MUO, car ils pourraient identifier les gènes impliqués dans la diaphonie des tissus en ce qui concerne les comorbidités induites par l'obésité. Nous avons détecté deux gènes altérés entre le sous-réseau MHO et MUO : IL1B et IL-6. Les deux gènes ont montré, pour la plupart d'entre eux, une co-expression inter-tissulaire significative et plus forte dans le sous-réseau MUO que dans le sous-réseau MHO.

Interleukine 1-β (IL1B) est une cytokine importante produite principalement par les macrophages activés. IL1B ont montré une forte corrélation entre le foie et les tissus adipeux dans le sous-réseau MUO, avec des corrélations plus faibles parmi les autres tissus et dans le sous-réseau MHO (tableau 2). Comme l'obésité entraîne une augmentation de l'activation des macrophages dans le foie et le tissu adipeux [26], les niveaux d'ARNm d'IL1B augmenteront en conséquence. Des études ont montré l'importance de IL1B dans le développement de la résistance à l'insuline induite par l'obésité [27, 28], et un rôle central pour IL1B a été suggérée dans le blocage de l'action de l'insuline dans le tissu adipeux lié à la diaphonie macrophage-adipocyte [29]. De plus, la fonction de IL1B dans la diaphonie foie-tissu adipeux a été étudiée chez la souris [30]. Des études récentes ont montré qu'il n'y avait pas de différence dans les niveaux systémiques d'IL1B entre les individus MHO et MUO [31, 32]. Ici, nous ne trouvons pas de différences dans les niveaux d'ARNm IL1B, mais les corrélations inter-tissus plus fortes dans le sous-réseau MUO indiquent un rôle potentiel pour IL1B dans les maladies métaboliques induites par l'obésité.

Une tendance similaire à travers les tissus a été trouvée pour l'interleukine-6 ​​(IL-6) avec de fortes corrélations entre le foie et les tissus adipeux (tableau 3). IL-6 est une cytokine et une myokine, c'est-à-dire qu'elle est également sécrétée par le muscle squelettique lors de la contraction [33]. Les nombreuses fonctions de IL-6 comprennent des rôles dans les réponses immunologiques et le métabolisme du glucose [34, 35]. IL-6 a été proposé comme prédicteur indépendant du DT2 [36] et la même étude a également montré une interaction significative entre IL1B et IL-6. Contrairement à IL1B, une diminution significative des taux d'ARNm d'IL-6 a été observée chez MHO vs. Individus MUO [32]. Étonnamment, nos données ne montrent aucune différence significative dans les niveaux d'ARNm d'IL-6 entre les individus MHO et MUO.

Analyse des réseaux inter-tissus en mettant l'accent sur IL1B et IL-6

Nous avons construit deux grands réseaux de co-expression de gènes en utilisant des gènes liés à l'insuline dans quatre tissus, résultant en un réseau pour le MHO et pour les individus MUO. Le regroupement au sein de ces réseaux peut ainsi conduire à des groupes spécifiques à un tissu ou à des groupes avec des gènes à travers les tissus. Le regroupement des gènes dans le réseau MHO et MUO est visualisé à l'aide d'un dendrogramme génique (S1 Fig). Nous nous sommes concentrés sur les caractéristiques du réseau des gènes identifiés (IL1B et IL-6) car ils sont potentiellement importants dans le développement de la maladie. IL1B et IL-6, exprimé dans chacun des quatre tissus, ne se sont pas regroupés à travers les tissus ou au sein du sous-réseau MHO. Cependant, ils se sont regroupés dans le réseau MUO, au sein de chaque tissu. Nous avons étudié plus en détail ces modules et gènes, en nous concentrant sur les corrélations altérées entre les sous-réseaux MHO et MUO, pour mieux comprendre les mécanismes impliqués dans le développement de la maladie. Nous avons confirmé que ces modules ne dépendaient pas de l'âge et/ou du sexe, car les éléments propres des modules n'étaient pas significativement corrélés avec l'âge ou le sexe. Alors que nous nous sommes concentrés sur les modèles de co-expression globaux à travers les tissus chez les individus MHO et MUO, on pourrait s'attendre à ce que les modèles de co-expression puissent différer chez les patients souffrant de NASH ou de DT2, cependant, en raison de la taille limitée de l'échantillon, nous n'avons pas pu chez eux.

Le module Greenyellow dans le réseau MUO, contenant à la fois le IL1B et IL-6 gène, a regroupé les profils d'expression de 29 gènes (MM > 0,6) dont 27 proviennent du foie. Deux gènes dans ce module (PKM et SLC6A5) proviennent respectivement de la SAT et de la TVA. La GSEA a révélé que la voie de signalisation du récepteur de type NOD (NLR) était la voie de signalisation KEGG la plus importante (P = 0,002) et que les termes GO étaient associés à la transduction du signal (par exemple, régulation négative de la transduction du signal, P = 3,55E -5 ) et à la liaison aux récepteurs des cytokines. (P = 6,59E -4 ). Ces résultats sont en accord avec le fait que des quantités excessives de tissu adipeux entraînent une libération accrue de cytokines, par ex. IL-6, IL1B, et CCL2, provoquant une inflammation via, par exemple, la voie de signalisation NLR [37].

Les coefficients de corrélation des gènes de Pearson dans le module Greenyellow ont été visualisés dans Cytoscape pour les deux sous-réseaux (Fig 2A). La visualisation montre que les gènes du module Greenyellow sont fortement corrélés entre eux dans le sous-réseau MUO, tandis que les mêmes gènes sont moins fortement corrélés dans le sous-réseau MHO. Comme prévu, une forte co-expression est détectée entre IL1B et IL-6, avec une légère augmentation de la force entre les individus MHO et MUO (0,50 vs 0,71, respectivement). Dans ce module, IL1B ne montre pas de grandes altérations de la co-expression avec d'autres gènes entre les individus MHO et MUO. Cependant, IL-6 montre une corrélation altérée avec les gènes suppresseurs de cytokines SOCS2 (r = 0,01 vs. r = 0,74) et SOCS3 (r = 0,47 vs. r = 0,75), et de plus, la corrélation entre SOCS2 et SOCS3 est légèrement altéré (r = 0,44 vs. r = 0,69). Des études antérieures ont montré que l'obésité altère la signalisation JAK-STAT3 en raison de niveaux élevés d'IL-6, conduisant par exemple à une expression élevée de SOCS3 dans le tissu adipeux blanc, le foie et les muscles [38]. En se liant aux substrats des récepteurs de l'insuline, SOCS3 altère l'action de l'insuline et augmente SOCS3 les niveaux sont associés à la résistance à l'insuline [39]. L'importance de l'association entre SOCS3 et IL-6 a déjà été démontré, comme l'absence de SOCS3 conduit à des effets altérés de IL-6 entraînant un fort effet inhibiteur sur les macrophages et les cellules dendritiques, ressemblant à une réponse inflammatoire [40]. Également PTPN1 Le gène codant pour PTP1B est associé à la résistance à l'insuline en régulant négativement la signalisation de l'insuline [41]. En raison de ses effets sur l'insuline et la leptine, il a été suggéré comme cible médicamenteuse pour l'obésité et le diabète [42]. Ce gène a montré une co-expression fortement altérée avec IL-6 dans le module entre les sous-réseaux MHO et MUO : aucune corrélation n'a été trouvée entre PTP1B et IL-6 dans le sous-réseau MHO, alors qu'ils étaient modérément corrélés dans le sous-réseau MUO (r = 0,53).

Visualisation des gènes dans le module (A) Greenyellow (du sous-réseau MUO) chez les individus MHO et MUO, et (B) module Turquoise (du sous-réseau MUO) chez les individus MHO et MUO. Les gènes provenant du foie sont colorés en jaune, en orange musculaire, en bleu VAT et en vert SAT. IL1B et IL-6 sont bordés de rouge. Les bords sont colorés en fonction de leur corrélation sur une échelle rouge-vert représentant une corrélation négative-positive.

La détection de variantes génétiques causales potentielles à l'aide d'une approche de cartographie eQTL a conduit à la détection d'un eQTL remarquable dans ce module : le SLC6A5 gène, exprimé en TVA. SLC6A5 montre des coefficients de corrélation généralement faibles avec d'autres gènes dans le sous-réseau MHO, mais plusieurs gènes fortement corrélés dans le sous-réseau MUO. Corrélations avec IL1B et IL-6 ne sont que modérés dans les sous-réseaux MUO (0,28 et 0,41, respectivement) et faibles dans les sous-réseaux MHO (-0,13 et -0,05, respectivement). Les corrélations les plus fortes de SLC6A5 dans le sous-réseau MUO se trouvent avec ANXA1 (r = 0,66), CCL2 (r = 0,63), MARC (r = 0,61), et SOCS3 (r = 0,61) qui ne sont pas tous corrélés dans le sous-réseau MHO. SLC6A5 code pour le transporteur neuronal de la glycine 2 (GlyT2) et son action implique les voies de la protéine kinase C (PKC) [35]. Bien que SLC6A5 lui-même n'a pas été associé à l'obésité, ses propriétés régulatrices via les voies PKC pourraient affecter l'état métabolique des personnes obèses. Par exemple, ANXA1 (associé à l'adiposité [43]) est un médiateur important dans le système neuroendocrinien et les mécanismes dépendants de la PKC sont essentiels à son activité [44]. De même, la question précédemment évoquée SOCS3 a été liée à l'implication dans les voies PKC [45]. Nous suggérons donc un rôle causal potentiel pour SLC6A5 dans les processus de régulation liés aux maladies métaboliques induites par l'obésité. Ceci est corroboré par le fait qu'une mutation de ce gène provoque, entre autres, une diminution du poids corporel chez la souris [46].

Le module Turquoise dans le sous-réseau MUO (Fig 2B) a regroupé les profils d'expression de 26 gènes uniques (MM > 0,9), tous provenant du muscle. Les deux IL1B et IL-6 ont été filtrés en raison du seuil strict sur le MM, mais ont été inclus dans la comparaison des forces de corrélation entre les sous-réseaux MHO et MUO. Les corrélations entre eux ont été modifiées entre le sous-réseau MHO et MUO (r = 0,25 vs r = 0,75, resp.). Un gène de l'obésité bien connu est la leptine (LEP), codant pour la leptine, également appelée « hormone de la satiété ». Dans le muscle squelettique, il favorise la dissipation d'énergie et prévient l'accumulation d'acides gras [47]. LEP montre de fortes corrélations positives et négatives avec tous les autres gènes du module Turquoise (corrélation absolue > 0,8) dans le sous-réseau MUO, tout en étant faible avec de nombreux gènes du sous-réseau MHO (corrélation absolue < 0,4). La plus grande corrélation différentielle pour le LEP a été trouvée entre LEP et PTPRE (0.22 vs. 0,91 dans MHO vs. MUO). PTPRE (Protein Tyrosine Phosphatase, Receptor Type, E) régule négativement la signalisation de l'insuline dans le muscle squelettique et il a été suggéré qu'elle joue un rôle de régulateur de rétroaction négative de la signalisation de la leptine via JAK2 [8]. De plus, de fortes altérations ont été trouvées pour la corrélation entre LEP et IL1B (r = -0,15 vs. r = 0,81 dans MHO vs. MUO). Il a été montré que IL1B est nécessaire pour l'induction de la leptine au cours de l'inflammation [12]. Nos données suggèrent que cette induction ne se produit pas chez les individus MHO. Un autre gène intéressant est l'adiponectine (ADIPOQ), codant pour l'hormone adiponectine qui améliore la sensibilité à l'insuline du muscle squelettique et a été suggérée comme cible médicamenteuse pour l'obésité et le DT2 [13]. La corrélation entre ADIPOQ et IL1B différaient dans une large mesure entre MHO et MUO (r = -0,19 vs r = 0,68 dans MHO vs. MUO). Dans les adipocytes, mais pas dans le muscle squelettique, il a été montré que IL1B réduit la production d'adiponectine, affectant ainsi négativement la sensibilité à l'insuline [24, 29]. Aucun eQTL n'a été détecté dans ce module.

Le module Black du sous-réseau MUO (Fig 3A) a regroupé les profils d'expression de 30 gènes (MM < 0,60), tous provenant de SAT, à l'exception de deux provenant de VAT : PRKAG2 (également co-exprimé en SAT) et PIK3R1. La corrélation entre IL1B et IL-6, et leur corrélation avec les gènes suppresseurs de cytokines, était similaire entre les sous-réseaux MHO et MUO en SAT. Les deux gènes qui sont exprimés dans VAT, PRKAG2 et PIK3R1, montrent une co-expression altérée avec IL-6 et IL1B. La co-expression de PIK3R1 avec IL1B et IL-6 dans le sous-réseau MHO est très faible (-0,16 et -0,20, respectivement), mais fortement négatif dans le sous-réseau MUO (tous deux -0,67). PIK3R1 code une partie de l'enzyme phosphatidylinositol 3-kinase (PI3K), et la signalisation PI3K joue un rôle important dans la signalisation de l'insuline. PIK3R1 est impliqué dans la médiation de la sensibilité à l'insuline et de la réponse inflammatoire dans le tissu adipeux [31]. La co-expression altérée entre les gènes de l'insuline et PIK3R1 indique un rôle important dans le développement de la maladie qui a également été identifié par d'autres [48]. La corrélation de PRKAG2 avec IL1B et IL-6 est autour de zéro dans le MHO, mais modérément positif dans le sous-réseau MUO (0,53 et 0,54, respectivement). PRKAG2 fait partie de la voie de la protéine kinase activée par l'AMP (AMPK), qui est importante dans la régulation de l'énergie, par ex. l'homéostasie du glucose et la sensibilité à l'insuline [49]. En raison de ses propriétés, c'est une cible médicamenteuse pour le syndrome métabolique.

Visualisation des gènes dans le module (A) Black (du sous-réseau MUO) chez les individus MHO et MUO, et (B) module Salmon (du sous-réseau MUO) chez les individus MHO et MUO. Les gènes provenant du foie sont colorés en jaune, en orange musculaire, en bleu VAT et en vert SAT. IL1B et IL-6 sont bordés de rouge. Les bords sont colorés en fonction de leur corrélation sur une échelle rouge-vert représentant une corrélation négative-positive.

Dans ce module, nous avons trouvé un eQTL : le récepteur IL-6 (IL-6R). De nombreuses corrélations entre IL-6R et d'autres gènes n'ont pas été modifiés entre les sous-réseaux MHO et MUO. Cependant, la corrélation avec SOCS3 était élevée (0,29 vs 0,67, respectivement) et avec PIK3R1 (en TVA) a diminué (0,01 vs -0,58, respectivement). Étonnamment, les corrélations de IL-6 avec ces gènes n'ont pas été modifiés, impliquant un rôle important pour le récepteur de l'IL-6, également basé sur des discussions antérieures sur les résultats de la voie JAK-STAT, dans le développement de la maladie induite par l'obésité. Plusieurs phénotypes altérés ont été détectés dans des mutations du récepteur de l'IL-6 chez la souris, par ex. résistance à l'insuline et action inflammatoire gonflée [50]. Cependant, dans une vaste enquête humaine, une corrélation significative avec l'IMC et la perte de poids chez les personnes obèses morbides n'a pu être trouvée qu'avec les niveaux d'expression de l'IL-6R dans le foie, et non dans les tissus adipeux omentaux, sous-cutanés et gastriques [51].

Le module Salmon dans le sous-réseau MUO (Fig 3B) a regroupé les profils d'expression de 33 gènes (MM < 0,6). Ces gènes provenaient tous de VAT, à l'exception d'un gène (Syntaxine 4, STX4) qui provenait à la fois de la SAT et de la TVA. Plusieurs gènes des modules discutés précédemment étaient également présents dans ce module. La co-expression de IL1B et IL-6 avec SOCS2 et SOCS3 est similaire à la co-expression trouvée dans SAT (module Black), ce qui signifie que leur corrélation n'est altérée que dans le foie. Aussi la co-expression entre IL1B et IL-6 est inchangé dans SAT. La co-expression entre STX4 dans SAT et VAT est plus fort dans le MUO que dans le sous-réseau MHO (0,28 vs 0,58, respectivement). La co-expression de STX4 dans SAT est modifié avec IL1B, l'antagoniste du récepteur IL1B (IL1RN), IL6, et le récepteur IL-6 (IL6R). Dans les quatre cas, la co-expression est modérée à fortement positive dans le sous-réseau MUO et faiblement négative co-exprimée dans le sous-réseau MHO. Cependant, la co-expression de STX4 dans VAT avec les quatre gènes qui ont été exprimés dans VAT est similaire entre les sous-réseaux MHO et MUO, suggérant un rôle dans le développement de la maladie pour STX4 uniquement en SAT.

Dans ce module, nous avons trouvé un eQTL : PTPRE, exprimé en TVA. PTPRE est un régulateur négatif de la signalisation de l'insuline dans le muscle [47]. Dans une étude avec des individus obèses, il a été montré que PTPRE était différentiellement exprimé et méthylé avant et après chirurgie bariatrique, et que le phénotype NASH était négativement corrélé à la reconstruction bariatrique [52]. Outre la détection de PTPRE comme eQTL, le PTPRE gène est présent dans les quatre modules qui ont été étudiés plus avant en raison de la présence de IL1B et IL-6. En s'appuyant sur les discussions inter-tissus de ce gène, le principal changement se trouve entre la corrélation dans le foie et la TVA (0,05 contre 0,55 dans MHO contre MUO). Dans le module Saumon PTPRE montre une co-expression altérée avec la précédente ISL1 (0,07 vs -0,60 dans MHO vs MUO), codant pour la protéine d'amplification du gène de l'insuline ISL-1. De nombreuses corrélations de ISL1 avec d'autres gènes dans ce module sont modifiés, avec de fortes corrélations négatives dans le sous-réseau MUO. Auparavant, il a été démontré que ISL1 est exprimé en VAT et corrélé négativement avec l'IMC et la graisse abdominale [34]. Ils ont également montré que l'expression était réduite chez les souris obèses mais réduite chez les souris maigres sensibles à l'insuline. Dans le module Greenyellow, avec principalement des gènes hépatiques, des altérations entre les individus MHO et MUO se trouvent dans les corrélations de l'expression de PTPRE dans le foie avec par ex. SLC6A5 (T.V.A), SLC6A13 (foie) et PKM (SAM). Il est remarquable que le module se compose principalement de gènes co-exprimés dans le foie, mais que PTRPE montre une co-expression altérée avec les deux gènes provenant de SAT et VAT, suggérant une fonction importante pour PTPRE comme lien entre les tissus dans le développement de la maladie résultant de l'obésité. À ce jour, aucune étude n'a établi de lien PTPRE avec l'un de ces gènes.

En résumé, nous avons montré l'intégration de réseaux de co-expression de gènes à travers les tissus chez les individus MHO et MUO pour identifier les gènes et les voies liés au développement de la maladie induite par l'obésité. Les résultats fournissent des informations importantes sur la génomique de l'extensibilité du tissu adipeux, la lipotoxicité et les comorbidités éventuelles telles que le DT2 et la NASH. Dans un cadre de réseau de co-expression, nous avons détecté IL-6 et IL1B en tant que gènes clés pour les différences de co-expression de gènes inter-tissus liées à l'état métabolique. En étudiant les modules dans lesquels IL-6 et IL1B ont été co-exprimés, nous avons détecté de nombreux gènes et voies co-exprimés altérés qui pourraient être importants dans le développement de l'inflammation et de la comorbidité induites par l'obésité. Bien que IL-6 et IL1B Les niveaux d'ARNm n'ont pas été modifiés entre les individus MHO et MUO dans notre étude, leur co-expression avec d'autres gènes indique un rôle potentiellement important dans le développement de troubles métaboliques induits par l'obésité. L'approche choisie nous a donné un aperçu de la co-expression entre les gènes dans un réseau, mais n'a pas pu donner d'informations sur les directions dans le réseau. Cependant, une approche de cartographie eQTL a été choisie pour détecter les gènes qui affectent les niveaux d'ARNm et affectent ainsi l'état de santé. Cela a conduit à l'identification de plusieurs gènes (PTPRE, IL-6R, et SLC6A5) qui pourrait avoir un rôle important dans les voies liées à l'insuline des personnes obèses. La validation fonctionnelle de ces gènes est nécessaire pour identifier leur rôle potentiel dans le développement de comorbidités induites par l'obésité.


Introduction

La spécificité tissulaire, dans laquelle les cellules remplissent des fonctions différentes malgré un ADN identique, est obtenue en partie par des mécanismes de régulation génique dépendants des tissus, notamment la modification épigénétique et la régulation transcriptionnelle et post-transcriptionnelle [1–3]. Ces programmes de contrôle complexes produisent différents programmes d'expression génique à travers les tissus, la plupart des gènes présentant une expression différentielle statistiquement significative [4, 5]. Ces différences peuvent avoir des conséquences importantes : les gènes spécifiques aux tissus sont particulièrement susceptibles d'être des cibles médicamenteuses [6] et les facteurs de transcription spécifiques aux tissus sont particulièrement susceptibles d'être impliqués dans les maladies complexes [2, 7, 8].Comprendre ces différences est également essentiel pour comprendre les gènes pléiotropes et pour interpréter les études dans lesquelles les données génomiques ne peuvent être collectées que pour un tissu accessible ou proxy (comme l'utilisation du sang dans l'étude des troubles psychiatriques [9-11]).

Les mécanismes de contrôle spécifiques aux tissus peuvent être capturés par des réseaux de co-expression, dans lesquels deux gènes sont connectés si leurs niveaux d'expression sont corrélés à travers un ensemble d'individus. Dans un tel contexte, les différences génétiques ou environnementales entre les individus servent de petites perturbations au réseau de régulation sous-jacent, entraînant une corrélation entre les niveaux d'expression des gènes qui sont compatibles avec les relations régulatrices. Les réseaux de co-expression donnent un aperçu de l'activité cellulaire car les gènes qui sont co-exprimés partagent souvent des fonctions communes [12], et de tels réseaux ont été largement utilisés pour étudier la maladie [13-15].

L'ensemble de données du consortium Genotype-Tissue Expression (GTEx) [16] offre l'opportunité d'étudier de tels réseaux de co-expression pour un nombre sans précédent de tissus humains simultanément. Cependant, de nombreux tissus profilés ont moins d'une douzaine d'échantillons, trop peu pour déduire avec précision les dizaines de millions de paramètres qui définiraient une co-expression ou un réseau de régulation. Une solution serait de combiner tous les échantillons disponibles et d'apprendre un seul réseau de consensus pour tous les tissus, mais cela n'offrirait aucun aperçu de la spécificité tissulaire. D'un autre côté, déduire chaque réseau indépendamment ignore les points communs des tissus : les réseaux de tissus partagent beaucoup plus de liens que ce à quoi on pourrait s'attendre par hasard, et l'apprentissage des liens à travers plusieurs tissus est moins bruyant que l'apprentissage des liens en utilisant un seul tissu, même en utilisant le même nombre de échantillons totaux [12].

Ici, nous utilisons un nouvel algorithme, GNAT (Gene Network Analysis Tool), pour construire simultanément des réseaux de co-expression pour 35 tissus humains distincts. En utilisant une hiérarchie qui code la similarité des tissus, notre approche apprend un réseau pour chaque tissu, encourageant les tissus proches dans la hiérarchie à avoir des réseaux similaires. Il a été démontré que l'apprentissage par transfert hiérarchique améliore la puissance et la précision dans des travaux antérieurs [5, 6, 17, 18]. Nous proposons un nouveau modèle hiérarchique ainsi qu'une méthode d'optimisation des paramètres conçue pour les données à grande échelle, et l'appliquons aux données GTEx. Nous montrons que notre méthode déduit des réseaux avec une probabilité de validation croisée plus élevée que les réseaux appris sur chaque tissu indépendamment ou un seul réseau appris sur tous les tissus. Notre méthode est applicable à tout ensemble de données dans lequel les relations d'échantillons peuvent être décrites par une hiérarchie, par exemple, plusieurs lignées ou espèces de cellules cancéreuses dans un arbre phylogénétique. Le code complet de notre méthode est disponible en tant que données S1.

Nous analysons les réseaux résultants pour faire plusieurs nouvelles observations concernant les principes de spécificité tissulaire. Nous proposons plusieurs métriques pour identifier les gènes qui sont importants dans la définition de l'identité des tissus, et démontrons que ces gènes sont des gènes essentiels de manière disproportionnée. Nous montrons que les facteurs de transcription spécifiques aux tissus, qui sont des plaques tournantes de nos réseaux, sont liés à des gènes dotés de fonctions spécifiques aux tissus, qui à leur tour affichent des niveaux d'expression plus élevés. Nous identifions 1 789 modules de gènes enrichis pour les fonctions d'ontologie génétique et montrons que les modules enrichis qui sont régulés à la hausse dans un tissu sont souvent déterminants pour la fonction tissulaire. Nous montrons également que les modules qui se produisent à travers les tissus sont particulièrement susceptibles d'être enrichis pour les fonctions d'ontologie génétique, et que ces fonctions ont tendance à être celles qui sont essentielles à tous les tissus. Les résultats présentés ici, y compris tous les réseaux et modules de gènes, peuvent être interrogés de manière interactive via notre outil Web [19] les gènes et modules identifiés fournissent une base pour une enquête future.


Les références

Hajer GR, van Haeften TW, Visseren FL : Dysfonctionnement du tissu adipeux dans l'obésité, le diabète et les maladies vasculaires. Eur Heart J. 2008, 29 : 2959-2971. 10.1093/eurheartj/ehn387.

Nijhuis J, Rensen SS, Slaats Y, van Dielen FM, Buurman WA, Greve JW : activation des neutrophiles dans l'obésité morbide, activation chronique de l'inflammation aiguë. Obésité (Silver Spring). 2009, 17 : 2014-2018. 10.1038/obby.2009.113.

Tam CS, Clement K, Baur LA, Tordjman J : Obésité et inflammation de bas grade : une perspective pédiatrique. Obes Rev. 2010, 11 : 118-126. 10.1111/j.1467-789X.2009.00674.x.

Hotamisligil GS, Shargill NS, Spiegelman BM : expression adipeuse du facteur de nécrose tumorale alpha : rôle direct dans la résistance à l'insuline liée à l'obésité. Science. 1993, 259 : 87-91. 10.1126/science.7678183.

Curat CA, Miranville A, Sengenes C, Diehl M, Tonus C, Busse R, Bouloumie A : Des monocytes sanguins aux macrophages résidents du tissu adipeux : induction de la diapédèse par les adipocytes matures humains. Diabète. 2004, 53 : 1285-1292. 10.2337/diabète.53.5.1285.

Harman-Boehm I, Bluher M, Redel H, Sion-Vardy N, Ovadia S, Avinoach E, Shai I, Kloting N, Stumvoll M, Bashan N, Rudich A : infiltration de macrophages dans la graisse omentale versus sous-cutanée dans différentes populations : effet de l'adiposité régionale et les comorbidités de l'obésité. J Clin Endocrinol Metab. 2007, 92 : 2240-2247. 10.1210/jc.2006-1811.

Weisberg SP, McCann D, Desai M, Rosenbaum M, Leibel RL, Ferrante AW : L'obésité est associée à l'accumulation de macrophages dans le tissu adipeux. J Clin Invest. 2003, 112 : 1796-1808.

Xu H, Barnes GT, Yang Q, Tan G, Yang D, Chou CJ, Sole J, Nichols A, Ross JS, Tartaglia LA, Chen H : L'inflammation chronique des graisses joue un rôle crucial dans le développement de la résistance à l'insuline liée à l'obésité . J Clin Invest. 2003, 112 : 1821-1830.

Bluher M : La distinction entre les individus obèses métaboliquement « sains » et « malsains ». Curr Opin Lipidol. 2010, 21 : 38-43. 10.1097/MOL.0b013e3283346ccc.

Despres JP, Allard C, Tremblay A, Talbot J, Bouchard C : Preuve d'une composante régionale de la graisse corporelle en association avec les lipides sériques chez les hommes et les femmes. Métabolisme. 1985, 34 : 967-973. 10.1016/0026-0495(85)90147-7.

Capel F, Klimcakova E, Viguerie N, Roussel B, Vitkova M, Kovacikova M, Polak J, Kovacova Z, Galitzky J, Maoret JJ, et al. et stabilisation du poids. Diabète. 2009, 58 : 1558-1567. 10.2337/db09-0033.

Henegar C, Tordjman J, Achard V, Lacasa D, Cremer I, Guerre-Millo M, Poitou C, Basdevant A, Stich V, Viguerie N, et al : La signature transcriptomique du tissu adipeux met en évidence la pertinence pathologique de la matrice extracellulaire dans l'obésité humaine. Génome Biol. 2008, 9 : R14-10.1186/fr-2008-9-1-r14.

Nair S, Lee YH, Rousseau E, Cam M, Tataranni PA, Baier LJ, Bogardus C, Permana PA : expression accrue des gènes liés à l'inflammation dans les préadipocytes/cellules vasculaires stromales en culture d'obèses par rapport aux Indiens Pima non obèses. Diabétologie. 2005, 48 : 1784-1788. 10.1007/s00125-005-1868-2.

Goldfine AB, Shoelson SE, Aguirre V : Expansion et contraction : traiter le diabète avec la chirurgie bariatrique. Nat Med. 2009, 15 : 616-617. 10.1038/nm0609-616.

van Dielen FM, Buurman WA, Hadfoune M, Nijhuis J, Greve JW : le facteur inhibiteur des macrophages, l'inhibiteur de l'activateur du plasminogène-1, d'autres protéines de la phase aiguë et les médiateurs inflammatoires se normalisent à la suite de la perte de poids chez les sujets souffrant d'obésité morbide traités par chirurgie gastrique restrictive . J Clin Endocrinol Metab. 2004, 89 : 4062-4068. 10.1210/jc.2003-032125.

Brunt EM, Janney CG, Di Bisceglie AM, Neuschwander-Tetri BA, Bacon BR : Stéatohépatite non alcoolique : une proposition de classement et de stadification des lésions histologiques. Suis J Gastroenterol. 1999, 94 : 2467-2474. 10.1111/j.1572-0241.1999.01377.x.

Eisen MB, Spellman PT, Brown PO, Botstein D : analyse de cluster et affichage des modèles d'expression à l'échelle du génome. Proc Natl Acad Sci USA. 1998, 95 : 14863-14868. 10.1073/pnas.95.25.14863.

Thomas PD, Campbell MJ, Kejariwal A, Mi H, Karlak B, Daverman R, Diemer K, Muruganujan A, Narechania A : PANTHER : une bibliothèque de familles et sous-familles de protéines indexées par fonction. Génome Res. 2003, 13 : 2129-2141. 10.1101/gr.772403.

Thomas PD, Kejariwal A, Guo N, Mi H, Campbell MJ, Muruganujan A, Lazareva-Ulitsky B : applications pour les données d'évolution de la fonction séquence-protéine : analyse de l'expression de l'ARNm/protéine et codage des outils de notation SNP. Acides nucléiques Res. 2006, 34 : W645-650. 10.1093/nar/gkl229.

Kanehisa M, Goto S : KEGG : encyclopédie kyoto des gènes et des génomes. Acides nucléiques Res. 2000, 28 : 27-30. 10.1093/nar/28.1.27.

Miron M, Woody OZ, Marcil A, Murie C, Sladek R, Nadon R : Une méthodologie pour la validation globale des expériences de microarray. BMC Bioinformatique. 2006, 7 : 333-10.1186/1471-2105-7-333.

Wrobel G, Kokocinski F, Lichter P : AutoPrime : sélection d'amorces pour les séquences exprimées. Biologie du génome. 2004, 5 : p11-p19. 10.1186/fr-2004-5-5-p11.

Durden DL, Kim HM, Calore B, Liu Y: Les signaux du récepteur Fc gamma RI via l'activation de la hck et de la MAP kinase. J Immunol. 1995, 154 : 4039-4047.

Wang AV, Scholl PR, Geha RS : Association physique et fonctionnelle du récepteur d'immunoglobuline G de haute affinité (Fc gamma RI) avec les kinases Hck et Lyn. J Exp Med. 1994, 180 : 1165-1170. 10.1084/jem.180.3.1165.

Durden DL, Liu YB : Protéine-tyrosine kinase p72syk dans la signalisation du récepteur Fc gamma RI. Du sang. 1994, 84 : 2102-2108.

Kiener PA, Rankin BM, Burkhardt AL, Schieven GL, Gilliland LK, Rowley RB, Bolen JB, Ledbetter JA : la réticulation du récepteur Fc gamma I (Fc gamma RI) et du récepteur II (Fc gamma RII) sur les cellules monocytaires active un voie de transduction du signal commune aux deux récepteurs Fc qui implique la stimulation de la protéine tyrosine kinase p72 Syk. J Biol Chem. 1993, 268 : 24442-24448.

Charles JF, Humphrey MB, Zhao X, Quarles E, Nakamura MC, Aderem A, Seaman WE, Smith KD : La réponse immunitaire innée à Salmonella enterica sérovar Typhimurium par les macrophages dépend de TREM2-DAP12. Infecter Immun. 2008, 76 : 2439-2447. 10.1128/IAI.00115-08.

Colonna M : TREM dans le système immunitaire et au-delà. Nat Rev Immunol. 2003, 3 : 445-453. 10.1038/nri1106.

Kenny EF, O'Neill LA : Adaptateurs de signalisation utilisés par les récepteurs de type Toll : une mise à jour. Cytokine. 2008, 43 : 342-349. 10.1016/j.cyto.2008.07.010.

Derosa G, D'Angelo A, Tinelli C, Devangelio E, Consoli A, Miccoli R, Penno G, Del Prato S, Paniga S, Cicero AF : Évaluation des taux de métalloprotéinase 2 et 9 et de leurs inhibiteurs chez des sujets diabétiques et sains. Diabète Métab. 2007, 33 : 129-134. 10.1016/j.diabet.2006.11.008.

Hongo S, Watanabe T, Arita S, Kanome T, Kageyama H, Shioda S, Miyazaki A : la leptine module l'expression d'ACAT1 et l'efflux de cholestérol des macrophages humains. Suis J Physiol Endocrinol Metab. 2009, 297 : E474-482. 10.1152/ajpendo.90369.2008.

Ikonen E : Trafic et compartimentation du cholestérol cellulaire. Nat Rev Mol Cell Biol. 2008, 9 : 125-138. 10.1038/nrm2336.

Kolz M, Baumert J, Muller M, Khuseyinova N, Klopp N, Thorand B, Meisinger C, Herder C, Koenig W, Illig T : L'association entre les variations du gène TLR4 et le diabète de type 2 incident est modifiée par le rapport du cholestérol total au HDL-cholestérol. BMC Med Genet. 2008, 9 : 9-10.1186/1471-2350-9-9.

Pagler TA, Neuhofer A, Laggner H, Strobl W, Stangl H : L'efflux de cholestérol via la résécrétion des HDL se produit lorsque le transport du cholestérol hors du lysosome est altéré. J Lipid Res. 2007, 48 : 2141-2150. 10.1194/jlr.M700056-JLR200.

Rader DJ, Pure E : Lipoprotéines, fonction des macrophages et athérosclérose : au-delà de la cellule spumeuse ?. Cellule métab. 2005, 1 : 223-230. 10.1016/j.cmet.2005.03.005.

Shi H, Kokoeva MV, Inouye K, Tzameli I, Yin H, Flier JS : TLR4 relie l'immunité innée et la résistance à l'insuline induite par les acides gras. J Clin Invest. 2006, 116 : 3015-3025. 10.1172/JCI28898.

Tayebjee MH, Tan KT, MacFadyen RJ, Lip GY : taux circulants anormaux de métalloprotéase 9 et de son inhibiteur tissulaire 1 dans la maladie artérielle périphérique prouvée par angiographie : relation avec la gravité de la maladie. J Stagiaire Med. 2005, 257 : 110-116. 10.1111/j.1365-2796.2004.01431.x.

Wang X, Jin W, Rader DJ : la régulation à la hausse de la lipase endothéliale des macrophages par les récepteurs de type péage 4 et 3 module la production d'interleukine-10 et -12 des macrophages. Circ Rés. 2007, 100 : 1008-1015. 10.1161/01.RES.0000263011.34709.c5.

Westerterp M, Berbee JF, Pires NM, van Mierlo GJ, Kleemann R, Romijn JA, Havekes LM, Rensen PC : l'apolipoprotéine C-I est impliquée de manière cruciale dans le développement de l'athérosclérose induite par les lipopolysaccharides chez les souris à apolipoprotéine E-knockout. Circulation. 2007, 116 : 2173-2181. 10.1161/CIRCULATIONAHA.107.693382.

Yvan-Charvet L, Wang N, Tall AR : Rôle des transporteurs HDL, ABCA1 et ABCG1 dans l'efflux de cholestérol et les réponses immunitaires. Arterioscler Thromb Vasc Biol. 2010, 30 : 139-143. 10.1161/ATVBAHA.108.179283.

Tchkonia T, Lenburg M, Thomou T, Giorgadze N, Frampton G, Pirtskhalava T, Cartwright A, Cartwright M, Flanagan J, Karagiannides I, et al: Identification de progéniteurs de cellules graisseuses humaines spécifiques au dépôt à travers des profils d'expression distincts et des modèles de gènes de développement . Suis J Physiol Endocrinol Metab. 2007, 292 : E298-307. 10.1152/ajpendo.00202.2006.

Vohl MC, Sladek R, Robitaille J, Gurd S, Marceau P, Richard D, Hudson TJ, Tchernof A: Une enquête sur les gènes exprimés de manière différentielle dans le tissu adipeux sous-cutané et viscéral chez l'homme. Obes Rés. 2004, 12 : 1217-1222. 10.1038/obby.2004.153.

Historique de pré-publication

L'historique de pré-publication de cet article est accessible ici : http://www.biomedcentral.com/1755-8794/3/34/prepub


Fond

La fermeture éclair à leucine basique (bZIP) représente une famille de super gènes qui code pour des facteurs de transcription. Cette famille de gènes est largement distribuée chez les eucaryotes. Les protéines bZIP, qui sont définies par le domaine bZIP conservé [1, 2], jouent un rôle important dans la régulation de divers processus biologiques, tels que la croissance et le développement des plantes et les réponses au stress salin.

Les protéines de facteur de transcription codées par la famille de gènes bZIP contiennent un domaine bZIP hautement conservé. La structure est composée de 60 à 80 acides aminés, y compris une région de liaison à l'ADN basique et une fermeture éclair à leucine adjacente [2]. La région de liaison contient des signaux de localisation nucléaire et un N-X7-Motif R/K avec des intervalles précis et constants pour contacter l'ADN cible [3]. La région de la fermeture éclair de leucine est composée de répétitions heptadiques de leucine ou d'autres grands acides aminés hydrophobes, et le nombre de répétitions dans différents gènes peut varier considérablement [3, 4]. La leucine est située à la septième position des acides aminés de la séquence heptapeptide et peut être remplacée par l'isoleucine, la valine, la phénylalanine ou la méthionine [3]. Les protéines bZIP fonctionnent généralement en formant des dimères à travers la fermeture éclair à leucine [4]. Les facteurs de transcription végétaux bZIP ont une préférence de liaison pour les séquences centrales de l'ACGT, telles que la boîte A (TACGTA), la boîte C (GACGTC) et la boîte G (CACGTG). De plus, ils se lient également à d'autres motifs de séquence d'ADN [3, 4]. Les flancs externes de l'élément central régulent la spécificité des interactions protéine-ADN [3]. Des études antérieures ont indiqué que les duplications du génome segmentaire et les événements de duplication du génome entier peuvent expliquer l'expansion de la famille de gènes bZIP [2, 5]. En ce qui concerne la classification, les chercheurs ont initialement divisé les membres de la famille du gène bZIP en 10 groupes chez Arabidopsis, sur la base de domaines communs [3]. Ensuite, les gènes bZIP d'Arabidopsis ont été mis à jour et divisés en 13 groupes (A-M) [4].

La famille de gènes bZIP joue un rôle important dans les processus biologiques, tels que la croissance et le développement, la maturation des fleurs et les réponses au stress chez les plantes. L'Arabidopsis bZIP11 Le gène a un impact sur le développement des racines en liant des signaux de faible énergie au contrôle de la croissance primaire des racines par l'intermédiaire de l'auxine [6]. HY5 code pour une protéine bZIP, impliquée dans la régulation du développement des racines et des hypocotyles d'Arabidopsis [7]. Surexpression de ZmbZIP4 chez le maïs entraîne une augmentation du nombre de racines latérales, des racines primaires plus longues et un système racinaire amélioré [8]. Les protéines bZIP régulent également les réponses des plantes aux stress abiotiques, tels que le stress salin. Surexpression de SlAREB Le gène de la tomate peut améliorer la tolérance des plantes à la carence en eau et au stress salin [9]. Des résultats similaires ont été observés pour le GhABF2 gène chez Arabidopsis et le coton [10], ainsi que pour GmbZIP2 dans le soja transgénique [11].

Les études sur la famille de gènes bZIP chez le peuplier se sont concentrées uniquement sur ses fonctions dans le développement des racines et la résistance à la sécheresse. Par exemple, le peuplier PtabZIP1L est principalement exprimé dans les racines et peut favoriser le développement de racines latérales et la résistance à la sécheresse en régulant diverses voies métaboliques [12]. Peuplier bZIP53 est inductible dans l'expression des gènes par le stress salin et régule négativement le développement des racines adventives [13]. Le peuplier AREB1 peut réguler les réponses à la sécheresse et la tolérance des Populus trichocarpa en affectant l'acétylation des histones [14]. L'analyse et la caractérisation complètes de la famille de gènes bZIP du peuplier et le criblage des gènes tissulaires exprimés de manière différentielle (DEG) et des gènes de réponse au stress salin à l'aide du séquençage du transcriptome peuvent fournir une référence importante pour les recherches sur la fonction des gènes et la sélection génétique. De plus, l'utilisation de méthodes bioinformatiques pour révéler les processus biologiques auxquels les gènes peuvent participer aidera à analyser le mécanisme de régulation des gènes. Dans la présente étude, nous avons effectué une enquête systématique sur les gènes bZIP chez le peuplier, y compris l'identification des analyses de séquences protéiques des membres de la famille des gènes et des relations phylogénétiques, la distribution chromosomique des gènes, les duplications en tandem génomiques et les duplications segmentaires et l'analyse de la colinéarité entre les espèces. En outre, sur la base des données de profilage du transcriptome, nous avons également exploré les modèles d'expression différentielle des gènes bZIP dans différents tissus et leurs réponses au stress salin. Enfin, nous avons effectué des analyses de co-expression génique et de réseau sur les gènes clés, suivies d'analyses d'enrichissement de l'ensemble de gènes. Notre approche de biologie des systèmes a mis en lumière des réseaux de gènes différentiels ou des voies biologiques associées à divers processus biologiques.


Matériaux et méthodes

Sélection du jeu de sondes et données d'expression des gènes P450

Une collection de tous les cytochromes P450 de A. thaliana (271 gènes en avril 2005) et les identifiants de locus AGI (Arabidopsis Genome Initiative) correspondants (Atxgxxxxx) ont été récupérés à partir de la « base de données PlaCe Arabidopsis P450 » (tableau 2). Pour 21 gènes P450 annotés à PlaCe, aucun locus AGI n'a été associé. Ceux-ci comprenaient 18 pseudogènes annotés. Deux paires de gènes P450 étaient associées au même locus AGI (CYP71A27P et CYP71A28: At4g20240 CYP71A23 et CYP71A24: At3g48290), laissant un total de 248 loci AGI. Ceux-ci ont été utilisés pour identifier les ensembles de sondes correspondants sur la puce à ADN Affymetrix ATH1 à l'aide de l'outil de sélection de sonde « Genevestigator » [10]. 21 gènes n'étaient pas représentés sur le tableau.Les 227 gènes restants étaient représentés par un total de 229 ensembles de sondes, 26 gènes étant représentés par plus d'un ensemble de sondes et 32 ​​ensembles de sondes représentant plus d'un gène. À l'aide de l'outil de sélection de sondes « Genevestigator », nous avons identifié tous les gènes reconnus par ces ensembles de sondes, et si plus d'un ensemble de sondes était présent pour un gène donné, nous avons sélectionné un seul ensemble de sondes spécifique (si disponible) pour ce gène. Il en a résulté que 216 ensembles de sondes sélectionnés parmi ces 191 reconnaissent un seul gène P450, 21 reconnaissent deux gènes, 3 ensembles de sondes peuvent s'hybrider avec trois gènes et un reconnaît quatre gènes pour un total des 227 P450 représentés, et trois gènes non-P450 ( gènes flanquants qui sont également reconnus par l'ensemble de sondes). Les ensembles de sondes utilisés et les gènes reconnus par ces ensembles de sondes peuvent être trouvés sur la page d'accueil 'CYPedia'.

Nous avons ensuite récupéré les données d'expression normalisées pour ces ensembles de sondes à partir de l'outil « Genevestigator Digital Northern » [10]. Les données ont été téléchargées en mai 2005 (ensemble de données 1), couvrant 1 823 expériences de microarrays, et en avril 2006 (dataset 2, une mise à jour comprenant l'ensemble de données 1) couvrant 2 202 microarrays. Pour chaque jeu de sondes, le bruit de fond a été défini comme l'intensité moyenne du signal de toutes les sondes appelées « absentes » par le logiciel Affymetrix, et toutes les sondes absentes ont été définies sur cette valeur de fond. Si des matrices de réplicats étaient disponibles, l'intensité moyenne de toutes les réplicats a été déterminée. Chaque expérience a été classée dans l'une des quatre catégories suivantes : i) échantillons d'organes et de tissus de plantes de type sauvage, ii) traitement du stress des plantes de type sauvage, iii) traitements hormonaux, nutritifs (privation) et autres de plantes de type sauvage, et iv) les plantes mutantes par rapport aux échantillons de type sauvage traités de manière égale (le cas échéant). Les intensités de signal provenant d'échantillons d'organes et de tissus ont ensuite été comparées aux intensités de fond, générant ainsi un journal2-rapports sur fond. Les intensités des deux groupes de traitement ont été comparées aux intensités de signal des échantillons de contrôle correspondants générant un journal2-les rapports comparant le traitement avec le contrôle, et les intensités des échantillons mutants ont été comparées aux intensités des échantillons de type sauvage traités de la même manière, générant ainsi un log2-rapports pour les mutants par rapport au type sauvage. Chaque ensemble de données a été divisé en 30 groupes d'expression à l'aide du clustering K-means et les cartes thermiques combinées de tous les clusters peuvent être trouvées sur la page d'accueil « CYPedia » en suivant le lien « afficher les matrices ». Pour la visualisation des matrices d'expression, l'outil « HeatMapper » du « Bio-Array Resource (BAR) » [9] a été utilisé et les cartes thermiques résultantes ont été incorporées dans des formats de feuille de calcul couramment utilisés (Adobe PDF, Microsoft Excel et OpenOffice Calc).

Sélection de gènes métaboliques

Une liste de gènes liés à tout aspect du métabolisme des plantes (base de données des voies) a été générée en récupérant tous les A. thaliana gènes, qui ont été annotés dans les bases de données suivantes : i) 'KEGG Orthology (KO) – Arabidopsis thaliana' (KEGG) [59], ii) les 'Metabolic Pathways' à 'The Arabidopsis Information Resource' (AraCyc) [60] iii ) la 'Arabidopsis Lipid Gene Database' (AcylLipid) [61], iv) la 'Biochemical Pathway Knowledge Database' (BioPathAt) [34], v) une sélection de publications consacrées à l'annotation des voies métaboliques secondaires (Litpath) [30 –33, 35, 62]. Les informations de toutes les bases de données ont été combinées dans une matrice de données et des ensembles de sondes Affymetrix ont été sélectionnés pour l'ensemble de gènes uniques comme décrit ci-dessus, ce qui a donné 4 129 ensembles de sondes uniques. Pour cet ensemble de gènes, des annotations dérivées du « Catalogue fonctionnel » du « Munich Information Center for Protein Sequences (MIPS-FunCat) [36] et des termes « GeneOntology » de TAIR [63] ont été ajoutées (c'est-à-dire ayant la preuve code IDA [inféré d'un essai direct], IMP [inféré du phénotype mutant] et/ou TAS [déclaration de l'auteur traçable].

Chaque gène a reçu un score d'annotation de voie avec : dix points pour les gènes caractérisés biochimiquement (c'est-à-dire une annotation comme « fonctionnelle » dans « AcylLipid » ou « BioPath », ou identifié dans des revues de la littérature) neuf points pour les gènes ayant une fonction biochimique immédiate décrite comme IDA dans TAIR-GO, huit points pour les gènes annotés comme « fonctionnels (?) » ou « inférés à partir du phénotype mutant » dans « AcylLipid », « BioPath » ou la littérature sept points pour les gènes avec le code de preuve IMP à TAIR-GO six points pour les gènes avec un phénotype mutant décrit, mais avec une fonction moléculaire peu claire cinq points pour les gènes présentant une forte similarité (WU-BLAST e < 10 -50 ) avec un gène végétal caractérisé quatre points pour les gènes présentant de fortes similarités avec un autre gène végétal, mais fonction de ce gène non validé trois points pour les gènes présentant une similarité (WU-BLAST 10 -10 e < 10 -50 ) avec un gène végétal caractérisé deux points pour les gènes présentant de faibles similarités (WU-BLAST e > 10 -10 ) avec un gène végétal caractérisé un point pour les membres du grand familles de gènes présentant de faibles similitudes (WU-BLAST e > 10 -10 ) avec un gène végétal caractérisé.

Analyse de co-expression et cartographie des voies

Les données d'expression Affymetrix pour les 4 129 ensembles de sondes sélectionnés ont été récupérées et traitées comme décrit ci-dessus pour les P450 et les matrices d'expression ont été fusionnées. L'analyse de co-expression a été réalisée comme décrit précédemment [9]. En bref, les vecteurs d'expression étaient centrés sur la moyenne et les coefficients de corrélation de Pearson (valeurs r) ont été calculés entre le vecteur d'expression de chaque P450 et ceux des 4 129 gènes de l'« étang » pour chaque ensemble de données. Les manipulations ultérieures ont été effectuées en utilisant l'environnement R [64]. Pour chaque P450 et ensemble de données, les gènes co-exprimés avec r > 0,5 ont été récupérés et les voies biochimiques correspondantes ont été extraites de la base de données des voies (voir ci-dessus). Pour chaque voie, le nombre de gènes co-exprimés a été compté et la somme des scores d'annotation (voir ci-dessus) a été calculée. La voie n'a été retenue que lorsqu'au moins un gène de la liste avait plus de six points d'annotation. Le nombre et le score de gènes co-exprimés dans une voie donnée ont été comparés au nombre total et au score de tous les gènes de cette voie. Sur la base d'une analyse de distribution hypergéométrique à queue, seules les voies surreprésentées dans le groupe de gènes co-exprimés (p [hyper] < 0,005) ont été retenues. Par la suite, les voies identifiées dans les quatre ensembles de données ont été identifiées et le nombre et les scores de gènes trouvés dans chaque ensemble de données ont été additionnés. Les tableaux résultants ont été triés en fonction des scores et importés dans un modèle OpenOffice Calc (OpenOffice.org). format html. Les résultats pour chaque P450 sont disponibles sur la page Web « Pathway Map » pour chaque P450. Les données d'expression et les données d'informations sur les voies pour les gènes co-exprimés (r > 0,5 pour un maximum de 50 gènes) ont été fusionnées et triées selon la valeur r. Les tableaux d'expressions ont été codés par couleur à l'aide de l'outil « Heatmapper plus » au « BAR » et enregistrés sous forme de pages Web statiques liées aux cartes de voies correspondantes.

Comparaison des plates-formes de baies

Les données d'expression de P450 générées à l'aide d'un microréseau tacheté couvrant des produits de PCR spécifiques à un gène ont été récupérées à partir de la page Web « Functional Genomics of Arabidopsis P450s » (tableau 1). En utilisant cette plate-forme à double canal (CYP-array), les intensités de signal dans les racines de semis âgés d'une semaine (et de quatre autres organes) ont été générées par rapport à un échantillon « d'ARN universel ». Cet « ARN universel » est constitué d'un mélange d'ARN dérivés de racines et de pousses de semis et de feuilles, de tiges et de fleurs de plantes matures [2]. Afin de générer un « contrôle universel » similaire à partir de puces ATH1 publiques, nous avons sélectionné 14 échantillons de pousses de semis, 9 échantillons de feuilles de plantes matures, 17 échantillons de racines de semis, 19 échantillons de fleurs entières et 10 échantillons de tiges à partir des données d'organes traitées. ensemble (voir ci-dessus). Nous avons ensuite calculé le log moyen2 les intensités sur le fond forment tous les échantillons et l'ont comparée à l'intensité moyenne des échantillons de racine et ont ainsi créé des rapports racine/« contrôle universel » similaires à ceux de la matrice CYP. Pour ce dernier, les intensités non détectables ont été fixées artificiellement à un ratio de 0,05 par rapport au contrôle universel et les ratios ont été log2-transformé. Les données d'expression pour les gènes représentés sur les deux plates-formes étaient centrées en moyenne sur les expériences. Sur la base d'un modèle de régression linéaire comparant les deux ensembles de données, une valeur R 2 a été calculée.


Voir la vidéo: Architecture du génome 2015 partie 1 (Juillet 2022).


Commentaires:

  1. Willaburh

    Aha, il me semblait aussi.

  2. Wamocha

    Je me suis spécialement inscrit sur le forum pour vous remercier de votre soutien, comment puis-je vous remercier ?

  3. Kamden

    Je ne peux pas participer à la discussion en ce moment - je suis très occupé. Je serai libre - j'écrirai certainement ce que je pense.

  4. Ten Eych

    Je félicite, on vous a visité avec une excellente idée

  5. Black

    Et sur ce que nous arrêterons?

  6. Lohengrin

    je ne vois pas ta logique



Écrire un message