Informations

Que signifient ces nouveaux sites d'épissage ?

Que signifient ces nouveaux sites d'épissage ?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je suis sûr que la réponse est évidente pour certains d'entre vous mais je viens de terminer mon stage où nous avons trouvé de nouvelles jonctions d'épissage (junctionseq; RNAseq data) (voir le fichier joint) et j'ai quelques difficultés avec les jonctions d'épissage. Je comprends que les reads puissent se mapper à la jonction de 2 exons (qui peuvent être liés à l'évaluation de la qualité) et qu'en comparant 2 conditions, on peut trouver des groupes d'exons plus "associés" mais je ne comprends pas :

  • Comment une nouvelle jonction peut être découverte dans une jonction précédente (sub1), ou derrière le dernier exon d'un gène (sub2) et donc, quelle(s) peut en être la ou les conséquences

Une jonction d'épissage est formée à partir d'un pré-ARNm (ou transcrit primaire) chaque fois qu'un intron est retiré ou épissé. Deux segments d'ARN qui étaient auparavant séparés dans le pré-ARNm sont maintenant liés l'un à l'autre, formant une jonction de deux exons.

Les lectures RNA-Seq qui couvrent un tel site de jonction d'épissage ne s'aligneraient pas très bien sur la séquence génomique. Cependant, si vous créez un fichier de toutes les jonctions d'épissage potentielles simulées, certaines lectures RNA-Seq peuvent maintenant s'aligner parfaitement.

La distinction entre ce qui constitue un intron et ce qui constitue un exon est purement empirique. S'il est vrai que le complexe spliceosomal reconnaît et se lie préférentiellement à des sites donneurs d'épissage et accepteurs d'épissage correctement juxtaposés, une variété de transcrits matures traités différents peuvent résulter d'un seul transcrit primaire. Cette analyse différentielle des séquences agissant en cis aux frontières des introns et des exons potentiels est appelée épissage alternatif.


Épissage des gènes

l'une des unités biologiques de l'hérédité, auto-reproductrice et située à une position définie (locus) sur un chromosome particulier. Les gènes constituent des segments de la molécule complexe d'acide désoxyribonucléique (ADN) qui contrôle la reproduction et la fonction cellulaires. Il y a des milliers de gènes dans les chromosomes de chaque noyau cellulaire, ils jouent un rôle important dans l'hérédité car ils contrôlent les traits physiques, biochimiques et physiologiques individuels hérités par la progéniture de leurs parents. Grâce au code génétique de l'ADN, ils contrôlent également les fonctions quotidiennes et la reproduction de toutes les cellules du corps. Par exemple, les gènes contrôlent la synthèse des protéines structurelles ainsi que les enzymes qui régulent diverses réactions chimiques qui se déroulent dans une cellule.

Le gène est capable de se répliquer. Lorsqu'une cellule se multiplie par mitose, chaque cellule fille porte un ensemble de gènes qui est une réplique exacte de celle de la cellule mère. Cette caractéristique de réplication explique comment les gènes peuvent porter des traits héréditaires à travers les générations successives sans changement.


Introduction

L'épissage est un processus biologique fondamental dans lequel les introns sont coupés des ARN précurseurs et les exons sont joints ensemble. L'épissage alternatif fait référence à l'utilisation alternative des exons. On estime qu'environ 95 % des gènes multi-exons humains subissent un épissage alternatif [1]. Le saut d'exon (appelé exons de cassette) est le modèle d'épissage alternatif le plus courant [2]. Le niveau de saut d'un exon est généralement quantifié avec le pourcentage d'épissage (PSI ou ??) [3]. Le pourcentage d'épissage peut être estimé à partir des données de séquençage de l'ARN (RNA-Seq) en tant que nombre de lectures fractionnées d'ARN-Seq prenant en charge l'inclusion de l'exon divisé par le nombre total de lectures fractionnées prenant en charge le saut ou l'inclusion de l'exon. L'épissage est un processus complexe qui implique une régulation par des éléments de séquence dans les exons et les introns adjacents [4, 5]. De plus, l'épissage alternatif est souvent tissu-spécifique [2, 3, 6, 7]. Cela signifie que certaines isoformes d'épissage ne sont présentes que dans certains tissus ou que les abondances relatives des isoformes d'épissage diffèrent d'un tissu à l'autre. L'épissage alternatif joue un rôle important dans le développement tissulaire et la formation de l'identité tissulaire [8, 9]. L'analyse des rôles de codage des protéines des exons spécifiques aux tissus a révélé leur rôle essentiel dans le recâblage des réseaux d'interaction protéique dans différents tissus [10]. Les motifs d'épissage tissu-spécifiques sont associés à de courts motifs d'ARN [2, 11-14]. Ces motifs d'ARN courts codent pour des éléments régulateurs d'épissage tissu-spécifiques, typiquement des sites de liaison introniques ou exoniques pour des facteurs d'épissage avec une activité tissu-spécifique. Les facteurs d'épissage spécifiques aux tissus des mammifères comprennent Nova1, Nova2, PTB/nPTB et RBFOX1 pour les tissus nerveux et MBNL1 pour les muscles, entre autres. Pour une revue, voir Chen et Manley [15].

Les défauts d'épissage représentent une fraction importante de la base génétique des maladies humaines [16–18]. Certains de ces défauts d'épissage sont spécifiques aux tissus concernés par la maladie. Par exemple, les personnes atteintes de troubles du spectre autistique (TSA) présentent fréquemment un mauvais épissage des exons spécifiques du cerveau [19-21] ainsi qu'un enrichissement des mutations de novo dans les exons spécifiques du cerveau [22]. Par conséquent, des outils informatiques capables de prédire les effets spécifiques aux tissus des variantes génétiques sur l'épissage seraient pertinents pour comprendre la base génétique des maladies spécifiques aux tissus telles que les TSA.

De nombreux outils informatiques ont été développés pour prédire les sites d'épissage ou la force d'épissage à partir de la séquence [23-33]. Cependant, les outils manquent pour prédire les effets spécifiques aux tissus des variantes génétiques humaines sur l'épissage. Barash et al. ont développé le premier modèle basé sur des séquences prédisant l'épissage tissu-spécifique dans les cellules de souris [34]. Le modèle intègre des éléments de séquence régulatrice pour prédire qualitativement si l'inclusion d'un exon de cassette augmente, diminue ou reste à un niveau similaire d'un tissu à un autre. Ce modèle a été encore amélioré pour prédire les changements directionnels entre les tissus ainsi que discrétisés ?? catégories (faible, moyenne et élevée) au sein d'un tissu en utilisant un réseau de neurones bayésien avec des variables cachées [35]. Dans une étude ultérieure, un réseau neuronal bayésien similaire (SPNR) a été formé sur des données humaines [29]. Cependant, SPANR a été évalué uniquement pour prédire l'effet le plus important sur tous les tissus étudiés. Par conséquent, la performance de SPANR sur un tissu donné n'est pas claire. De plus, le SPANR accessible au public ne permet pas d'effectuer des prédictions spécifiques aux tissus.

Nous avons précédemment développé MMSplice, un réseau de neurones avec une conception modulaire qui prédit l'effet des variantes sur l'épissage [30, 31]. Contrairement à SPANR, qui a été formé sur la séquence génomique endogène naturelle, MMSplice exploite les données de perturbation d'un essai de rapporteur massivement parallèle récemment publié [28]. MMSplice a surpassé SPANR et de nombreux autres prédicteurs d'épissage dans la prédiction ?? les variations associées aux variants génétiques naturels ainsi que les effets des variants sur le pourcentage d'épissage mesurés par des tests de rapporteurs [30, 36]. MMSplice modélise le rapport de cotes d'un exon de cassette à épisser lors de la comparaison d'une séquence alternative à une séquence de référence. Les rapports de cotes prédits sont les mêmes pour tous les tissus, car MMSplice a été entraîné de manière agnostique aux tissus et ne capture donc pas les effets des variantes affectant les éléments régulateurs spécifiques aux tissus.

Des modèles d'apprentissage en profondeur d'éléments régulateurs spécifiques aux tissus ont été développés pour d'autres processus biologiques. Ces modèles incluent DeepSEA pour les profils de chromatine [37], Basset pour l'hypersensibilité à la DNase I [38], ExPecto pour l'expression de gènes spécifiques aux tissus [39], FactorNet pour la liaison au facteur de transcription [40] et ChromDragoNN pour l'accessibilité de la chromatine [41]. Un dénominateur commun de ces modèles est qu'ils sont entraînés par apprentissage multitâche, c'est-à-dire que les modèles font des prédictions conjointes pour tous les tissus ou types de cellules en utilisant un ensemble commun de caractéristiques prédictives sous-jacentes. Cette stratégie permet aux modèles de regrouper efficacement les informations sur les éléments régulateurs qui sont partagés entre les types de cellules ou les tissus.

Ici, nous avons développé MTSplice (Multi-tissue Splicing), un modèle qui prédit les effets d'épissage spécifiques aux tissus des variantes génétiques humaines. MTSplice ajuste les prédictions de MMSplice avec les prédictions de TSplice (Tissue-specific Splicing), un nouveau réseau de neurones profonds prédisant les variations tissu-spécifiques de ?? à partir d'une séquence que nous avons entraînée sur 56 tissus humains en utilisant l'apprentissage multi-tâches. La performance de MTSplice est démontrée en prédisant les variations tissu-spécifiques de ?? associés à des variantes génétiques naturelles de l'ensemble de données GTEx ainsi qu'à l'étude des prédictions d'effet d'épissage spécifiques au cerveau pour les variantes associées à l'autisme. MTSplice est open-source et disponible gratuitement sur le référentiel de modèles Kipoi [42].


Matériaux et méthodes

Échantillons de plasma humain

Les profils de protéines plasmatiques ont été collectés par le Hoosier Oncology Group (HOG) (Indianapolis, IN, USA). Chaque échantillon a été analysé en un seul lot par spectrométrie de masse. Dans l'étude, 80 échantillons de plasma ont été collectés (40 échantillons prélevés sur des femmes atteintes d'un cancer du sein et 40 sur des femmes volontaires en bonne santé qui ont servi de témoins). Un ensemble de données de validation indépendant de 80 échantillons qui contient 40 échantillons prélevés sur des femmes diagnostiquées avec un cancer du sein et 40 sur des femmes volontaires en bonne santé qui ont servi de témoins ont également été collectés par le Hoosier Oncology Group (HOG) (Indianapolis, IN, USA) et est comparable à l'étude de la démographie et de la distribution clinique des stades/sous-types de cancer du sein. Par exemple, la plupart des patientes impliquées dans les deux études ont reçu un diagnostic de cancer du sein à un stade précoce (stade I ou II), appartenaient au groupe d'âge compris entre 40 et 65 ans et avaient une taille tumorale moyenne de 2,2.

Identification et quantification des protéines

Pour l'identification des protéines, les peptides trypsiques ont été analysés à l'aide d'un spectromètre de masse à piège à ions linéaire Thermo-Fisher Scientific (LTQ) couplé à un système HPLC Surveyor. Les peptides ont été élués avec un gradient de 5 à 45 % d'acétonitrile développé en 120 minutes et les données ont été recueillies dans le triple jeu mode (MS Scan, zoom scan et MS/MS scan). Les données de liste de pics brutes acquises ont été générées par XCalibur (version 2.0) à l'aide des paramètres par défaut et analysées plus avant par l'identification sans étiquette et l'algorithme quantitatif à l'aide des paramètres par défaut décrits par Higgs et al [33]. Des recherches dans la base de données MS ont été effectuées par rapport à l'ensemble de données de protéines combinées de l'International Protein Index et de la base de données de protéines humaines non redondante NCBI-nr, qui totalisait 22 180 enregistrements de protéines. Des filtres de traitement de données carieux pour l'identification des protéines ont été appliqués pour ne conserver que les peptides avec un score XCorr supérieur à 1,5 pour les peptides à charge simple, 2,5 pour les peptides à double charge et 3,5 pour les peptides à triple charge. Ces scores XCorr ont été définis selon une analyse discriminante linéaire similaire à celle décrite dans DTASelect (version 2.0) pour contrôler le taux de faux positifs à des niveaux inférieurs à 5 %.

Pour la quantification des protéines, tout d'abord, tous les chromatogrammes d'ions extraits (XIC) ont été alignés par temps de rétention. Chaque pic aligné correspondait à l'ion précurseur, à l'état de charge, aux ions fragmentés des données MS/MS et au temps de rétention dans une fenêtre d'une minute. Ensuite, après alignement, l'aire sous la courbe (AUC) pour chaque pic aligné individuellement de chaque échantillon a été mesurée, normalisée et comparée pour l'abondance relative - le tout comme décrit dans [33]. Ici, un modèle mixte linéaire généralisé à partir de l'ANOVA (Analyse de la Variance) individuelle a été utilisé pour quantifier les intensités protéiques. En principe, le modèle linéaire mixte considère trois types d'effets lors de la dérivation des intensités protéiques sur la base de la moyenne pondérée des intensités peptidiques normalisées quantiles : 1) effet de groupe, qui fait référence aux effets fixes non aléatoires causés par les conditions expérimentales ou les traitements qui sont comparés 2) effet échantillon, qui fait référence aux effets aléatoires (y compris ceux résultant de la préparation d'échantillons) d'échantillons biologiques individuels au sein d'un groupe 3) effet de réplique, qui fait référence aux effets aléatoires d'injections répétées à partir de la même préparation d'échantillon.

Approche peptidomique pour rechercher une nouvelle isoforme d'épissage alternatif dans les données de protéomique

Notre approche peptidomique pour identifier de nouvelles isoformes d'épissage alternatif dans les données de protéomique comprend trois étapes (Figure ​ (Figure 1) : 1) : 1) la construction d'une base de données synthétique d'isoformes d'épissage alternatif pour les expériences de protéomique 2) identification, caractérisation de l'isoforme d'épissage alternatif à l'aide protéomique et 3) validation de l'isoforme d'épissage alternatif.


Discussion

Dans cette étude, nous avons examiné les structures de transcription pleine longueur des isoformes d'épissage aberrantes en utilisant des données de séquençage à lecture longue. Nous avons construit un catalogue de telles isoformes pour les CBNPC. Pour remédier au séquençage inexact de MinION, nous avons utilisé des données de séquençage à lecture courte pour identifier les jonctions d'épissage exactes. Cette approche a révélé un nombre substantiel de nouveaux transcrits aberrants et certaines de ces isoformes ont été détectées sous forme de peptides par l'analyse du protéome. De plus, un test ELISpot a démontré qu'au moins certaines de ces isoformes, ayant une forte antigénicité, avaient le potentiel de devenir des néo-antigènes. Ces résultats montrent clairement la capacité du séquençage à lecture longue à rechercher de nouvelles isoformes et néo-antigènes qui peuvent être négligés par les approches actuelles de séquençage à lecture courte.

En milieu clinique, le TMB, qui est déterminé par le nombre total de mutations non synonymes, est considéré comme un prédicteur de l'efficacité de l'immunothérapie contre le cancer. Cependant, la précision de la prédiction n'est pas suffisante pour de nombreux types de cancer. La présente étude montre que les mutations aberrantes d'isoformes d'épissage et de décalage du cadre de lecture ont un potentiel important pour produire un plus grand nombre de néoantigènes. De nombreux rapports précédents suggèrent que ce potentiel peut avoir une influence sur la formation du paysage immunitaire tumoral des patients en plus de la TMB génomique [28,29,30]. Lorsque les transcriptomes ne peuvent pas être examinés directement dans un contexte clinique donné, le statut NMD et d'autres facteurs d'épissage peuvent fournir des informations importantes. En effet, des rapports antérieurs ont indiqué que le nombre de mutations de décalage du cadre de lecture qui ne devraient pas déclencher la NMD est plus élevé chez les répondeurs à l'immunothérapie et que ce facteur combiné au TMB améliore la précision de la prédiction pour les répondeurs à l'immunothérapie [61].

Nous nous sommes principalement concentrés sur le NSCLC dans cette étude. Cependant, nous avons pu identifier des isoformes aberrantes potentielles pour d'autres types de cancer en considérant notre catalogue complet. Évidemment, lorsque plus de types de cancer seront ajoutés au catalogue, la sensibilité et la sélectivité de la détection augmenteront encore. Notez également que, puisque GTEx est basé sur des ensembles de données de séquençage d'ARN à lecture courte, la représentation des jonctions dans GTEx n'indique pas nécessairement l'existence de l'isoforme sous sa forme complète dans les tissus normaux. Pour calculer et extraire des modèles d'isoformes vraiment spécifiques au cancer, nous devrions générer un ensemble de données plus important d'isoformes à lecture longue pour les tissus normaux dans une étude future. Des analyses plus approfondies permettraient d'élucider la possibilité que ces caractéristiques transcriptomiques fournissent un indicateur complémentaire pour prédire l'efficacité de l'immunothérapie, en plus des caractéristiques génomiques.


Discussion

L'épissage alternatif de l'ARN du récepteur 5-HT1A humain altère sa stabilité

Malgré son rôle fondamental dans la neurotransmission sérotoninergique et les troubles de l'humeur, la séquence complète de l'ARNm 5-HT1A a été incomplètement caractérisée. Bien que longtemps considéré comme un gène « sans intron » (Fargin et al., 1988 Charest et al., 1993), nous montrons que le 5-HT1A 3′-UTR humain est alternativement épissé en trois isoformes d'ARNm qui diffèrent grandement par leur stabilité et leur capacité de traduction. sortir. Corroborant nos résultats, le variant LS a été identifié dans les bases de données RNAseq (National Center for Biotechnology Information Homo Sapiens annotation release 108), mais jamais réellement caractérisé. Chez le rongeur HTR1A gènes, les sites accepteurs/donneurs d'épissage sont mal conservés et l'épissage n'a pas été détecté (Fig. 1). En revanche, la comparaison des séquences des macaques rhésus et des 5-HT1A 3′-UTR humains montre une forte homologie (93 % d'identité) et une conservation des sites d'épissage (Fig. 1E), suggérant que l'épissage 5-HT1A peut se produire chez d'autres primates. Ceci est cohérent avec les preuves à l'échelle du génome que l'incidence de l'épissage augmente avec l'évolution (Barbosa-Morais et al., 2012 Gueroussov et al., 2015), et la présence d'introns dans l'ARNm 5-HT1A 3′-UTR confère un mécanisme puissant pour le réglage dépendant de l'épissage de l'expression du récepteur 5-HT1A chez les primates. L'élucidation des mécanismes spécifiques à l'homme ou aux primates [par exemple, les mécanismes dépendants des miARN (Lopez et al., 2014)] impliqués dans la dépression peut fournir de nouvelles cibles et des informations qui ne peuvent pas être glanées à partir de modèles de rongeurs.

La présence d'introns 3'-UTR n'est présente que dans 6 % des gènes (Bicknell et al., 2012) et produit généralement des ARNm très instables dégradés par la NMD. Cependant, ce n'est pas le cas pour les variants d'ARNm 5-HT1A épissés, qui sont extrêmement stables par rapport à la forme non épissée. Par conséquent, nous avons abordé le rôle de miR135 dans l'épissage induit HTR1A stabilisation, puisque miR135 agit sur un site hautement conservé au sein de la HTR1A intron pour réguler négativement les niveaux d'ARN du récepteur 5-HT1A (Issler et al., 2014). Dans les neurones 5-HT murins, miR135 est rapidement induit par les antidépresseurs imipramine et fluoxétine, et la surexpression de miR135 dans les neurones 5-HT régule négativement l'ARN du récepteur 5-HT1A et réduit l'anxiété et la dépression dans le modèle de défaite sociale chronique (Issler et al. , 2014). En revanche, le knockdown de miR135 dans le raphé a augmenté l'anxiété et a révélé un comportement de type dépression induit par les inhibiteurs sélectifs de la recapture de la sérotonine (ISRS), tout en empêchant les actions anxiolytiques induites par les ISRS. Ces résultats sont cohérents avec un rôle clé de miR135 dans la suppression de l'expression des autorécepteurs 5-HT1A et de ses conséquences comportementales. Nos données montrent que HTR1A l'épissage empêche la déstabilisation médiée par miR135 en supprimant le site de liaison miARN. Ce constat dans le HTR1A La 3′-UTR fournit une preuve supplémentaire de ce nouveau mécanisme de stabilisation de l'ARN (Mohr et Mott, 2015).

NSR100 et PTBP1 comme déterminants de l'épissage de l'ARNm 5-HT1A

Les protéines de liaison à l'ARN spécifiques aux tissus qui favorisent ou bloquent l'inclusion d'exons alternatifs dans les transcrits d'ARN sont des régulateurs importants de l'épissage alternatif (Lee et Rio, 2015). En manipulant plusieurs régulateurs d'épissage enrichis dans le cerveau et en examinant les changements dans l'épissage de l'ARNm 5-HT1A, nous avons constaté que l'épissage de l'ARN 5-HT1A est réprimé par PTBP1, mais amélioré par nSR100. Cependant, nous ne pouvons pas exclure la possibilité qu'un autre facteur d'épissage en aval de PTBP1 ou nSR100 puisse intervenir ou contribuer à la régulation de l'épissage de l'ARNm 5-HT1A. PTBP1, un répresseur ubiquitaire de l'épissage, est régulé à la baisse par miR124 au cours de la différenciation neuronale, permettant l'expression de PTBP2 et l'activation d'un programme d'épissage spécifique aux neurones (Makeyev et al., 2007). Les faibles niveaux basaux d'épissage de l'ARNm 5-HT1A dans les lignées cellulaires semblent être principalement dus à une expression élevée de PTBP1, puisque le knockdown de PTBP1 a augmenté HTR1A l'épissage malgré une augmentation de PTBP2, un répresseur plus faible de l'épissage (Markovtsov et al., 2000). En revanche, nSR100 favorise l'inclusion d'un certain nombre d'exons spécifiques aux neurones (Raj et al., 2014), et sa surexpression dans les cellules SKN-SH a augmenté les niveaux de la variante SS, que nous n'avons pas détectés dans le tissu cérébral. Cela suggère que des régulateurs d'épissure supplémentaires non présents dans les cellules SKN-SH peuvent être nécessaires pour un épissage 5-HT1A approprié in vivo. Une régulation opposée de l'épissage par PTBP1 et nSR100 a été rapportée pour d'autres gènes neuronaux, y compris PTBP2 (Calarco et al., 2009 Raj et al., 2014). Nos données suggèrent que dans les cellules neuronales, des niveaux inférieurs de PTBP1 combinés à la présence de nSR100 favorisent la synthèse de l'isoforme d'ARN 5-HT1A épissé stable pour augmenter les niveaux de récepteurs (Fig. 5H), alors que dans les cellules non neuronales, PTBP1 inhibe fortement l'épissage et l'expression des récepteurs. Il est important de noter que les différences régionales dans les niveaux de nSR100 et de PTBP1 semblent également affecter l'épissage 5-HT1A in vivo.

Régulation de l'épissage de l'ARNm 5-HT1A dans le cerveau humain

Conformément à la prévalence de l'épissage alternatif dans le cerveau humain (Kang et al., 2011), nous avons constaté que HTR1A l'épissage dans le cerveau humain post-mortem était plus important que dans les lignées cellulaires et était spécifique à une région. Spécifique à la région HTR1A l'épissage semblait être principalement motivé par l'expression de nSR100 : il était le plus faible dans le mésencéphale/hippocampe, où une faible expression de nSR100 et une expression élevée de PTBP1 étaient associées à une augmentation des non-épissages. HTR1A ARN, tandis que des niveaux plus élevés de nSR100 dans le PFC étaient associés à une réduction de l'ARNm non épissé et à des ratios épissés/non épissés plus élevés (Fig. 5H). Alors que nSR100 a été fortement impliqué dans l'épissage du développement cérébral (Calarco et al., 2009 Irimia et al., 2014 Raj et al., 2014), nos résultats suggèrent qu'il peut être important dans la régulation dynamique de l'expression de l'ARN spécifique à une région. De plus, un épissage réduit pour augmenter la régulation négative induite par miR135 de l'ARN 5-HT1A (Issler et al., 2014) pourrait également contribuer à la réduction préférentielle des récepteurs 5-HT1A observée dans le mésencéphale et l'hippocampe après un traitement chronique par ISRS dans la dépression humaine (Gray et al., 2013) et l'anxiété, respectivement (Spindelegger et al., 2009). La spécificité régionale de HTR1A l'épissage établit un nouveau mécanisme de régulation différentielle des récepteurs 5-HT1A postsynaptiques et présynaptiques, complémentaire aux mécanismes transcriptionnels (Czesak et al., 2006, 2012).

Dans le PFC des individus déprimés, il y avait une réduction significative du rapport d'épissage, compatible avec une réduction de nSR100, bien que la réduction de PTBP1 puisse partiellement contrecarrer l'effet des niveaux réduits de nSR100. Des études d'imagerie et d'autopsie ont rapporté des réductions des récepteurs corticaux 5-HT1A dans la dépression (López-Figueroa et al., 2004 Savitz et al., 2009 Szewczyk et al., 2009), un phénotype qui réduit l'épissage 5-HT1A pourrait contribuer à . En revanche, les autorécepteurs présynaptiques 5-HT1A semblent être régulés à la hausse dans la dépression (Stockmeier et al., 1998 Boldrini et al., 2008 Hesselgrave et Parsey, 2013), ce qui est cohérent avec leur rôle dans l'inhibition de l'activité neuronale 5-HT. Bien que nous n'ayons pas observé de réduction significative de l'ARN 5-HT1A total dans le PFC, la plupart des études montrent des changements très localisés dans les récepteurs 5-HT1A du cortex frontal qui peuvent avoir été manqués dans le tissu que nous avons étudié.

Plusieurs humains HTR1A les polymorphismes mononucléotidiques (SNP) sont associés à la dépression (Kishi et al., 2013), y compris le promoteur fonctionnel SNP rs6295 C(-1019)G (Lemonde et al., 2003), qui a été associé à une expression accrue de 5 -Autorécepteurs HT1A (Hesselgrave et Parsey, 2013) et une réduction des récepteurs PFC 5-HT1A (Kautzky et al., 2017). Il existe plusieurs SNP situés à proximité de la région épissée, dont deux sont en fort déséquilibre de liaison avec rs6295-C/G : rs6449693 T/C et rs878567 C/T (Donaldson et al., 2016). HTR1A L'ARN avec l'allèle rs878567-C est l'allèle le plus fortement exprimé dans un PFC normal, mais est réduit dans un PFC déprimé (Donaldson et al., 2016). Cela suggère un effet stabilisant du rs878567-C, peut-être en augmentant HTR1A ARN. Cependant, HTR1A Les niveaux d'ARN sont également influencés par la transcription allèle-spécifique du promoteur rs6295-C SNP (Lemonde et al., 2003). Fait intéressant, le SNP rs749099 A/G se trouve à quelques nucléotides du site accepteur d'épissage et pourrait affecter l'épissage. D'autres études seront nécessaires pour examiner le lien entre le promoteur et les SNP 3′-UTR et leur impact sur l'épissage 5-HT1A, les niveaux de récepteur et la dépression majeure.

En résumé, nos données fournissent la première preuve de l'altération HTR1A épissage dans la dépression. Deux autres gènes sérotoninergiques sont régulés par épissage alternatif (HTR2C et TPH2), et l'altération de leurs schémas d'épissage est en corrélation avec les troubles psychiatriques (Grohmann et al., 2010 Zhang et al., 2011 Martin et al., 2013). Cependant, les facteurs d'épissage impliqués sont inconnus. Nous proposons que les changements liés à la dépression dans l'expression ou l'activité du facteur d'épissage pourraient potentiellement affecter de nombreux gènes neuronaux soumis à une régulation par épissage (Calarco et al., 2009 Raj et al., 2014). D'autres études comme celle-ci sont nécessaires pour élucider les mécanismes qui régulent l'épissage spécifique à une région du cerveau et leur impact sur la fonction cérébrale et la maladie.


Méthodes

Synthèse de romans resvéralogues

Resvératrol (Sigma Aldrich, Royaume-Uni 1) a été utilisé pour synthétiser le dihydroresvératrol 2 comme rapporté précédemment [47]. (E)-N-(4-(3,5-Diméthoxystyryl)phényl)méthanesulfonamide 3 a été synthétisé à partir de l'analogue nitro-substitué précédemment rapporté 7 via un Fe/NH4Réduction de Cl pour donner une amine 8 [26], suivi d'une sulfonylation au chlorure de méthanesulfonyle (Fig. 1b). L'amide correspondant 9 a également été préparé à partir de 8, par acylation avec du chlorure d'acétyle. Le produit 9 a subi une déméthylation (BBr3, CH2Cl2) pour donner le composé cible (E)-N-(4-(3,5-dihydroxystyryl)phényl)acétamide 4. (E)-5-(4-(3,5-diméthoxystyryl)phényl)-1H–tétrazole 5 et l'isomère 2-1H-analogue du tétrazole 6 ont été préparés directement par cycloaddition catalysée par un acide avec l'ion azoture des 4- et 2-cyanostilbènes [26] (10 et 11 respectivement). (Fig. 1b) Les détails de la synthèse, de la purification et de la caractérisation des resvéralogues sont donnés dans le dossier complémentaire 8.

Détermination de l'activation de l'enzyme SIRT1

L'activité enzymatique SIRT1 a été mesurée en utilisant le kit de découverte de médicaments fluorométrique SIRT1 (Cayman Chemicals, Michigan, USA) selon les instructions du fabricant. Ce test est un test de dépistage fluorescent direct standard pour SIRT1 ex-vivo et est essentiellement une variante du système bien connu « fluor de lys ». Pour déterminer la capacité relative de chaque resvéralogue à activer l'enzyme, solution à 25 M de chaque composé (m = 3) a été préincubée avec l'enzyme et les cofacteurs avant la mesure de l'activité. La quantification a été réalisée en mesurant la sortie àex = 360 nm etem = 460 nm. Chaque plaque comprenait des mesures de fond et des contrôles enzymatiques uniquement. Les données sont présentées sous forme de facteur de changement (moyenne ± écart type) de l'activité normalisée à l'enzyme seule et au resvératrol 1, tel que 0 ne représente aucune activation, et 1,0 indique une activation équivalente à celle observée avec le resvératrol 1.

Détermination de la cytotoxicité de la bibliothèque resvéralogue

Un test commercial de libération de LDH (Pierce LDH Cytotoxicity Assay Kit) a été utilisé pour déterminer la mort cellulaire. Brièvement, les cellules MRC5 (au doublement de la population (PD) = 45) ont été ensemencées dans des plaques à 24 puits à 1,3 × 10 5 cellules/cm 2 et laissées récupérer de la trypsinisation pendant 24 h puis exposées à chacun des resvéralogues (3 répétitions biologiques × 3 concentrations 10, 50 et 100 µM) pendant 24 h supplémentaires. 50 ul de milieu de chaque puits ont ensuite été mélangés avec un volume égal de mélange réactionnel de dosage de LDH et incubés à température ambiante dans l'obscurité pendant 30 min. 50 µl de solution d'arrêt du dosage LDH ont été ajoutés dans chaque puits et l'absorbance de la solution a été mesurée par spectrophotométrie à 490 nm. La lyse complète et le véhicule seuls les témoins positifs et négatifs ont été inclus. Les données sont présentées sous forme de moyenne (+/-déviation standard) % du contrôle de lyse total.

Culture de fibroblastes primaires humains (NHDF, MRC-5 et HF043)

Des souches de fibroblastes de trois origines génétiques et de deux lignées ont été utilisées dans cette étude : des fibroblastes dermiques humains normaux (NHDF Heidelburg, Allemagne), des fibroblastes pulmonaires fœtaux diploïdes humains (MRC-5 Coriell Institute for Medical Research) et des fibroblastes néonatals du prépuce (HF043 Dundee Cell Produits, Royaume-Uni). Les conditions de culture standard étaient une densité d'ensemencement de 6 × 10 4 cellules/cm 2 dans un milieu (C-23020, Promocell, Heidelburg, Allemagne) contenant 1 % de pénicilline et de streptomycine, et un mélange de suppléments spécifiques aux fibroblastes consistant en sérum de veau foetal (3 % v/v), le facteur de croissance des fibroblastes recombinant (1 ng/ml) et l'insuline humaine recombinante (5 µg/ml) (Promocell, Heidelburg, Allemagne). Pour les tests nécessitant des cultures sénescentes, les cellules ont été comptées et un nombre égal de cellules ensemencées à chaque passage jusqu'à ce que la croissance de la culture ralentisse à moins de 0,5 PD/semaine comme décrit précédemment [2] (cela s'est produit à PD = 64 (NHDF), 65 (MRC-5) et 64 (HF043). Le nombre de cellules viables a été déterminé à chaque passage par coloration au bleu trypan. Pour les cultures cultivées dans des conditions de privation de sérum, les cellules ont été maintenues dans du DMEM (Sigma Aldrich, Dorset, UK) additionné de 0,1% de sérum et 1 % de pénicilline et de streptomycine en l'absence de supplément spécifique aux fibroblastes, pendant 24 h avant le traitement.

Quantification de la sécrétion de cytokines clés

Les cellules NHDF d'une culture sénescente ont été ensemencées à 6 × 10 4 cellules/cm 2 dans une plaque à 6 puits dans un milieu sans sérum, et après 10 jours ont été traitées avec 5 M de chacun des 1–6 pendant 24h. Les surnageants cellulaires ont ensuite été récoltés et conservés à -80°C. Les niveaux de 9 cytokines (GMCSF, IFNγ, IL1β, IL2, IL6, IL8, IL10, IL-12p70 et TNFα) dans les surnageants cellulaires des cellules témoins traitées et du véhicule seul ont été déterminés à l'aide du dosage immunologique ELISA multiplex K15007B MesoScale Discovery (MSD, Rockville, USA) en 11 répétitions. Les protéines ont été quantifiées par rapport à une courbe standard en utilisant un Sector Imager SI-6000 selon les instructions du fabricant. Les données sont présentées en moyenne (+/−SEM).

Profilage d'expression de l'expression du facteur d'épissage dans des cultures de cellules sénescentes

Des cellules NHDF ont été ensemencées à 6 × 10 4 cellules/cm 2 dans des plaques à 6 puits, laissées en croissance pendant 10 jours puis traitées avec 5 M de chaque composé pendant 24 h en 3 réplicats biologiques, avec des témoins véhicules uniquement (DMSO). Resvératrol 1 le traitement aigu était à une dose initiale de 5 M, suivie d'une culture sans autre traitement pendant 4 semaines. Pour les régimes de traitement chronique, le resvératrol (ou véhicule DMSO) a été ajouté une fois toutes les 48 h pendant 4 semaines. 20 transcrits de facteurs d'épissage associés à l'âge et à la sénescence réplicative dans nos travaux précédents [1, 2] ont été sélectionnés a priori pour être évalués ici. (Les identifiants de dosage sont disponibles sur demande). L'ARN a été extrait en utilisant 1 ml de réactif TRI ® (Life Technologies, Foster City USA) selon les instructions du fabricant. L'ARN total (100 ng) a été reverse transcrit dans 20 µl de réactions en utilisant le kit Superscript III VILO (Life Technologies, Foster City, USA). L'expression du transcrit a ensuite été quantifiée en triple pour chaque réplicat biologique en utilisant TaqMan Low Density Array (TLDA) sur la plate-forme ABI-Prism 7900HT. Les conditions de cycle étaient de 1 cycle de 50 °C chacun pendant 2 min, 94,5 °C pendant 10 min, puis 40 cycles de 97 °C pendant 30 s et 57,9 °C pendant 1 min. Les mélanges réactionnels comprenaient 50 pi de TaqMan Fast Universal PCR Mastermix (Life Technologies, Foster City, États-Unis), 30 pi de dH2O et 20 pi de matrice d'ADNc. 100 pi de mélange réactionnel ont été distribués dans la chambre de la carte TLDA et centrifugés deux fois pendant 1 min à 1000 tr/min pour assurer une distribution correcte de la solution dans chaque puits. L'expression du transcrit a été évaluée par l'approche Comparative Ct, par rapport à la IDH3B, GUSB et PPIA gènes de contrôle endogènes, sélectionnés sur la base de preuves empiriques de stabilité avec l'âge dans nos données de microarray antérieures [1] et avec la sénescence cellulaire dans nos travaux antérieurs [2]. L'expression du transcrit a été exprimée par rapport au niveau d'expression du facteur d'épissage dans les cellules témoins traitées avec le véhicule.

Assessment of total gene expression and alternative splicing for senescence-related genes

To assess gene expression and splicing, NHDF cells were seeded at 6 × 10 4 cells/cm 2 in 6 well plates and after 10 days were treated with 5 μM of each compound for 24 h in 3 biological replicates. Target transcripts included the known age-related genes CDKN2A, CDKN1A, TP53, MTOR, CHK1 et CHK2. Probes specific to particular isoforms or groups of isoforms were designed to unique regions of the transcripts in question. Assays were validated by standard curve analysis of 7 serial 1:2 dilutions of pooled cDNA and proved robust and sensitive with an average efficiency of −3.4 and an average r 2 for reproducibility between replicates of 0.87. PCR reactions contained 2.5 μl TaqMan Universal Mastermix (no AMPerase) (Applied Biosystems, Foster City, USA), 0.9 μM each primer, 0.25 μM probe and 0.5 μl cDNA reverse transcribed as above in a total volume of 5 μl in a 384 well plate. PCR conditions were a single cycle of 95 °C for 10 min followed by 40 cycles of 95 °C for 15 s and 60 °C for 1 min. We also measured the total expression of the ATR, ATM. RB1, SIRT1 et SIRT2 gènes. Probe and primer details are available on request. Each biological replicate was tested in triplicate. Isoform-specific and total expression changes were examined for statistical significance by two way ANOVA analysis using SPSS v.22 (IBM, USA).

Catalytic histochemical determination of SA β-gal positive fraction

Senescence marker SA β-Gal was assayed in triplicate using a commercial kit (Sigma Aldrich, UK) according to manufacturer’s instructions, with a minimum of 400 cells assessed per replicate.

QRTPCR measurement of transcripts of senescence associated genes

Molecular markers of senescence (CDKN2A et CD248 transcript levels) were measured by qRTPCR relative to the GUSB et PPIA endogenous control genes, on the ABI Prism 7900HT platform. PCR conditions and analysis were as previously described [2].

Live cell capture microscopy

For live capture microscopy, cells were seeded at a density of 5 × 10 4 cells per 35 mm glass bottomed dish (World Precision Instruments, USA) in 2 ml of media. They were then imaged on a Leica Axiovert inverted environmental microscope with heated chamber (37 °C) and CO2 capacités. An image was taken every 10 min over the course of 92 h. A 20× objective was used with a 30 mS shutter speed and 10% light intensity from a widefield white light source for each image giving optimal contrast and minimal light exposure. Images were analysed using Leica LAS X software.

Determination of cell proliferation

Senescent cultures of each strain were seeded at 6 × 10 4 cells/cm 2 into 6-well plates and cultured for 10 days then treated with 5 μM of each compound for 24 h. Cell counts in three replicates of treated and vehicle-only cultures were carried out manually following trypsinisation and suspension of cells and are presented as mean (+/−SEM).

Immunocytochemical determination of Ki67 positive fraction

Proliferation index was assessed by using Ki67 staining on NHDF cells. Cells were seeded at 1 × 10 4 cells/coverslip and after 10 days were treated with 5 μM of each compound for 24 h in 3 biological replicates. Cells were fixed for 10 min with 4% PFA and permeabilized with 0.025% Triton and 10% serum in PBS for 1 h. Cells were then incubated with a rabbit monoclonal anti-Ki67 antibody (ab16667, Abcam, UK) at 1:200 overnight at 4 °C followed by FITC-conjugated secondary goat anti-rabbit (1:400) for 1 h, and nuclei were counterstained with DAPI. Coverslips were mounted on slides in DAKO fluorescence mounting medium (S3023 Dako). The proliferation index was determined by counting the percentage of Ki67 positive cells from at least 400 nuclei from each biological replicate at 400× magnification under a Leica D4000 fluorescence microscope.

Assessment of apoptosis using TUNEL assay

Terminal DNA breakpoints in situ 3 - hydroxy end labeling (TUNEL) was to quantify levels of apoptosis in NHDF cells. Cells were seeded at 1 × 10 4 cells/cm 2 in 6 well plates and after 10 days were treated with 5 μM of each compound for 24 h in 3 biological replicates. The TUNEL assay was performed with Click-iT® TUNEL Alexa Fluor® 488 Imaging Assay kit (Thermofisher, UK) following the manufacturer’s instructions. Negative and positive (DNase1) controls were also performed. The apoptotic index was determined by counting the percentage of positive cells from at least 400 nuclei from each biological replicate at 400× magnification.

Assessment of apoptosis by assessment of Caspase 3 and 7 activity

Caspase-3 and-7 activities were assessed as secondary measures of apoptosis. Cells were seeded (1000 cells per well) in a white-walled 96-well plate and then treated with 5 μM of each compound for 24 h in 11 biological replicates alongside vehicle-only controls. Caspase-3 and -7 activities in the supernatants were then measured by Caspase-Glo 3/7 assay (Promega, Madison, WI, USA) following the manufacturer’s instructions. Luminescence was measured by using a BMG Pherastar FSX.

Moderation of ERK signalling pathway with inhibitors and agonists

The role of ERK signalling in reversal of senescence was investigated using agonists (ceramide) and inhibitors (trametinib) of the ERK pathway. Cells from a senescent culture were seeded at 6 × 10 4 cells/cm 2 in a 6 well plate in serum free media, and after 10 days were treated with 1-20 μM of the ERK inhibitor trametinib (LC laboratories, Woburn, USA for 24 h hours, or with the ERK agonist N-Acetyl-D-sphingosine (C2-ceramide Sigma Aldrich, UK) at 20 μM for 24 or 120 h. To examine the role of ERK signalling in resveralogue-induced rescue of senescence, HNDF cells were treated with 20 μM of the ERK agonist C2-ceramide as above, but with the addition of 5 μM resveralogue for 24 h.

Assessment of telomere length in resveratrol treated cells

DNA was extracted from 2 × 10 5 NHDF cells treated with 5 μM resveralogue for 24 h, using the PureLink® Genomic DNA Mini Kit (Invitrogen™/Thermo Fisher, MA, USA) according to the manufacturer’s instructions. DNA quality and concentration was checked by Nanodrop spectrophotometry (NanoDrop/Thermo Fisher, MA, USA). Relative telomere length was assessed by a modified qPCR protocol [48]. PCR reactions contained 1 μl EvaGreen (Solis Biodyne, Tartu, Estonia), 2 μM each primer and 25 ng DNA in a total volume of 5 μl in a 384 well plate. PCR conditions were a single cycle of 95 °C for 15 min followed by 45 cycles of 95 °C for 10 s, 60 °C for 30 s and 72 °C for 1 min. Telomere length was calculated using the comparative Ct approach relative to the 36B4 housekeeping gene and normalised to the quantification from untreated cells. Three biological replicates were tested and each was assessed in triplicate.

Analyses statistiques

Unless otherwise indicated, differences between treated and vehicle-only control cultures were assessed for statistical significance by two way ANOVA analysis using SPSS v.22 (IBM, USA).


Discussion

Global splicing changes in cancer have been studied using microarray or RNA-seq techniques in the past [14,15,16]. Compared to microarray (eg. Affymatrix Exon Array), RNA-seq can more precisely measure the splicing changes because the reads covering the exon-exon junction directly represent the splicing choice. Usually, a PSI value can be calculated based on the read counts of the upstream junction, downstream junction and the junction skipping the exon (eg. Fig. 1a). In this study, we used two additional approaches (PSI_junc5’ and PSI_junc3’) to calculate the PSI values (Fig. 2a-b). The two approaches have the advantage to deal with more complex splicing events like in CD44, nine consecutive alternative exons can be partially included, or all excluded. Using regular PSI exon method, only exon v10 was found to be significantly included in CRC. However, combining with the two additional PSI analysis, we concluded that the isoform CD44v8–10 is upregulated in CRC. The PSI_junc5’ and PSI_junc3’ approaches can also be used to study alternative last exons and alternative first exons, respectively. In this study, we identified 5 alternative first exon events in CRC or metastasis tissues. Except for HNF4A, none of the other four events was reported previously. The results indicated that the new approaches could identify novel splicing events. Interestingly, using the same approach, we did not identify any significant alternative last exon events. This may indicate that the transcription-coupled alternative first exon choices play a more important role in CRC compared to alternative polyadenylation-coupled last exon choices.

The exon4-skipping isoform of CLK1, predominantly expressed in NC samples, matches the isoform 3 transcript from Refseq annotation. Interestingly, isoform 3 is annotated as a non-coding transcript because skipping the 91 nt exon 4 is predicted to cause out-of-frame translation and the nonsense mediated decay (NMD) of the transcript (Fig. 1c). The increase of exon4-inclusion isoform (isoform 1) at the expense of isoform 3 in CRC and MC may thus increase the productive transcript level of CLK1 and potentially produce more proteins. CLK1 encodes a member of the CDC2-like family of protein kinases (CLKs). In the cell nucleus, CLKs phosphorylate serine/arginine-rich proteins, release them into the nucleoplasm and then regulate AS of genes. Small molecule inhibitors against these CLKs were developed and exhibited growth suppression, apoptosis induction and anti-tumor effect [40, 41]. Here, we found that CLK1 itself can be alternatively spliced. CRC cells may increase the CLK1 expression by regulating the inclusion of exon 4. Other CLKs (CLK2, CLK3 and CLK4) are also expressed in CRC and normal tissues from the RNA-seq data we analyzed. It’s unclear whether the CLK1 splicing change in CRC have a major functional impact of CLKs or not. If the function of this splicing event can be validated by further evidences, exon 4 skipping could be a new target for cancer therapy.

The splicing change of the exon 6 of COL6A3 has been reported previously in colon, bladder, prostate and pancreatic cancers tissues compared to normal tissues [14, 42], indicating that the splicing change may play a role in multiple cancer types. High expression of COL6A3 in stroma were associated with poor prognosis in CRC [43]. The percent of stromal cells does not correlate with the junction usage of COL6A3 (Supplementary Table 2, 8), excluding the possibility that the splicing events is caused by the variability of stroma content in tumor tissues. COL6A3 was also found to be a key hub gene in the cell migration/extracellular matrix module that was associated with poor prognosis in CRC [44]. COL6A3 knockout decreases cell proliferation and invasion, increases cell apoptosis in cancer cell lines [44]. Taken together, the relevance and importance of COL6A3 to CRC tumorigenesis were highlighted. Our finding of exon 6 splicing change added more complexity of the role of COL6A3 in CRC and this may serve as an additional biomarker in the diagnosis of CRC.

The expression of alternatively spliced CD44 adhesion molecules has been implicated in the pathogenesis and metastasis of colorectal cancer. mRNA expression, different splice isoform expression or protein isoform expression have been used in different studies. However, the results are usually conflicting. Either positive correlation [27, 45,46,47,48] or no correlation [49] to CRC or metastasis has been reported. Our study suggests that isoform CD44v8–10 is upregulated in CRC and liver metastasis tissue with relative downregulation of CD44s. However, metastasis did not show further increase of CD44v8–10 compared to CRC. Therefore, CD44v8–10 or maybe the ratio of CD44v8–10/CD44s could be used as a CRC biomarker.

We identified four genes (ARHGEF9, CHEK1, HKDC1 and HNF4A) with alternative first exon regulation in CRC. Although some studies indicated that many of these genes are linked to tumorigenesis or metastasis, the detailed functions of these splicing events in CRC have not been reported. ARHGEF9 has been shown to play a role in tumor cell migration, invasion and metastasis by linking oncogene CHD1L and Cdc42 pathway in hepatocellular carcinoma (HCC) [50]. HKDC1 encodes the hexokinase domain containing 1, which catalyzes the phosphorylation of glucose. Its high expression in hepatocarcinoma (HCC) is related to poor overall survival (OS) [51]. And it is also predicted to be a novel therapeutic target in lung cancer [52]. CHEK1 contributes to CDC25C-mediated Docetaxel resistance and can also be a therapeutic target in prostate cancer [53]. In HNF4A gene, the promoter P1 driven isoforms (expressing exon 1A) were decreased in CRCs and MCs compared to the promoter P2-driven isoforms (expressing exon 1D) (Fig. 3d, supplementary Figure 7). It was reported that P1-HNF4a is expressed primarily in the differentiated compartment of the mouse colonic crypt and P2-HNF4a in the proliferative compartment. The mice that could only produce P2-HNF4a experienced more colitis and developed more tumors than normal mice [54]. Taken together, the splicing changes of these genes identified in this study may contribute to tumorigenesis and can be better biomarkers than gene expression in CRC.

In this study, AS of two genes (SERPINA1 and CALD1) were found to be associated with metastasis. For SERPINA1, although the two splice isoforms have the same start codon in exon 4, their different 5’UTR sequences may contribute to different RNA decay or protein translation of the gene. Elevated expression of SERPINA1 has been associated with the advanced stage, lymph node metastasis, poor prognosis and shorter overall survival in CRC [55] and gastric cancer [56]. For CALD1 exon 6 skipping, the same splicing event was reported to be present in colon, bladder and prostate tumors compared to normal tissues [14]. The isoform expressed in metastatic CRC samples matches the low-molecular-weight isoforms (L-CAD), specifically encoded by WI-38 L-CAD II (transcript variant 2). The same isoform was significantly associated with poorer prognosis in urothelial bladder carcinoma (BC) [57]. L-CaD was also linked to lymph node metastasis and poorer prognosis in oral cavity squamous cell carcinoma (OSCC) [58].

The logistic regression analysis generated 17 models using 2 or 3 junctions as predictors with an average AUC above 0.99. This indicated that the splicing events identified here can be used as potential diagnosis biomarkers in CRC. It remains unclear whether the splicing events can be detected in circulating tumor cells. Although doing RNA-seq using patient samples is not feasible in the clinical setting, easier experimental approaches, such as RT-qPCR, NanoString, or AmpliSeq can be designed using as few as two or three genes of the 8 genes identified in this study.

We have identified two genes (COL6A3 and HKDC1) with AS associated with overall survival. The high gene expression of COL6A3 in stroma has been linked to poor overall survival in CRC [43], while high expression of gene HKDC1 is related to poor overall survival in hepatocarcinoma [51]. However, it’s still unclear whether the splicing isoforms of these two genes have the same functions. It might suggest that the splice isoforms have variable functions in different cancer types. More data is required to illustrate the functional link between the isoforms and patient survival.

Zong et al. have developed a prognostic predictors model using AS pattern of 13 genes identified from TCGA data [59]. However, normal tissue controls had not been used in that study. It’s not clear whether those splicing events are different in normal tissues.


Discussion

The first evidence of the in vivo importance of FN was demonstrated by R. Hynes's group who showed that FN-null mice die during embryonic development (George et al., 1993). The early embryo lethality makes it difficult to study the biological functions of FN in the in vivo models. Therefore, one of the best methodologies to study the function of FN is by selective modification of the gene. Along with this line, Sakai et al. (2001) described a mouse model lacking pFN which showed increased neuronal apoptosis and larger infarction areas after transient focal cerebral ischemia. In an attempt to elucidate the role of the EDB exon, mice lacking this exon were also produced, but showed no obvious abnormalities in vivo (Fukuda et al., 2002).

We have investigated the in vivo role of the EDA exon by constructing mouse strains unable to carry out EDA exon alternative splicing. The EDA +/+ strain showing constitutive expression of the EDA exon in all tissues was obtained without any modification of the coding sequences and gene structure. This novel approach avoided the difficulties found in a previous attempt to produce animals devoid of alternative splicing of the EDB exon in the FN gene where the modification of the gene structure through the introduction of a selection cassette within the introns produced an FN-null allele (Georges-Labouesse et al., 1996). A similar phenomenon has recently been observed in other genes (Lewandoski, 2001). None of these negative effects was observed in our mutant mice, indicating that the insertion of loxP sites within the flanking introns did not modify the normal pre-mRNA transcription and processing.

Moreover, we observed no obvious embryonic mortality nor malformation in any of the homozygous mutant mice analyzed (EDA +/+ and EDA −/− animals), suggesting that the alternative splicing regulation of the EDA exon is not essential for the developmental processes or that it could be compensated by other gene products. The absence of any obvious developmental abnormality in EDA +/+ and EDA −/− mice suggests that the information and postulated roles for the EDA exon obtained by using recombinant FN fragments (Introduction) cannot be extended automatically to the in vivo functions where more complex mechanisms are acting.

EDA +/+ mice have decreased levels of FN in all tissues

The observation of decreased levels of FN in adult EDA +/+ mice, but not in embryos and very young mice (<1 mo old) suggests that different control mechanisms of FN levels are acting before and after puberty. This decrease could be due to one of the following explanations or a combination of them: (1) a decrease in FN mRNA levels (2) a decrease in the secretion rate of FN or (3) an increase in extracellular degradation of FN.

A series of experiments have been performed to test which of these mechanisms, if any, was acting in the EDA +/+ mice. Northern blot experiments showed that the mRNA levels were not directly related to FN protein levels (Figs. 3 and 4 and Fig. S3). Protease levels were similar to those of EDA wt/wt , no additional FN degradation products were seen in EDA +/+ tissue extracts, and we were unable to see a decrease of FN levels in in vitro cultured cells derived from adult organs of EDA +/+ mice. The failure to identify the precise cause of the low FN-EDA + levels suggests that an atypical mechanism might be acting. One possibility is that a specific intracellular trafficking mechanism is able to modulate the levels of EDA + FN forms in adult animals. This mechanism was suggested for polarized secretion of FN forms in airway epithelial cells (Wang et al., 1991). It is interesting to note that Schwarzbauer et al (1989) have shown that the IIICS-0/IIICS-0 dimers were not secreted. It is possible that a similar control in the secretion mechanism could also be present for the EDA + subunits.

However, none of these effects was obvious in cultured fibroblasts from embryos and adult animals, and in the early stages of development of mice. In fact, the decrease in the amount of FN was evident only after 2–3 mo of age, which is after sexual development. Alternatively, a down-regulation of specific tissue inhibitors of MMPs in adult animals would have as its consequence an increase in activity of specific MMPs, a subtle change that direct gelatin zymography analysis will not detect.

Cutaneous wound healing is abnormal in EDA −/− mice

Initially, up to 3 d after wounding, there were no differences in the healing process between the three genotypes (EDA wt/wt , EDA −/− , and EDA +/+ ). This seems to be consistent with the fact that in the first days after wounding, deposited FN is mainly derived from plasma (Clark et al., 1983 ffrench-Constant et al., 1989). It was shown that normal wound healing could be helped by the presence of cFN (ffrench-Constant et al., 1989 Sakai et al., 2001). In fact, in mice devoid of pFN, normal wound healing was reported (Sakai et al., 2001). cFN is produced in situ 3 d after wounding (Clark et al., 1983 ffrench-Constant et al., 1989 Sakai et al., 2001) and a thin layer of cFN deposited on the surface of the wound immediately after injury in pFN-null mice (Sakai et al., 2001). Expression of cFN by the cells found at the base and edges of the wound just beneath the epidermis was observed, and the presence of cFN preceded the migration of epithelial cells that eventually covered the wound (ffrench-Constant et al., 1989). Previous studies have also shown that FN appears in the provisional matrix beneath the migrating epidermis coordinating with the FN-receptor expression on migrating epidermal cells (Clark et al., 1982, 1983 Grinnell, 1984). These data correlate perfectly with our results showing that after that period, despite the formation of granulation tissue and neovascularization, we observed abnormal reepithelization in EDA −/− mice. The granulation tissue of the EDA −/− wounds displayed edematous regions that occur before the ulcerative process. The subsequent epidermal ulceration was accompanied by a proliferative stimulus with the influx of polymorphonuclear leukocytes and macrophages, and a delay in the healing of the wounds. Possible reasons for these phenomena could be related to defects in the basal lamina, a change in integrin receptor levels, and/or a defect in the skin keratinocytes, fibroblasts, or immune system. The basal lamina looked similar in EDA −/− mice compared with EDA wt/wt mice by both Azan-Mallory coloration and the specific immunostaining of laminin. However, we cannot rule out minor differences in one of the other specific proteins that are present in the basal lamina. Moreover, similar levels of α9??1 integrin, one of the EDA receptors (Liao et al., 2002), were observed in skin of the three genotypes. Preliminary attempts to define differences between the EDA wt/wt and EDA −/− genotypes in immune system cells (T/B lymphocytes ratio and delayed hypersensitivity) and in the characteristics of fibroblasts (in vitro cell migration, cell adhesion, and duplication time) failed to show significant differences. However, it remains to be seen if the localization pattern of the integrin receptors or their signaling have been affected in the mutant mice.

The increase in ulceration in the EDA −/− wounds could be the result of a higher rate of cell death in the skin of the mice during wound closure. This does not seem to be the case as the number of positive cells between the EDA wt/wt , EDA −/− , and EDA +/+ wounds in the granulation tissue were similar in the area devoid of ulceration by both TUNEL and caspase-3 assay.

On the basis of these considerations and the data described in Results, we conclude that FN containing the EDA segment plays an essential role in the organization of the granulation tissue and probably in epidermal cell migration, either directly or by interaction with other ECM components.

EDA +/+ and EDA −/− mouse strains have a shorter lifespan

It has been shown that deficiency of SH2-containing inositol-5-phosphatase, lysosomal acid lipase, and DNA topoisomerase IIIβ had no consequences in embryonic development, but shortens the lifespan of the animals (Helgason et al., 1998 Du et al., 2001 Kwan and Wang, 2001). The shortened lifespan could be due to the changes in biological processes, which require the presence of the investigated protein during aging.

In the case of the FN mice, we showed that the absence of regulation of the EDA exon affects the lifespan of mutant animals. In normal animals, a dramatic change in the EDA + /EDA ratio is observed after birth and a gradual decrease of EDA inclusion is observed in the tissues that increases with the age of the animal (Magnuson et al., 1991 Pagani et al., 1991). Alternative splicing of FN is regulated at both the extracellular (ffrench-Constant, 1995 Kornblihtt et al., 1996 Boyle et al., 2000) and the molecular levels (Mardon et al., 1987 Lavigueur et al., 1993 Caputi et al., 1994 Muro et al., 1999). The mutant EDA +/+ and EDA −/− mice have no regulation of splicing of the EDA exon. It was possible that some biological processes that required specific EDA + /EDA − ratios of FN were altered because of the absence of regulation of EDA splicing. In fact, this was shown in this paper for the specific case of cutaneous wound healing in the EDA −/− mice. Furthermore, the low healing efficiency was exacerbated in older mice. In a similar fashion, other maintenance and tissue repair mechanisms could be affected, and the cumulative lower efficiency may result in a decrease in the lifespan of mutant animals. In the specific case of the EDA +/+ mice, due to the dramatic reduction in FN levels in most organs, it remains unclear whether the shortened lifespan seen in EDA +/+ mice was due to a change in FN quantity and/or quality. Although no significant differences have been reported on the lifespan of c129 and C57BL/6 (Smith et al., 1973 Goodrick, 1975 Kunstyr and Leuenberger, 1975), we cannot formally rule out that the differences in chromosome background at the FN EDA locus (C57BL/6 for the EDA wt/wt and c129 with one or two loxP sites for EDA −/− and EDA +/+ , respectively) could be responsible for the observed differences in lifespan.

In summary, we generated mice devoid of regulated splicing at the EDA exon of the FN gene. Surprisingly, both mouse strains showed that the alternative splicing at the EDA exon was dispensable during embryonic development, but it was necessary for a normal lifespan. Moreover, mice unable to incorporate the EDA exon in the FN protein displayed abnormal skin wound healing. On the other hand, mice having constitutive inclusion of the EDA exon showed an important decrease in the FN levels in all tissues.

The results presented here are important for three reasons: first, we presented a novel method to study the function of protein isoforms second, we added valuable information regarding the function of the FN isoforms and third, we showed that changes in the regulation of splicing are responsible for subtle changes in the phenotype that may be present, but undetected, in human pathologies.


Nonsynonymous Mutations

Nonsynonymous mutations have a much greater effect on an individual than a synonymous mutation. In a nonsynonymous mutation, there is usually an insertion or deletion of a single nucleotide in the sequence during transcription when the messenger RNA is copying the DNA. This single missing or added nucleotide causes a frameshift mutation which throws off the entire reading frame of the amino acid sequence and mixes up the codons. This usually does affect the amino acids that are coded for and change the resulting protein that is expressed. The severity of this kind of mutation depends on how early in the amino acid sequence it happens. If it happens near the beginning and the entire protein is changed, this could become a lethal mutation.

Another way a nonsynonymous mutation can occur is if the point mutation changes the single nucleotide into a codon that does not translate into the same amino acid. A lot of times, the single amino acid change does not affect the protein very much and is still viable. If it happens early in the sequence and the codon is changed to translate into a stop signal, then the protein will not be made and it could cause serious consequences.

Sometimes nonsynonymous mutations are actually positive changes. Natural selection may favor this new expression of the gene and the individual may have developed a favorable adaptation from the mutation. If that mutation occurs in the gametes, this adaptation will be passed down to the next generation of offspring. Nonsynonymous mutations increase the diversity in the gene pool for natural selection to work on and drive evolution on a microevolutionary level.