Prédiction et pré-validation de biomarqueurs microARN à visées cliniques
Prédiction et pré-validation de biomarqueurs microARN à visées cliniques.
- Introduction
1.1 Organisation du génome
L’ADN situé dans le noyau des cellules eucaryotes, support de l’information génétique, est empaqueté au sein de la chromatine qui est une structure nucléo-protéique dont la régulation spatio-temporelle est fonction de divers remodelages et de modification au niveau de l’ADN ainsi que des histones : le niveau épigénétique.
Chez les êtres vivants, l’information génétique est transmise et conservée à l’aide de biomolécules que sont les acides nucléiques (Griffith 1928; Avery, MacLeod, and McCarty 1944).
Les acides nucléiques sont composés par l’assemblage de nucléotides, notamment des nucléosides 5′-phosphates qui sont reliés par une liaison phosphodiester, dont l’enchaînement permet le codage de l’information génétique à l’origine de la différenciation et multiplication cellulaire permettant la formation des divers organes et tissus qui forment l’organisme.
De deux types, les acides nucléiques sont :
– l’ADN, acide désoxyribonucléique, qui est constitué par le 2′-désoxyribose et une base qui peut être purique : adénine (A) ou guanine(G), ou pyrimidique : cytosine (C) ou thymine (T)
– l’ARN, acide ribonucléique, constitué par le ribose et une base qui peut être purique : adénine (A) ou guanine (G), ou pyrimidique : cytosine (C) ou uracile (U)
1.2 Du gène à la protéine : dogme central de la biologie moléculaire
L’expression des gènes qui se traduit par la production d’une protéine donnée résulte du décodage, encore appelée transcription, d’une fraction spécifique d’ADN.
En effet, les protéines représentent une catégorie de molécules qui façonnent le phénotype d’un individu tout en lui permettant d’assurer les fonctions physiologiques telles la digestion, le maintien de l’homéostasie ou encore la production énergétique. Il est à rappeler que le phénotype est fonction du génotype.
Deux grandes étapes constituent l’expression d’un gène en protéine : la transcription de l’ADN en ARNmessager suivie de la traduction de l’ARNmessager en protéines via les acides aminés.
La transcription se déroulant dans le noyau comme son nom l’indique repose sur la copie de l’information qui est codée par l’ADN sous forme d’ARN dénommés ARNmessager qui seront exportés vers le cytoplasme à travers les pores nucléaires.
Le début de la transcription commence, sous l’action de l’enzyme ARN polymérase II, par l’ouverture de la molécule d’ADN avec déroulement des deux brins formant la double hélice. Des nucléotides libres vont par la suite venir s’incorporer par complémentarité des bases, G avec C et A avec U et inversement, au niveau de l’un des brins de l’ADN. Le brin d’ARN néo-formé est ainsi complémentaire à celui de l’ADN matriciel.
Il est à noter que l’extrémité 5’ de l’ARNmessager correspond au début de l’enchaînement des nucléotides libres complémentairement au brin transcrit de l’ADN et que l’ARNmessager nouvellement formé sera « coiffé » par une molécule de guanosine à son extrémité 3’ afin d’éviter sa dégradation (Buratowski,1994) .
Figure 01: Expression de l’information génétique[1]
1.2.1 Genome
Composé de six milliards de paires de bases (pb), le génome humain est constitué par 46 chromosomes, qui une fois déroulée représente deux mètres de la longueur totale de l’ADN alors que le diamètre de l’ADN n’excède pas une dizaine de micromètres dans le noyau cellulaire.
Effectivement, au sein du noyau, l’ADN est compacté avec des histones afin de former la chromatine.
La chromatine contient l’information génétique et contrôle les fonctions cruciales du génome.
C’est une structure dynamique qui peut se réorganiser au cours de différents processus tels que la réplication, la transcription, la réparation et la recombinaison. Elle possède trois fonctions essentielles : compacter l’ADN, organiser les territoires et les fonctions chromosomiques (télomères, centromères), et moduler l’accessibilité de l’ADN à divers facteurs régulateurs des fonctions nucléaires.
Elément fondamental de la chromatine, le nucléosome est formé par 146 paires de bases d’ADN qui se retrouvent pelotées autour d’un octamère qui est consitué par deux copies des protéines histones de cœur : histones H2A, H2B, H3 et H4.
Les histones sont les protéines liées à l’ADN les plus abondantes dans les cellules eucaryotes et parmi les protéines connues les plus conservées dans l’évolution.
Ce sont de petites protéines basiques avec un poids moléculaire compris entre 11 et 20 kDa qui contiennent un fort pourcentage d’acides aminés chargés positivement (20%) tels que les lysines et les arginines.
1.2.2 Transcription des gènes en ARNs messagers
Figure 02 : Transcription des gènes en ARN messagers
1.2.3 Des ARNs messagers aux proteines
La synthèse des protéines est constituée de trois étapes que sont :
- l’initiation : un ribosome se fixe sur un triplet de nucléotides de l’ARNm dont le codon initiateur est toujours la méthionine : codon AUG
- l’élongation qui se traduit par le déplacement du ribosome sur un autre triplet de nucléotides de l’ARNm suite à l’incorporation d’acide aminé par reconnaissance spécifique et ainsi de suite le ribosome poursuit sa lecture de l’ARNm en se décalant à chaque fois d’un codon pour permettre l’insertion d’un ARNt.
Il est à noter que durant cette élongation de la chaîne, une liaison peptidique relie chaque acide aminé.
- La terminaison se caractérise par la dissociation du ribosome de l’ARNm avec libération de la chaîne polypeptidique lorsqu’il arrive au niveau du codon stop.
Figure 03 : Traduction de l’ARN en protéine
Il est à rappeler qu’un seul gène peut être traduit en plusieurs protéines. De plus, dans les brins transcrits en ARN existent des portions qui ne seront pas traduites en protéines. En effet, l’ADN comprend des régions codantes, des régions de régulation de l’expression génétique ainsi que des régions qualifiées d’ « ADN poubelle » qui sont essentielles à la structure, la fonction et l’organisation du génome bien que leurs fonctions restent encore inconnues.
Le génome ne se traduit donc pas uniquement par l’ensemble des gènes mais est représenté par la séquence complète de l’ADN d’un organisme.
Il est intéressant de constater qu’il y a corrélation entre le nombre de gènes et la taille du génome chez les procaryotes contrairement aux eucaryotes dont la complexité des organismes ne permet pas de proportionnalité avec la taille du génome.
1.2.4 Régulation post transcriptionelle
La modulation des informations génétiques est assurée par des enzymes et complexes protéiques dont leur action est spécifique à la réorganisation de la chromatine et par voie de conséquence au contrôle et régulation des types cellulaires, autrement dit des fonctions cellulaires.
- Méthylation de l’ADN et contrôle de l’expression génique
L’expertise de l’expression génique se déroule également sous la direction des DNMT qui interviennent directement ou pas dans la transcription de gènes spécifiques.
La méthylation est responsable de l’inhibition de l’expression génique à travers un mécanisme de blocage de la liaison des facteurs de transcription tels myc, AP-2, c-fos, CRE ou CTCF[2] [3]complémentairement à une non reconnaissance de la séquence méthylée.
Le contrôle de l’état de la chromatine, en particulier sa compaction, est un phénomène clef de la régulation de l’expression génique. Incontestablement, l’assemblage de l’ADN avec les histones qui déterminera la compaction condensée ou moins dense de la chromatine est le facteur principal qui permettra l’accessibilité des gènes durant les phénomènes de transcription.
Les différences observées au niveau des états de compaction de la chromatine s’expliquent par la variation du niveau d’acétylation des histones qui va venir les modifier sous l’action des : histone-acétylases (HAT) et des histone-déacétylases (HDAC)[4]. Ce qui confirme le rôle des DNMT autrement dit de la méthylation de l’ADN dans le processus de transcription, notamment sa régulation qui est fonction des HDAC.
- La méthylation de l’ADN
Comme son nom l’indique, la méthylation de l’ADN se caractérise par l’addition d’un groupement méthyl-CH3 au niveau du carbone 5 des résidus de cytosines de l’ADN.
La méthylation de l’ADN est sous le contrôle d’enzymes, dont les ADN méthyltransférases ou DNMT, issus de la S-adénosyl-méthionine (SAM) qui est un donneur de méthyl.
Figure 04 : Voie métabolique de la méthylation de l’ADN[5]
Cette méthylation de l’ADN octroie l’identité du type cellulaire de par la formation d’un revêtement moléculaire propre et variable d’un gène à l’autre, d’un type cellulaire à un autre qui confère un caractère unique et transmissible à l’ADN. Ce qui confère à la structure moléculaire de l’ADN une composante génétique propre et semblable dans toutes les cellules ainsi qu’une composante épigénétique qui varie selon le type cellulaire.
- Méthylation de novo de l’ADN
Bien que la séquence d’ADN soit identique chez toutes les cellules, la présence de méthylation est variable dans le génome.
La méthylation de novo survient après la déméthylation globale : après la fécondation il y a effacement des profils de méthylation transmis par les parents pour permettre la réalisation d’un nouveau schéma chez l’embryon, notamment suite à la formation des types cellulaires distincts avec mise en place de nouveaux schémas de méthylation.
La méthylation de novo se déroule sous l’influence des enzymes de la famille des DNMT, notamment les DNMT3a et DNMT3b qui font partie de la famille DNMT3[6].
La DNMT3a intervient dans la méthylation des séquences de régulation de l’expression des gènes alors que la DNMT3b joue un rôle dans la méthylation des séquences « satellites » au niveau des Centromères.
Figure 05 : Les différentes ADN méthyltransférases
Trois processus interviennent dans la mise en place de cette diversité des motifs de méthylation :
- la déméthylation globale qui correspond à l’effacement des schémas de méthylation transmis par les parents avec l’établissement d’un nouveau profil chez l’embryon.
- La méthylation de novo qui consiste à la formation de nouveaux schémas de méthylation après la différenciation cellulaire de l’embryon
- La méthylation de maintenance ou de maintien qui porte sur la reproduction fidèle des schémas de méthylation chez les cellules filles lors de la réplication
La méthylation, qu’elle soit de novo ou de maintenance, est assurée par une famille d’enzymes, les DNMT.
(1) Méthylation de maintien de l’ADN
La méthylation de maintien fait suite à la méthylation de novo et consiste comme son nom l’indique au maintien, la reproduction fidèle des profils de méthylation réalises durant la méthylation in novo.
La méthylation de maintien de l’ADN se déroule sous l’effet de la DNMT1 qui, au cours des divisions cellulaires, préserve en se basant sur la molécule d’ADN hémiméthylé, les profils de méthylation en concordance avec la réplication de l’ADN[7].
Figure 06 : Maintien des profils de méthylation au cours des divisions cellulaires
- Les différentes classes d’ARNs non codants
Bien que n’intervenant pas dans la traduction des protéines, les ARNs non codants (ARNnc) qui sont constitués d’un grand nombre d’ARN différents se retrouvent par dizaine de milliers et exercent des rôles essentiels dans la biologie cellulaire, notamment les longs ARNs non codants.
D’après la longueur de leurs trasncrits, les ARNs non codants sont divisés en deux catégories :
– les petits ARNnc
– les longs ARNnc
Les petits ARNnc interviennent principalement dans la stabilité de l’ARNmessager (ARNm) de même que dans la régulation de la traduction des gènes[8].
En général, les ARNnc agissent pour guider les complexes protéiques vers des séquences d’acides nucléiques.
L’assemblage ARNnc-complexe protéique permet d’assurer un bon nombre de fonctions cellulaires comme dans la régulation d’un gène « cis » en « trans »[9].
La localisation des ARNnc au sein du génome est très variable. Incontestablement, des ARNnc peuvent se retrouver sur le brin sens ou anti-sens dans le génome. L’ARNnc pouvant chevaucher ou non un ou des exons d’un gène transcrit. De plus, l’expression de l’ARNnc peut se faire dans deux directions. L’ARNnc peut également se retrouvé dans un intron ou encore une région intergénique c’est-à-dire entre deux gènes codants. Cette diversité de localisation rend ardu la mise en évidence d’un ARNnc[10] .
Les ARNnc peuvent être des :
– ARN ribosomaux (ARNr) : ils sont des constituants du ribosome et interviennent dans la traduction des ARNm en protéines
– ARN de transfert (ARNt) : comme leur nom l’indique, les ARNt sont des transporteurs d’acides aminés. Ils interviennent dans le transfert, transport des acides aminés vers le site ribosomique pour assurer la synthèse protéique.
– les ribozymes : ce sont des ARN qui possèdent une activité catalytique, comme le cas de la RNase P qui agit dans le clivage les précurseurs d’ARNt.
– les petits ARN : qui viennent contribuer à un bon nombre de processus biologiques complémentairement à des complexes de ribonucléoprotéines (RNP). Comme le cas des petits ARN nucléaires (snRNA) qui ont pour fonction de guider la reconnaissance d’une séquence nucléique cible par la complémentarité de séquence[11].
– les petits ARN nucléolaires(snoRNA ) : qui interviennent dans les modifications de séquence ARN des ARNr ou encore contribuent dans la régulation de l’épissage alternatif[12];
– les microARN (miARN) : sont de courts transcrits d’ARN d’environ 21 à23 paires de bases (pb) qui interviennent dans la régulation de l’expression et engendrent la répression de la traduction encore connue comme la dégadation de l’ARNm.
– les petits ARN interférents (siARN) dont la fonction est semblable à celle des microARN à la différence qu’ils dégradent l’ARN cible de façon systématique.
– les ARN interagissant avec les protéines Piwi (piARN) qui interviennent dans la régulation de l’expression des gènes.
Tableau 01 : Les ARN non codants et leurs fonctions respectives
ARN non codants | Fonction |
Traitement de l’ARN et modifications | |
ARNsn du complexe d’épissage | Épissage des introns du pré-ARNm |
ARNsn U7 | Formation de l’histone en 3′ du pré-mARN |
ARNs C/D | Méthylation 2′-O des ARNr, ARNsn, et des ARNt |
Traitement des ARNr | |
ARNs H/ACA | Pseudo-uridylation des ARNr et des ARNsn |
Traitement des ARNr | |
ARN RNase P | Maturation du pré-ARNt (clivage de l’extrêmité 5′) – Ribozyme |
ARNs guide (ARNg) du trypanosome | Editing de l’ARNm |
Production d’ARNm alternatifs | |
snoARN | Modifications spécifiques des ARNr, ARNsn voire ARNt (chez les archeaseulement) |
Transcription | |
ARN 7SK | Contrôle de l’élongation/transcription médiées par le P-TEFb |
ARN 6S | Régulation transcriptionnelle chez la bactérie par interaction directe avec l’ARN polymérase |
Traduction | |
ARNt | Traduction de l’ARNm |
ARNtm | Contrôle de qualité chez la bactérie |
Déclenche le relargage des ribosomes bloqués pendant la traduction | |
ARNr | Participe au sein du ribosome à la formation de la liaison peptidique d’un acide aminé au peptide en formation |
Transport des protéines | |
ARN SRP | Translocation des protéines vers le réticulum endoplasmique |
Régulation de l’expression des gènes | |
siARN | Inhibition de gènes |
Dégradation d’ARN de virus, de rétro-éléments et de séquences répétées | |
miARN | Inhibition de gènes |
Inhibition de la traduction | |
Dégradation d’ARNm cibles | |
piARN | Inhibition de gènes |
Inhibition de transcrits répétés dans la lignée germinale de mammifère (modification de chromatine ?) | |
rasiARNs | Inhibition de gènes |
Inhibition de transcrits répétés dans la lignée germinale de la drosophile (modification de chromatine ?) | |
ARN antisens d’Eubactéries | Inhibition de gènes |
Inhibition de la traduction | |
Dégradation d’ARN messagers cibles | |
Parfois, activation de gènes | |
ARN Xist | Participe à l’inactivation de l’X |
Stabilité génomique | |
ARN télomérase | Synthèse du télomère |
miARN : microARN ; piARN : PIWI-interacting ARN ; P-TEFb : positive transcription elongation factor b ; rasiARN : repeat-associated siARN ; RNase : ribonucléase ; rARN : ARN ribosomique ; siARN : small interfering ARN (ARN intérférants) ; snARN : small nuclear ARN (petits ARN du noyau) ; SRP : signal recognition particle ; tmRNA : transfer messenger ARN ; tARN : ARN de transfert.
- ARNr
La structure des ARN ribosomaux ou ARNr est à la fois compacte et complexe.
Il existe deux principales formes d’ARNr chez les procaryotes : l’ARN 16S et l’ARN 23S qui eléaborent respectivement la structure de la sous-unité ribosomale 30S et de la sous-unité ribosomale 50S dont l’association forme le ribosome 70S.
Le terme S traduit ici une unité de mesure, celle de Svedberg qui mesure la vitesse de sédimentation des ribosomes durant l’ultracentrifugation.
Les ARNr viennent s’associer aux ribonucléoprotéines (RNPs) et se regrouper en sous-unités ribosomales avant de s’assembler en ribosome[13].
Deux sous-unités d’ARN ribosomaux sont distingués chez les eucaryotes : la petite sous-unité 40S et la grande sous-unité 60S, dont l’ensemble forme le ribosome 80S[14].
La grande sous-unité 60S est formée par 47 protéines et de trois ARNr[15] alors que la petite sous-unité est composée de 32 protéines et d’un ARNr (ARNr 5S).
Complexe, la synthèse du ribosome est concomitante avec celle des ARNr situés au sein du noyau[16].
Avant de s’associer à des protéines dénommées protéines ribosomales pour former le préribosome, l’ARNr synthétisé est sujet à diverses modifications : méthylation, pseudo-uridylation, action d’endo- et exonucléases.
Le préribosome est formé dans le noyau avant de migrer vers le cytoplasme par le biais d’un processus actif et subir la maturation[17].
La principale fonction du ribosome étant d’interagir avec l’ARNm et l’ARNt durant la traduction des ARNm en protéines. Effectivement, les ARNr qui constituent le ribosome interviennent dans la reconnaissance et par voie de conséquence le codage des ARNt en acides aminés au sein du site A du ribosome[18].
Durant l’élongation peptidique, l’enzyme responsable de l’ajout d’acide aminé : la peptidyl transférase est formée par plusieurs ARNr.
De plus, durant la traduction, le maintien des activités des sites A et P du ribosome est fonction de la présence d’un ARNr 23S qui intervient dans la mise en conformation correcte de la protéine dans l’espace, complémentairement aux chaperones qui jouent un rôle dans le remodelage spatial, outre l’optimisation de la réaction et la réduction de l’énergie thermodynamique mobilisée[19].
- snRNA
Localisés dans le noyau, les ARNsn se retrouvent en grande quantité sous forme de groupe de transcrits.
Deux classes d’ARNsn se distinguent d’après la fonction de leur séquence ainsi que de l’association des cofacteurs protéiques (snRNP, small nuclear ribonucleoproteins) :
- les ARN de la classe Sm qui sont caractérisés par la présence d’un chapeau 5′-triméthylguanosine, une anse en 3′ (stem-loop) ainsi qu’un site de fixation (Sm) spécifique à un groupe de protéines : les protéines Sm :U1, U2, U4, U4atac, U5, U7, U11, U12
- les ARN de la classe Lsm qui sont représentés par un chapeau monométhylphosphate et une anse 3′ (stem-loop) avant de finir par une queue uridine qui représente un site de fixation pour les protéines Lsm : U6 et U6atac.
La maturation des ARNsn Sm s’effectue dans le cytoplasme avant de revenir dans le noyau alors que celle des ARNsn Lsm reste au niveau intranucléaire[20].
L’association des ARNsn et des snRNP intervient dans la réaction d’épissage, notamment dans le processus d’élimination des introns des pré-ARNm. Réaction d’épissage, faisant intervenir plus de 150 protéines, qui se déroule sous la conduite de l’appariement des bases entre les ARNsn qui forment le spliceosome (complexe protéique d’épissage) et les jonctions exon/intron du pré-ARNm[21].
Figure 07 : Les petits ARN nucléaires, ARNsn[22] . Les ARNsn sont constitués de deux classes : (i) les ARNsn Sm, caractérisés par un chapeau 5′-triméthylguanosine (TMG), un site de fixation des protéines Sm (site Sm) et une structure en anse (3′stem-loop) encadrée. Ils sont transcrits par l’ARN polymérase II ; (ii) les ARNsn Lsm, caractérisés par un chapeau 5′-monométhylphosphate (MPG), une structure en anse (3′stem-loop) et une queue poly-(U), le site Lsm. Ils sont transcrits par l’ARN polymérase III.
- tRNA
Les ARN de transfert ou ARNt interviennent dans la synthèse des protéines par le mécanisme de transfert de l’acide aminé qu’ils transportent, dans un ordre spécifique, au niveau du complexe ARNm/ribosomes/ribonucléoprotéines/ARNr pour former le peptide au cours de la traduction[23] .
La traduction comportant trois (03) principales étapes :
– l’initiation
– l’élongation
– la terminaison.
Durant la traduction, l’hybridation ARNm/ARNt, qui se déroule par association par complémentarité du codon de l’ARNm et de l’anticodon de l’ARNt, est sous l’effet d’une enzyme : l’aminoacyl-tRNA synthétase. La synthèse progressive du polypeptide étant assurée par l’ajout un par un des acides aminés par le ribosome[24] .
Il est à noter que les règles d’appariements de Watson et Crick [25] ne sont pas tenues en compte dans l’interaction codon/anticodon. En effet, l’incorporation des acides aminés est effectuée en 10–20 aas par seconde environ, à noter que l’étape de l’initiation démarre dans la partie 5’ non codante de l’ARNm et constitue le complexe de pré-initiation (complexe ribosomique 43S puis 48S) en mobilisant notamment l’ARNt de la méthionine : AUG qui est le codon initiateur. Le complexe de pré-initiation débute et s’effectue ainsi dans la direction 5′ → 3′[26] [27].
Figure 08 : Schéma d’un ARNt[28]. Il s’agit de la séquence primaire et secondaire de l’ARNtVal d’Escherichiacoli. Encadré en jaune se trouve l’anticodon UAC sur l’ARNt. Ce dernier va s’hybrider au codon GUA de l’ARNm (un des codons pour l’acide aminé valine). Dans sa structure primaire, outre les nucléosides contenant les A, C, G et U, on trouve des nucléosides modifiés tels que cmo5U (uridine-5-oxydoacétique), D (dihydrouridine), s4U (4-thio-urine), m6A (N6-méthyladénosine), m7G (7-méthylguanosine), T (ribothymidine), ψ (pseudouridine).
- snoRNA
Formés par deux familles : les ARNs C/D et les ARNs H/ACA, les ARNsno qui sont de petits ARN nucléolaires interviennent dans des processus de modifications des ARNr, des ARNsn et des ARNt[29] outre leur rôle dans divers processus biologiques comme l’épissage des ARNm, la traduction des protéines ou encore la stabilité du génome.
En particulier, les ARN C/D interviennent dans les méthylations des 2′-O-ribose et les ARN H/ACA jouent un rôle dans le pilotage des pseudo-uridylation (conversion de l’uridine en pseudo-uridine) [30]. Les ARNsno jouent ainsi le rôle de guide en assurant l’association de composants catalytiques (ribonucléoprotéines, RNPs) avec la cible.
Les ARNsno assurent jouent également un rôle au sein du spliceosome par action sur les ARNsn, dans la synthèse du télomère (ARN H/ACA).
La structure de la famille des ARN C/D renferme deux séquences dénommées boîtes C (5′-RUGAUGA) et D (5′-CUGA) qui sont réunies par des anses (loop) en constituant des tours en boucles (kink turns).
D’un point de vue génétique, les ARNsno se retrouvent essentiellement au niveau des introns des gènes codants pour les protéines qui interviennent dans la biogenèse des ribosomes. Leur synthèse à partir des introns s’effectuant après épissage des pré-ARNm.
Il est à noter que dans certains cas, les pré-ARNm peuvent ne pas être traduits en protéines, dans ce cas, les introns sont les seuls à être transformés. Dans d’autres cas, les ARNsno résultent de transcrits polycystroniques dont la libération de chaque ARN s’effectue par endoclivage.
Les ARNsno peuvent, dans de rares cas, être transcrits de façon indépendante.
Pour les eucaryotes, les ARNsno s’unissent avec les pré-RNPs inactifs dont l’ensemble est cheminé vers les corps de Cajal qui sont des structures intranucléaires intervenants dans la maturation et l’assemblage des RNPs.
Ensuite, les RNPs sont orientés vers leurs sites actifs selon leur fonction : nucléoles, corps de Cajal, télomères… et selon leurs séquences signatures (boîtes C/D, H et ACA).
Les ARNsca pour small Cajal body RNAs qui jouent un rôle dans les modifications des ARNsn sont ceux qui reviennent vers les corps de Cajal[31] .
Figure 09 : Les ARNsno C/D et H/ACA[32]. a : structure secondaire d’un ARNsno C/D, guide de méthylation 2′O. Deux boîtes conservées C (RUGAUGA) et D (CUGA) sont présentes aux extrémités en anse en formant des tours en boucles (kink turns, k-turns). La pair C/D est associée à une séquence antisens (trait épais) en amont de la boîte D et s’apparie avec l’ARN cible (en rouge). L’ARN cible se méthyle sur le ribose du nucléotide (nt) apparié à l’ARN guide (l’ARNsno) se trouvant cinq paires de bases en amont de la boîte D ; b : structure secondaire d’un ARNsno H/ACA, ARN guide de pseudo-uridylation (pseudoU). Une boucle (hairpin) imparfaite est formée entre la tige inférieure, la poche de pseudoU, la tige supérieure et l’anse apicale. L’ARN cible est apparié dans la poche de pseudoU. Une boîte ACA ou H se trouve en aval de la boucle. À 15 nucléotides (nt) de cette boîte se trouve l’uridine de l’ARN cible qui est modifié (Nψ représente le nucléotide conservé adjacent à l’uridine cible ψ). La boîte H/ACA est en fait constituée de deux unités en boucle séparées par une séquence simple brin contenant la boîte H (ANANNA). Chez les eucaryotes, l’anse apicale possède une boîte CAB (Cajal box de séquence UGAG) permettant la rétention de certains ARN ACA/H pour guider la modification d’ARNsn (plutôt que des ARNr). Chez les Archeae, ces ARN possèdent aussi une formation en tours de boucle (k–turns). A : adénine ; U : uracile ; N : n’importe quelle base ARN ; R : base pyrimidique (cytosine ou uracile) ; G : guanine
- siARNs
Les siARNs peuvent provenir d’ARN viraux, de transgènes, de transposons, ou encore de loci spécifiques.
D’environ 22pb, les siARNs sont des petits ARNs dont la synthèse s’effectue à partir de précurseurs ARN double brin traités par les enzymes DICER qui vont leur permettre de s’associer aux protéines argonautes (AGO), protéines guides pour l’interférence ARN que ce soit au niveau de l’ADN ou de l’ARN.
Des ARN polymérases ARN dépendantes (RNA dependent RNA polymerase [RdRp]) peuvent également les synthétiser par recopie des ARN simple brin, il est à noter que ce mécanisme de recopie ne se rencontre pas chez les mammifères.
Les siARN interviennent majoritairement dans la défense contre les virus, en particulier chez les plantes ou chez la drosophile.
Il est à noter que ces siARN peuvent être contournés par certains virus par l’intermédiaire de protéines qui vont cibler le mécanisme de répression siARN-AGO.
Entre autres, les siARN jouent également un rôle dans la régulation de l’expression de gènes, comme pour la répression de transposons. En particulier chez la souris et la drosophile, les principaux siARN rencontrés sont des siARN endogènes ou endo-siARN dont l’expression s’effectue au niveau des oocytes ainsi qu’au sein des cellules des lignées germinales et somatiques dont les transposons constituent la cible principale par inhibition de leur expression. Empêchant ainsi, en particulier dans la lignée germinale chez les plantes, la mobilité des transposons.
En outre, les transcrits de siARN qui résultent de gènes antisens peuvent intervenir, en cis ou en trans, dans la régulation de l’expression du gène dont ils sont adjacents et/ou chevauchant[33].
- PiwiARNs
Deux principales branches forment la superfamille des protéines argonautes (AGO) :
– la branche AGO qui est retrouvée dans la levure, les plantes et les animaux
– la branche PIWI qui est spécifique à l’espèce animale.
La taille des piARNs est d’environ 25pb à 30pb, les distinguant entre autres des miARN et des siARN outre leur biogenèse qui n’est pas fonction des enzymes DICER.
Limités aux cellules germinales et somatiques qui y sont reliées, les piARN sont présents uniquement chez le mâle des mammifères où deux classes se distinguent :
– la classe prépachytène : ces piARN ont des homologies séquentielles avec les transposons ainsi que les séquences répétées.
Durant le développement de la lignée germinale, l’expression des piARN prépachytène est intimement liée, par modifications d’histones, à la fenêtre d’effacement /rétablissement de la méthylation de l’ADN des transposons
– la classe pachytène : d’origines et de cibles encore indéfinies, les piARN pachytènes sembleraient intervenir dans le maintien de l’intégrité génomique des cellules germinales[34].
- lncARNs
Les lncARNs se définissent par leur taille qui est supérieur à 200pb et pouvant atteindre 100kb.
Les gènes codant des lncARNs sont principalement transcrits par l’ARN polymérase II, ou dans des cas exceptionnels par l’ARN polymérase III. Etant donné qu’ils ont une propriété principale de régulation, ils ne subissent le même traitement appliqués aux ARNm[35].
Figure 10 : Exemples d’action des longs ARNnc. Schéma d’une région avec les deux brins sens (5_→3_) et antisens (3_→5_). Les gènes sont représentés par les régions avec les rectangles pleins. Les flèches sur les rectangles indiquent le sens de la transcription sur chaque brin. 1 : une région d’un promoteur non codant (orange) peut modifier (par stimulation ou inhibition) l’expression d’un gène situé en aval (gène violet) par exemple en inhibant l’ARN polymérase II et/ou en remodelant localement la chromatine. C’est le principe de l’interférence transcriptionnelle ; 2 : un transcrit antisens (marron) hybride un transcrit sens chevauchant et inhibe la reconnaissance des sites d’épissage par le complexe protéique d’épissage, le spliceosome. Il en résulte un ARNm avec épissage alternatif. Une alternative possible à cette hybridation de l’ARNnc est l’activation de Dicer puis la formation de siARN ; 3 : un transcrit ARN antisens se fixe sur des protéines cibles et peut alors avoir plusieurs conséquences selon les ARNnc ; a : moduler l’activité d’une protéine ; b : guider la localisation cellulaire d’une protéine ; c : constituer une partie d’une structure protéique complexe ; 4 : un long ARNnc peut être fragmenté en plusieurs petits ARNnc (exemples, miARN, piwiARN). Actuellement, le nombre d’ARNnc contenus dans le génome humain n’est pas connu[36].
- miARNs
- Structure, rôles et détection des miRNAs
- Découverte desmiARNs
C’est en 1993, chez le ver Caenorhabditis elegans que le premier microARN a été identifié, ce n’est qu’en 2001 que le terme miARN a été introduit[37].
Environ 2588 miARNs, en 2014, ont été classés dans la base de données miRBase (www.mirbase.org).
Sa nomenclature est fonction de l’organisme auquel il appartient ainsi que de son numéro d’identification séquentielle. Ainsi, « hsa-miR-769 » signifie que le miARN appartient à l’homo sapiens (hsa) et correspond au 769emiARN identifié.
Comme les séquences codantes pour les miARNs se répartissent à divers endroits du génome, l’ajout de suffixe numérique a été requis, par exemple : hsa-miR-103-1 et hsa-miR-103-2.
Pour les miARNs qui proviennent d’un même précurseur, ils sont annotés par -3p ou -5p selon leur brin d’origine.
Etant donné que les miARNs interviennent dans divers processus fondamentaux à la vie cellulaire tels que l’apoptose, le métabolisme cellulaire ou encore la différenciation cellulaire, toute perturbation de leur expression que ce soit qualitative ou quantitative peut être corrélée au développement de graves pathologies telle que le cancer, les maladies métaboliques et neurodégénératives.
- Evolution des miARNs
De petits ARN simple brin d’environ 20pb à 24pb, les microARNs ou miARNS qui interviennent dans la régulation post-transcriptionnelle n’ont pas de queue poly(A) ni de chapeau (cap) protecteur en 3’.
Les miARNs seraient responsables de la régulation d’environ 10% et 30% des gènes codant[38].
Obtenus à partir d’un transcrit primaire le pri-miARN (pour primary microARN),
La synthèse du miARN se déroule dans le noyau sous l’action d’une ARN polymérase II ou d’une polymérase III.
Les transcrits peuvent être issus d’un gène unique au niveau d’un locus ou provenir d’un locus qui renferme un petit groupe de gènes de miARNs (cluster).
Il est à noter que près de la moitié des gènes de miARN se localise au niveau des
introns de gènes codant pour des protéines. Sinon, ils peuvent se retrouver dans des exons non traduits ou encore dans des régions extragéniques.
L’ARN qui est composé de structures en épingle à cheveux « hairpin » est formé à partir du pri-miARN au sein du noyau avant de s’assembler à un complexe protéique : le microprocesseur, qui est formé par une RNase III, de type Drosha, une protéine de fixation de l’ARN, DGCR8 ainsi que de nombreuses autres protéines, qui va agir en clivant le pri-miARN en prémiARN qui sera exporté vers le cytoplasme à travers le pore du noyau par le biais d’un mécanisme activant une protéine de la membrane nucléaire : exportine 5.
Arrivé dans le cytoplasme, le pré-miARN s’unit à un autre complexe protéique qui renferme notamment une RNase III : Dicer qui va, par conservation d’un seul des deux brins du pré-miARN, finaliser la synthèse du miARN : ARN simple brin. Ce dernier viendra s’associer à un complexe protéique, le microRNA induced silencing complex (miRISC), formé majoritairement des protéines de la famille Argonaute, qui va le transporter vers sa cible.
Pour son activité, le miARN mature est formé de deux principales parties :
– la partie 5’ encore appelée la tête (seed) des bases 2 à 8 ou 9 qui va intervenir dans l’appariement avec la cible.
– la partie 3’ qui joue un rôle fondamental dans la reconnaissance de la cible.
Figure 11 : Synthèse d’un miARN. A. Dans le noyau, le gène codant un miARN est transcrit par une ARN polymérase II (parfois III) en pri-miARN. Ce dernier est ensuite scinder par un complexe protéique associant une RNase de type Drosha III, une protéine de fixation des ARN, la DGCR8 et un ensemble d’autres protéines. Un pré-miARN est obtenu. Celui-ci traverse ensuite le pore nucléaire pour arriver dans le cytoplasme. DGCR8 : Di George syndrom critical region gene 8 (Omim 609030) ; Drosha : ribonuclease III nuclear (Omim 608828). B. Dans le cytoplasme, le pré-miARN est ensuite débarrassé de sa boucle ARN par le complexe Dicer. Un des deux brins est alors sélectionné pour devenir le miARN mature. Celui-ci est incorporé dans le complexe protéique RISC qui va guider le miARN vers sa cible ARNm et réprimer l’expression de ce dernier. RISC : microRNa
induced silencing complex ; Dicer : helicase with RNA motif (ou helicase-MOI) (omim 606241) ; AAA..A : queue poly(A) de la partie 3’ non codante des ARNm (ARN messagers)[39].
- Pathway des miARNs
L’ARNm et le miARN peuvent interagir et engendrer soit :
– l’inhibition de la traduction de l’ARNm
– la lyse (partielle) de l’ARNm et par voie de conséquences une réduction de son expression.
Etant donné qu’un même miARN peut agir sur plusieurs cibles possibles et que d’autres miARN peuvent avoir la même cible, il existe une combinatoire d’interaction de miARN qui va intervenir dans la modulation de l’expression d’ARNm.
Rarement, des miARNs sembleraient pouvoir stimuler la traduction d’ARNm[40]
Le brin sens ou antisens qui sera sélectionné, pour s’associer à une protéine appelée Argonaute (Ago) qui possède une activité endonucléolytique RNase H, afin de former le miARN mature sera le brin qui possèdera l’appariement 5’ le plus faible pour sa cible.
Les transcrits d’ARNm seront ciblés par le miARN mature par le biais d’appariement imparfaite au niveau des régions 3’NCs en particulier.
De ce fait, certains miARN peuvent cibler tant les zones 3’NC que les régions codantes d’un ARNm ou encore, rarement, uniquement sur la région codante d’un ARNm [41] [42].
Des études ont mis en évidence que le mode d’action du miARN : que ce soit par inhibition ou par dégradation n’est pas fonction du mode d’appariement de ce dernier. En effet, divers facteurs interviennent comme le type de protéines des complexes Argo ou RISC, ou la composition des ribonucléoprotéines impliquées, ou encore l’action du promoteur dont dépend le miARN. Ce qui explique que bien qu’il y ait une complémentarité exacte de la zone seed, le miARN peut ne pas être fonctionnel[43].
Figure 12 : Règle de la tête (seed rule). A. La règle dit qu’un appariement exact de type Watson-Crick (A = T et G≡C) entre le deuxième nucléotide et en général, le septième nucléotide du miARN (en 5’ de l’ARN) doit être présent pour que le miARN puisse exercer son activité. La région de tête (seed) est encadrée en rouge. Le reste du miARN n’a pratiquement pas de complémentarité avec les autres bases de l’ARNm cible. Le plus souvent cet appariement a lieu dans la région 3’NC de l’ARNm mais on sait que dans de nombreux cas, des appariements dans des régions codantes de l’ARNm existent aussi. B. Bien que la règle ci-dessus décrite s’applique pour de nombreux miARN, les études ont démontré que cette règle n’était pas absolue et que des miARNs pouvaient exercer leurs fonctions sans obéir à une complémentarité stricte dans la zone 2-7 pb du miARN. Les régions non appariées dans la tête constituent des petites boucles (bulge).
- Mirtrons
Les mirtrons sont des miARNs atypiques qui proviennent d’un mécanisme de maturation des miARNS qui font intervenir des complexes proche de Dicer et Drosha : Dicerlike et Drosha-like, en présence du complexe d’épissage : le spliceosome et d’une enzyme débranchante[44].
- Les gènes miARNs
La transcription des gènes miARNs effectuée par l’ARN polymérase de type II aboutit à de longs précurseurs dénommés pri-miARNs qui sont divisés par le complexe Drosha et DGCR8(Di George critical region 8) au sein du noyau pour avoir le pré-miARN.
Le pré-miARN, long et constitué par environ 70nucléotides, est replié en forme de tige-boucle imparfaite subséquemment à complémentarité des bases au niveau de la première et la deuxième moitié de sa séquence.
Ce pré-miARN est ensuite cheminé du noyau vers le cytosol sous l’interaction de l’Exportine 5 (chez les mammifères) avant d’être hydrolysé, pour libérer un petit double brin, une enzyme de la famille Dicer.
Le complexe RISC (RNA-induced silencing complex) est ensuite formé par interaction de ce miARN double brin avec une des quatre protéines de la famille argonaute (Ago1 à 4) et la protéine TRBP (transactivating ARN-binding protein).
Durant cette formation du RISC, le miARN double brin subit une maturation qui le transforme en miARN mature simple brin. La présence de polymorphisme au sein des gènes codant pour les miARNs peut induire la stabilisation des brins passagers qui normalement devraient être dégradés[45].
Ces brins passagers stabilisés peuvent cibler d’autres ARNms distincts de ceux normalement sélectionnés par le brin mature, engendrant ainsi une modification de la régulation habituellement effectuée par ce miARN mature.
Figure 13 : Biogenèse des miARNs et mécanisme d’action chez les mammifères.
Les protéines Drosha, DGCR8 et Dicer sont des RNAses qui permettent la maturation du pri-miARN et pré-miARN et miARN double brin.
Complexe RISC: RNA-induced silencing complex; AGO: protéine argonaute; ORF: open reading frame ou cadre ouvert de lecture d’un gène.
- Organisation génomique
- Les clusters de miRNA
Chez l’Homme, l’identification des gènes codant les miARN peut être réalisée par homologie avec le génome d’autres espèces, par recherche bioinformatique ou encore par validation en utilisant par exemple des méthodes de northern blot, PCR, hybridation sur puce ou séquençage.
La dispersion de ces gènes s’effectue sur l’ensemble des chromosomes, sauf sur le chromosome Y.
Environ 50% des miARN se regroupent en « cluster », lorsqu’ils dépendent d’un même promoteur ils sont dénommés miARN polycistroniques.
La localisation des gènes codant des miARN peut être « intergénique » lorsque ces derniers se retrouvent au sein d’unités géniques indépendantes et ou bien « introniques ou exoniques » lorsqu’ils se situent dans des unités géniques codant pour des pré-ARNm qui peuvent coder ou non pour des protéines[46] [47] [48].
Figure 14 : Localisation des gènes codant des miARN situés dans des unités
géniques codant des pré-ARNm[49].
- Régulation de leur transcription
Au niveau du transcrit, l’action des miARNs porte surtout sur la répression de la traduction sans qu’il y ait destruction de l’ARNm. Ainsi, la réactivation de l’ARNm est possible sans que sa dégradation soit irréversible.
Cette réactivation de l’ARNm se fait plus rapidement dans le cas où la répression est causée par un miARN et non par un autre inhibiteur de la traduction.
La régulation exercée par un miARN s’effectue dans des cellules divisées en compartiments, dites cellules polarisés dont la traduction des protéines est spécifique de leur localisation et du comportement cellulaire.
Ainsi, la régulation de l’activité des gènes est déterminante au sein des synapses neuronales étant donné l’importance de la longueur des axones qui séparent les sites actifs des sites de transcription dans le noyau. Vitale, la régulation de la traduction qui se déroule au niveau de la synapse se doit ainsi de permettre une adaptation rapide par rapport à l’activité du neurone.
D’ailleurs, une étude effectuée chez des cultures de neurones de rat a mis en évidence que l’exposition des neurones à des facteurs neurotrophiques dérivés du cerveau activait la libération de la répression d’un ARNm qu’est le Lim domain kinase-1 par miR-134 dont le mécanisme de réversibilité
d’expression est encore mal connu[50].
Les miARNs conditionnent cette réversibilité d’action, d’où un intérêt thérapeutique de l’utilisation des miARNs compte tenu cette flexibilité au sein de divers phénomènes biologiques[51].
- Régulation post transcriptionnelle
Afin de coordonner la synthèse ainsi que l’assemblage et la localisation des complexes dits macromoléculaires au sein des cellules, la régulation de l’expression génique est primordiale[52] [53].
Figure 15 : Etapes de l’expression génique
La régulation débute dans le noyau dans lequel se déroule la liaison des facteurs de transcription avec des séquences spécifiques d’ADN proximales ou distales d’un gène ainsi que le recrutement des ARN polymérases pour la synthèse des ARN.
Durant la synthèse, les protéines de liaison à l’ARN viennent s’associer avec l’ARN et vont procéder à divers modifications comme l’addition d’une coiffe en 5’, l’épissage, l’édition et la poly-adénylation en 3’[54] [55] [56].
Ensuite a lieu l’exportation des transcrits vers le cytoplasme par les pores nucléaires pour y être adressés et stockés au niveau des régions subcellulaires par le biais de signaux de localisation et des protéines de liaison à l’ARN[57].
L’initiation de la synthèse protéique est effectuée par l’assemblage des ARNm avec des facteurs de traduction et les ribosomes[58].
Enfin, des éxonucléases vont dégradés les ARNm[59].
La régulation post-transcriptionnelle reste encore peu connue, cependant il apparaît l’existence d’un système de régulation qui est sous le contrôle d’un grand nombre de protéines de liaison à l’ARN et de microARN (miARN) qui sont encodés dans les génomes eucaryotes[60] [61]
L’épissage alternatif se définit par le mécanisme fondamental qui intervient dans la diversité du protéome, le mécanisme peut varier selon les gènes concernés. L’épissage alternatif aurait un rôle essentiel dans la régulation via les miARNs[62]. Incontestablement, l’épissage alternatif peut être à l’origine de modifications des régions 3’ et 5’ non codantes des transcrits et par conséquent de l’action des miARNs[63].
Figure 16 : Différents types d’épissage alternatif
L’épissage alternatif intervient également dans la stabilité des ARN par production de différents isoformes possédant différents codons stop. En effet, un isoforme pourvu d’un codon stop prématuré est facilement soumis
à la dégradation médiée par le non-sens (non-sens mediated decay ; NMD).
Ce qui met en exergue la présence de coordination entre l’épissage alternatif et le NMD qui aboutit à dégradation rapide du messager contenant un stop prématuré[64]. Ce qui amène à dire que l’épissage alternatif peut moduler le niveau d’expression d’un gène.
1.4.3 Rôles des miARNs dans la régulation des mRNAs
- Répression de la traduction
D’une manière générale, un appariement exact est requis entre le deuxième et le septième nucléotide de la région seed du miARN afin que ce dernier puisse être actif.
Il existe ainsi deux voies de répression :
– dégradation de l’ARNm lorsque le complexe renferme la protéine Ago2 et qu’il y ait cible homologie complète entre le miARN et sa cible
– répression de la traduction dans le cas ou le complexe renferme les autres protéines Ago avec un miARN partiellement hybridé.
De ce fait, même partielle, une reconnaissance peut permettre à un seul miARN de cibler éventuellement plus de 200 gènes[65].
70 % des miARNs possède un effet en tant que répresseur traductionnle chez les mammifères. Toutefois, il s’avère que les miARNs peuvent agir sans se plier à la règle d’appariement exact des 2 à 7 (effet non-seed) selon les structures secondaires des ARNms cibles[66] [67].
En effet, le miARN peut se lier au 5’UTR de l’ARNm cible et non au 3’UTR 53, au niveau de la séquence codante de l’ARNm ou encore à la jonction intron-exon 54. De plus, l’augmentation de l’expression protéique du gène cible peut être induite par les miARNs par activation du ARNm55. Par ailleurs, les miARNs peuvent revenir dans le noyau afin d’intervenir dans la régulation génétique[68].
Figure 17 : Voie de biosynthèse des miARN – Répression de la traduction et dégradation
- Caractéristiques de la cible sur le miARNs
Les cibles des miARNs sont variées et ne sont pas homogènes. Bien que dès milliers d’interactions régulatrices peuvent s’effectuer, toutes ses interactions n’engendrent pas forcément de conséquences phénotypiques.
Par exemple, le cas de miR-150 : miR-150 s’exprime de manière spécifique dans les cellules B et T matures or la modification de l’expression de ce miARN permet d’obtenir des cellules B immatures qui ne se différencient plus.
Généralement, la relation entre un miARN et sa/ses cible(s) potentielle(s) se résume ainsi[69] :
– la quantité de protéines qui provient des gènes cibles est fonction de la concentration cellulaire de miARN
– des modifications significatives en termes d’effets physiologiques/biologiques peuvent être engendrées par la modulation modérée de la quantité de protéines synthétisées
– l’expression protéique de plusieurs cibles pouvant être modulée par un seul miARN, seules quelques unes auront un effet critique sur des métabolismes biologiques
– une redondance fonctionnelle peut être rencontrée chez des miARNs homologues aux profils d’expression similaires et par conséquent, une compensation mutuelle peut s’effectuer en cas de déficit de l’un deux.
– des clusters de miARNs peuvent réguler différentes cibles d’une même voie métabolique tout en agissant sur d’autres voies métaboliques qui sont reliées entre elles du point de vue fonctionnel.
- Prediction et validation In – Silico des cibles
Suite à la découverte de l’intérêt des miARNS en bioinformatique, l’information obtenue suite à la conservation des séquences dans le cas de plusieurs organismes ainsi que la prédiction des structures de l’ARN ont permis de trouver des cibles, notamment chez la Drosophile[70] [71].
Ensuite, d’autres programmes de prédiction des cibles des microARNs chez les mammifères en vu le jour : TargetScan[72], miRanda[73], PicTar[74] et RNAhybrid[75].
Les techniques utilisées s’appuient sur les propriétés biologiques des microARNs ainsi que de leurs cibles (séquence, énergie du duplexe microARN/ARNm…) et la conservation des séquences chez plusieurs espèces.
Il est à noter que la validation in silico de microARNs endogènes offre une perspective de vérification des règles de l’algorithme ainsi que de leurs pondérations par rapport aux observations réelles.
Pur se faire, deux microARNs ont été sélectionnés : miR-20 et miR-206.
La figure suivante montrele résultat des six sites de liaisons de miR-20, soit 0.52, dont le résultat des meilleurs alignements avec le microARN est de 0.4.
Figure 18 : Résultat MultiTar des sites endogènes de miR-20. Le résultat de l’algorithme itératif du seed est de 0.52 et le résultat des meilleurs alignements est de 0.4.
1.4.4 Identification de nouveaux miARNs et quantification
- Approches conventionnelles
D’une manière générale, la liaison du miR avec l’ARNm cible s’effectue au niveau de la région 3’UTR de ce dernier. Région qui a la possibilité de se lier à plusieurs miRs à la fois, de plus la région « graine » du miR (nucléotides 2-7) est déterminante en ce qui concerne sa liaison au niveau de sa cible.
Afin d’identifier les gènes cibles des miRs, divers outils bioinformatiques ont été développés, leurs différences se situent au niveau des algorithmes et des critères utilisés.
Ainsi, pour la prédiction des gènes cibles, les principales caractéristiques sont :
– la complémentarité requise entre la séquence du miR et les sites de liaison sur le 3’UTR de l’ARNm
– la conservation des sites de liaison du miR parmi les différentes espèces
– la stabilité thermodynamique du duplexe miR-ARNm ; (iv) la localisation du site de liaison au niveau du 3’UTR
Les outils les plus communément utilisés étant les : TargetScan, miRanda, microCosm et PicTar[76] [77] [78] [79] [80] [81].
- Approches In-Silico
Les approches In-Silico utilisent des modèles matriciels des sites de liaison de FTs connus qui sont répertoriés dans des banques de données : TRANSFAC et JASPAR ainsi que MatBase, qui ont été construites à partir de sites validés expérimentalement, issus de littérature ou à partir d’expériences de sélection in-vitro.
Communément, la méthode utilisée afin de représenter les sites de fixation des FTs par matrice consiste à la probabilité d’observation des nucléotides à chacune des positions d’un site de liaison[82].
Le calcul se fonde sur la transformation d’une matrice dite de fréquence d’observation des nucléotides en une matrice pondérée selon les équations suivantes :
Où : p(b,i) = probabilité corrigée du nucléotide b à la position i ; fb;i = la fréquence du nucléotide b à la position i ; N = nombre de sites ; s(b) = pseudo-poids
Par sa probabilité à priori dans tout le génome et en calculant sa valeur dans une échelle logarithmique:
Ainsi, le score attribué à un site de liaison d’un FT équivaut à la somme des poids de chacun de ses nucléotides dans la matrice pondérée[83].
1.5 Rôles des biomarqueurs en santé
- Définition d’un biomarqueur
D’après le National Institute of Health (USA), un biomarqueur se définit comme étant « une caractéristique biologique mesurée de façon objective et évaluée comme un indicateur soit de processus biologiques normaux ou pathologiques, soit de réponses pharmacologiques résultant d’une intervention thérapeutique »[84].
Une classification des biomarqueurs a été réalisée par le National Institute of Health compte tenu de la diversité des types de biomarqueurs.
Tableau 02: Définition des biomarqueurs selon le National Institute of Health[85] [86].
Dénomination | Définition |
Biomarqueur | Caractéristique biologique mesurée de façon objective et évaluée comme un indicateur soit de processus biologiques normaux ou pathologiques, soit de réponses pharmacologiques résultant d’une intervention thérapeutique |
Biomarqueur de type 0 | Marqueur biologique de la progression de la maladie relie a un paramètre clinique connu |
Biomarqueur de type I | Marqueur biologique qui reflète les effets d’une therapeutique selon son mécanisme d’action |
Biomarqueur de type II | Marqueur biologique considère comme un critère de substitution : une modification de ce biomarqueur est associée a un bénéfice clinique ou a un risque |
Critère de substitution [ou ≪ Surrogate endpoint ≫] | Catégorie de marqueurs destines a se substituer a un critère d’évaluation clinique devant permettre de déterminer le bénéfice clinique ou le risque a partir de données épidémiologiques, thérapeutiques ou physiopathologiques |
Critère d’évaluation clinique [ou ≪ Clinical end point ≫] | Caractéristique ou variable qui reflète l’état du patient. |
Marqueur pronostique | Marqueur permettant de différencier des catégories de patients a différents risques pour une évolution déterminée, indépendamment du choix du traitement administre (ou du choix de ne pas administrer de traitement) |
Marqueur prédictif | Marqueur permettant de prévoir les éventuels bénéfices (efficacité) et risques (toxicité) d’un traitement selon le statut du marqueur. |
- Les microRNAs comme biomarqueurs d’intérêts
Diverses pathologies sont associées à des variations d’expression des miARNs, d’ailleurs la classification des tumeurs, dont la spécificité dépasse les 90%, s’effectue facilement par le biais du profil d’expression d’un nombre ciblé de miARNs[87].
De plus, la variabilité d’expression des miARNS peut être également considérée comme étant des facteurs de prédiction de la progression tumorale[88].
De ce fait, une variation de l’expression de miR-126 est fortement correlée à un risque métastasique dans les cancers du sein[89].
Récemment, à partir de profils de miARNs ont été distingué les métastases ganglionnaires et hépatiques des cancers colorectaux dans les tumeurs primaires ou encore les métastases colorectales des tumeurs hépatiques[90].
Il s’avère que l’utilisation des miARNS circulants en tant que biomarqueurs de cancers ou de prédisposition à la résistance aux thérapeutiques semble être une alternative par rapport à l’usage de miARNs tissulaires compte tenu de leur spécificité et leur facilité de recueil. Par ailleurs, la stabilité des miARNs circulants complémentairement à leur association avec les complexes particulaires ou protéiques contribuent à assurer leur protection contre les RNAses[91].
Tableau 03 : Micro-ARN associés aux cancers digestifs et leurs gènes cibles[92]
miRNA | Roles in gastrointestinal cancers | Target genes |
Potential tumor suppressor miRNAs | ||
miR-15b, miR-16 | miR-15b and miR-16 play a role in the development of MDR in gastric cancer cells by modulation of apoptosis via targeting BCL2 | BCL2 |
miR-34a | mrR-34a functions as a tumor suppressor and induces senescence-like growth arrest through modulation of the E2F pathway in human colon cancer cells | E2F pathway |
miR-143, miR-145 | miR-143 and miR-145 are downregulated in colorectal cancer | ERK5 |
Potential oncogenic miRNAs | ||
miR-17-92 cluster | miR-17-92 cluster is overexpressed in various human malignancies, including colon cancer |
E2F1 (miR-17-5p, miR-20a) TGFBR2 (miR-20a) |
miR-21 | miR-21 is upregulated in various human malignancies including cholangiocarcinoma, and gastric and colon cancers | PTEN |
miR-106a | miR-106a is upregulated in colon cancer | RB-1 |
miR-106b-25 cluster | miR-106b-25 cluster, which is upregulated in human gastric cancers and activated by E2F1, impairs the TGF-b tumor suppressor pathway |
p21 Bim E2F1 |
miR-155 | miR-155 is overexpressed in various human malignancies, including B-cell lymphoma and colon cancer | TP531NP1 |
2. Objectifs de la thèse
3. Matériel et Méthodes
3.3 Prediction In-silico demiARNs
3.4 Pre-validation
3.4.1 microArrays
3.4.2 NGS
3.4.3 qRT-PCR
4. Résultats
3.1 Identification de microRNA
- METHODS FOR THE IDENTIFICATION OF MICRORNA AND THEIR APPLICATIONS IN RESEARCH AND HUMAN HEALTH, brevet US 8,116,987 B2. Delfour et al
- A complex picture for the processing of pre-miRNA to mature is emerging in human. FEBS letter Delfour et al Accepté mais retiré pour raison confidentielle
- microRNA comme biomarqueur circulant pour la detection précoce du cancer du poumon
- Alternative processing of the U2 small nuclear RNA produces a 19-22nt fragment with relevance for the detection of non-small cell lung cancer in human serum.PlosOne. Mazières et al.
4 Discussions
5 Conclusion
6 Bibliographie
7 Annexes
[1] http://www.colvir.net/prof/ chantal.proulx/701/chap3c_contenu.htm
[2] Bell AC, Felsenfeld G. Methylation of a CTCF-dependent boundary controls imprinted expression of the Igf2 gene.Nature 2000 ; 405 : 482-5.
[3] Moens U, Subramaniam N, Johansen B, Aarbakke J. The c-fos cAMP-response element : regulation of gene expression by a beta 2-adrenergic agonist, serum and DNA methylation. Biochim Biophys Acta 1993 ; 29 : 63-70.
[4] Vogelauer M, Wu J, Suka N, Grunstein M. Global histone acetylation and deacetylation in yeast. Nature 2000 ; 408 : 495-8.
[5] Haoyang Lu, Xinzhou Liu, Yulin Deng and Hong Qing. DNA methylation, a hand behind neurodegenerative diseases. Review ARTICLE Front. Aging Neurosci., 05 December 2013 | http://dx.doi.org/10.3389/fnagi.2013.00085
[6] Xie S, Wang Z, Okano M, Nogami M, Li Y, He WW, et al. Cloning, expression and chromosome locations of the human DNMT3 gene family. Gene 1999 ; 236 : 87-95.
[7] Bestor TH. The DNA methyltransferases of mammals. Hum Mol Genet 2000 ; 9 : 2395-402
[8] Yan, B. and Z. Wang, Long noncoding RNA: its physiological and pathological roles. DNA Cell Biol, 2012. 31 Suppl 1: p. S34-41.
[9] Yan, B. and Z. Wang, Long noncoding RNA: its physiological and pathological roles. DNA Cell Biol, 2012. 31 Suppl 1: p. S34-41
[10] C.P. Ponting, P.L. Oliver, W. Reik. Evolution and functions of long noncoding RNAs.
Cell, 136 (2009), pp. 629–641
[11] Yan, B. and Z. Wang, Long noncoding RNA: its physiological and pathological roles. DNA Cell Biol, 2012. 31 Suppl 1: p. S34-41
[12] H. Kawaji, Y. Hayashizaki Exploration of small RNAs PLoS Genet, 4 (2008), p. e22
[13] A.S. Spirin. The ribosome as an RNA-based molecular machine. RNA Biol, 1 (2004), pp. 3–9
[14] M.V. Rodnina, W. Wintermeyer. Recent mechanistic insights into eukaryotic ribosomes. Curr Opin Cell Biol, 21 (2009), pp. 435–443
[15] J.P. Staley, J.L. Woolford Jr. Assembly of ribosomes and spliceosomes: complex ribonucleoprotein machines
Curr Opin Cell Biol, 21 (2009), pp. 109–118
[16] J. Houseley, D. Tollervey. The many pathways of RNA degradation.
Cell, 136 (2009), pp. 763–776
[17] J.P. Staley, J.L. Woolford Jr. Assembly of ribosomes and spliceosomes: complex ribonucleoprotein machines
Curr Opin Cell Biol, 21 (2009), pp. 109–118
[18] J.D. Dinman. The eukaryotic ribosome: current status and challenges. J Biol Chem, 284 (2009), pp. 11761–11765
[19] D. Samanta, A. Das, A. Bhattacharya, A. Basu, D. Das, C. DasGupta. Mechanism of ribosome assisted protein folding: a new insight into rRNA functions. Biochem Biophys Res Commun, 384 (2009), pp. 137–140
[20] A.G. Matera, R.M. Terns, M.P. Terns; Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs; Nat Rev Mol Cell Biol, 8 (2007), pp. 209–220
[21] T.W. Nilsen; The spliceosome: the most complex macromolecular machine in the cell?. Bioessays, 25 (2003), pp. 1147–1149
[22] A.G. Matera, R.M. Terns, M.P. Terns. Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs. Nat Rev Mol Cell Biol, 8 (2007), pp. 209–220
[23] M.V. Rodnina, W. Wintermeyer. Recent mechanistic insights into eukaryotic ribosomes; urr Opin Cell Biol, 21 (2009), pp. 435–443
[24] E.M. Gustillo, F.A.P. Vendeix, P.F. Agris . tRNA’s modifications bring order to gene expression. Curr Opin Microbiol, 11 (2008), pp. 134–140
[25] P.F. Agris, F.A. Vendeix, W.D. Graham. tRNA’s wobble decoding of the genome: 40 years of modification. J Mol Biol, 366 (2007), pp. 1–13
[26] R. Groppo, J.D. Richter. Translational control from head to tail. Curr Opin Cell Biol, 21 (2009), pp. 444–451
[27] H.S. Zaher, R. Green. Fidelity at the molecular level: lessons from protein synthesis. Cell, 136 (2009), pp. 746–762
[28] P.F. Agris, F.A. Vendeix, W.D. Graham. tRNA’s wobble decoding of the genome: 40 years of modification.
J Mol Biol, 366 (2007), pp. 1–13
[29] G. Dieci, M. Preti, B. Montanini. Eukaryotic snoRNAs: a paradigm for gene expression flexibility. Genomics, 94 (2009), pp. 83–88
[30] G. Dieci, M. Preti, B. Montanini. Eukaryotic snoRNAs: a paradigm for gene expression flexibility. Genomics, 94 (2009), pp. 83–88
[31] A.G. Matera, R.M. Terns, M.P. Terns. Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs. Nat Rev Mol Cell Biol, 8 (2007), pp. 209–220
[32] A.G. Matera, R.M. Terns, M.P. Terns; Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs. Nat Rev Mol Cell Biol, 8 (2007), pp. 209–220
[33] Brosnan CA, Voinnet O. The long and the short of noncoding RNAs. Curr Opin Cell Biol 2009;21:416—25.
[34] J. Lamoril, N. Ameziane, J.-C. Deybach, P. Bouizegarène, M. Bogard. Le monde complexe et mouvant des ARN. Première partie. Immuno-analyse et biologie spécialisée (2010) 25, 4—25
[35] Wilusz JE, Sunwoo H, Spector DL. Long noncoding RNAs: functional surprises from the RNA world. Genes Dev
2009;23:1494—504.
[36] J. Lamoril, N. Ameziane, J.-C. Deybach, P. Bouizegarène, M. Bogard. Le monde complexe et mouvant des ARN. Première partie. Immuno-analyse et biologie spécialisée (2010) 25, 4—25
[37] Lee RC, Feinbaum RL, et al. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell 1993;75(5):843-54.
[38] Paranjape T, Slack FJ,Weidhaas JB. MicroRNAs: tools for cancer diagnostics. Gut 2009;58:1546—54.
[39] J. Lamoril, P. Bouizegarène, M. Bogard. Le monde complexe et mouvant des ARN. Seconde partie : les microARNs. Immuno-analyse et biologie spécialisée (2010) 25, 219—240
[40] Vasudevan S, Tong Y, Steitz JA. Switching from repression to activation: microRNAs can up-regulate translation. Science 2007;318:1931—4.
[41] Brodersen P, Voinnet O. Revisiting the principles of microRNA target recognition and mode of action. Nat Rev Mol Cell Biol 2009;10:141—8.
[42] Rigoutsos I. New tricks for animal microRNAS: targeting of amino acid coding regions at conserved and nonconserved sites. Cancer Res 2009;69:3245—8.
[43] Didiano D, Hobert O. Molecular architecture of a miRNAregulated 3’ UTR. RNA 2008;14:1297—317.
[44] Okamura K, Hagen JW, Duan H, Tyler DM, Lai EC. The mirtron pathway generates microRNA-class regulatory RNAs in Drosophila. Cell 2007;130:89—100.
[45] Lee Y, Jeon K, et al. MicroRNA maturation : stepwise processing and subcellular localization. EMBO J 2002;21(17):4663-70.
[46] Rodriguez, A., S. Griffiths-Jones, J.L. Ashurst, and A. Bradley. (2004) Identification of mammalian microRNA host genes and transcription units. Genome Res. 14:1902-10.
[47] Saini, H.K., A.J. Enright, and S. Griffiths-Jones. (2008) Annotation of mammalian primary microRNAs. BMC Genomics. 9:564.
[48] Kim, V.N., J. Han, and M.C. Siomi. (2009) Biogenesis of small RNAs in animals. Nat Rev Mol Cell Biol. 10:126-39.
[49] Kim, V.N., J. Han, and M.C. Siomi. (2009) Biogenesis of small RNAs in animals. Nat Rev Mol Cell Biol. 10:126-39.
[50] Schratt GM, Tuebing F, Nigh EA, Kane CG, Sabatini ME, Kiebler M, et al. A brain-specific microRNA regulates dendritic spine development. Nature 2006;439:283—9.
[51] Flynt AS, Lai EC. Biological principles of microRNA-mediated regulation: shared themes amid diversity. Nat Rev Genet 2008;9:831—42.
[52] Maniatis, T. and R. Reed, An extensive network of coupling among gene expression machines. Nature, 2002. 416(6880): p. 499-506.
[53] Orphanides, G. and D. Reinberg, A unified theory of gene expression. Cell, 2002. 108(4): p. 439-51.
[54] Maniatis, T. and R. Reed, An extensive network of coupling among gene expression machines. Nature, 2002. 416(6880): p. 499-506.
[55] Moore, M.J., From birth to death: the complex lives of eukaryotic mRNAs. Science, 2005. 309(5740): p. 1514-8.
[56] Dreyfuss, G., V.N. Kim, and N. Kataoka, Messenger-RNA-binding proteins and the messages they carry. Nat Rev Mol Cell Biol, 2002. 3(3): p. 195-205.
[57] St Johnston, D., Moving messages: the intracellular localization of mRNAs. Nat Rev Mol Cell Biol, 2005. 6(5): p. 363-75.
[58] Gebauer, F. and M.W. Hentze, Molecular mechanisms of translational control. Nat Rev Mol Cell Biol, 2004. 5(10): p. 827-35.
[59] Parker, R. and H. Song, The enzymes and control of eukaryotic mRNA turnover. Nat Struct Mol Biol, 2004. 11(2): p. 121-7.
[60] Hieronymus, H. and P.A. Silver, A systems view of mRNP biology. Genes Dev, 2004. 18(23): p. 2845-60.
[61] Mata, J., S. Marguerat, and J. Bahler, Post-transcriptional control of gene expression: a genome-wide perspective. Trends Biochem Sci, 2005. 30(9): p. 506-14.
[62] Sandberg R, Neilson JR, Sarma A, Sharp PA, Burge CB. Proliferating cells express mRNAs with shortened 3’ untranslated regions and fewer microRNA target sites. Science 2008;320:1643—7.
[63] Passetti F, Ferreira CG, Costa FF. The impact of microRNAs and alternative splicing in pharmacogenomics. Pharmacogenomics J 2009;9:1—13.
[64] Morrison, M., K.S. Harris, and M.B. Roth, smg mutants affect the expression of alternatively spliced SR protein mRNAs in Caenorhabditis elegans. Proc Natl Acad Sci U S A, 1997. 94(18): p. 9782-5.
[65] Okamura K, Liu N, et al. Distinct mechanisms for microRNA strand selection by Drosophila Argonautes. Mol Cell 2009;36(3):431-44.
[66] Pratt AJ, MacRae IJ. The RNA-induced silencing complex : a versatile gene-silencing machine. J Biol Chem 2009;284(27):17897-901.
[67] Xu W, Wang Z, et al. The characterization of microRNA-mediated gene regulation as impacted by both target site location and seed match type. PLoS One 2014;9(9):e108260.
[68] Hwang HW, Wentzel EA, Mendell JT. A hexanucleotide element directs microrna nuclear import. Science. 2007;315:97-100.
[69] Xiao C, Rajewsky K. MicroRNA control in the immune system: basic principles. Cell 2009;136:26—36.
[70] A. Stark, J. Brennecke, RB Russell, and SM Cohen. Identification of Drosophila MicroRNA Targets. PLoS Biol, 1(3) :e60, 2003.
[71] N. Rajewsky and N.D. Socci. Computational identification of microRNA targets. Developmental Biology, 267(2) :529–535, 2004.
[72] B.P. Lewis, I. Shih, M.W. Jones-Rhoades, D.P. Bartel, and C.B. Burge. Prediction of Mammalian MicroRNA Targets. Cell, 115(7) :787–798, 2003.
[73] B. John, A.J. Enright, A. Aravin, T. Tuschl, C. Sander, and D.S. Marks. Human MicroRNA targets. PLoS Biol, 2(11) :e363, 2004.
[74] B. John, A.J. Enright, A. Aravin, T. Tuschl, C. Sander, and D.S. Marks. Human MicroRNA targets. PLoS Biol, 2(11) :e363, 2004.
[75] M. Rehmsmeier, P. Steffen, M. Hochsmann, and R. Giegerich. Fast and effective prediction of microRNA/target duplexes. RNA, 10(10) :1507–1517, 2004.
[76] Selbach M. et al. Widespread changes in protein synthesis induced by micrornas. Nature, 455 :58–63, 2008.
[77] Lewis B.P. et al. Conserved seed pairing, often flanked by adenosines, indicates that thousands of human genes are micrornas targets. Cell, 120 :15–20, 2005.
[78] Friedman R.C et al. Most mammalian mrnas are conserved targets of micrornas. Genome Research, 19 :92–105, 2009
[79] John B. et al. Human microrna targets. PLoS Biol, 2 :e363, 2004.
[80] Griffiths-Jones S. et al. mirbase : tools for microrna genomics. Nucleic Acids Res, 36 :D154–D158, 2008.
[81] Krek A. et al. Combinatorial microrna target predictions. Nature Genetics, 37(5) :495–500, 2005.
[82] Wasserman W.W. et al. Applied bioinformatics for the identification of regulatory elements. Nat Rev Genet, 5(4) :276–87, 2004.
[83] Liu J. Stormo G.D. Quantitative analysis of egr proteins binding to dna : assessing additivity in both the binding site and the protein. BMC Bioinformatics, 6(176), 2005.
[84] Biomarkers Definitions Working Group. Biomarkers and surrogate endpoints: preferred definitions
and conceptual framework. Clin Pharmacol Ther. 2001;69:89-95.
[85] Biomarkers Definitions Working Group. Biomarkers and surrogate endpoints: preferred definitions
and conceptual framework. Clin Pharmacol Ther. 2001;69:89-95.
[86] De Gruttola VG, Clax P, De Mets DL et al. Considerations in the evaluation of surrogate end points in clinical trials : summary of a National Institutes of Health Workshop. Control Clin. Trials 2001; 22(5):485-502.
[87] Rosenfeld N, Aharonov R, et al. MicroRNAs accurately identify cancer tissue origin. Nat Biotechnol 2008;26(4):462-9.
[88] Pencheva N, Tavazoie SF. Control of metastatic progression by microRNA regulatory networks. Nat Cell Biol 2013;15(6):546-54.
[89] Png KJ, Halberg N, et al. A microRNA regulon that mediates endothelial recruitment and metastasis by cancer cells. Nature 2012;481(7380):190-4.
[90] Drusco A, Nuovo GJ, et al. MicroRNA profiles discriminate among colon cancer metastasis. PLoS One 2014;9(6):e96670.
[91] Creemers EE, Tijsen AJ, et al. Circulating microRNAs : novel biomarkers and extracellular communicators in cardiovascular disease? Circ Res 2012;110(3):483-95.
[92] Saito Y, Suzuki H, Hibi T. The role of microRNAs in gastrointestinal cancers. J Gastroenterol 2009;44 Suppl 19:18-22.
Nombre de pages du document intégral:62
€24.90