Le génome humain, les virus et les bactéries
Dans l'histoire de la vie, nous sommes restés étroitement liés avec les bactéries et les virus.
Ainsi, les virus et les bactéries nous transmettent de temps à autre quelques-uns de leurs gènes. Et vice-versa...
c'est ce que l'on appelle le 'transfert horizontal' de l'information génétique ('horizontal/lateral gene transfert').
Le génome humain et les virus (1)
L'analyse du génome humain a révélé, entre autres, que 8 à 10 % de la séquence est d'origine virale !
...alors que seulement ~1.5 % de la séquence du génome 'code' pour des protéines !
Les séquences d'ADN virales sont des vestiges de l'infection, datant de plusieurs millions d'années,
des cellules germinales de nos ancêtres primates par des virus appelés 'rétrovirus'.
La plupart de ces séquences sont inactives: elles ont subi des modifications les rendant incapables de coder pour la moindre protéine.
Localiser les séquences d'origine virale dans le génome humain à l'aide de Mapviewer
Les vestiges des génomes des rétrovirus endogènes peuvent contenir 3 gènes viraux typiques:
- env (code pour des protéines 'envelope' 'fusiogènes' permettant la fusion entre le virus et la cellule cible)
- pol (code pour une polymerase impliquée dans la réplication de l'ADN du virus)
- gag (code pour les protéines de la capsides du virus).
Vous pouvez chercher directement ces différents 'gènes' (devenus inactifs pour la plupart) dans le génome humain à l'aide de Mapviewer .
Remarque: il n'existe pas de nomenclature officielle pour ces séquences d'origine virale.
Le résultat de votre recherche n'est pas précis ni exhaustif, mais vous permettra de voir
que les vestiges de ces séquences virales sont répartis dans tout le génome humain,
sur les différents chromosomes.
Rétrovirus endogènes produisant des protéines
Certaines séquences de rétrovirus endogènes sont 'actives' et produisent des protéines 'fonctionnelles' (exemple les rétrovirus HERV)
* Liste des protéines humaines connues produites à partir des séquences des rétrovirus endogènes 'HERV' dans UniProtKB.
Parmi les protéines humaines produites par des séquences virales intégrées dans le génome humain, on trouve les syncytines (syncytin).
Ces protéines ont des propriétés fusiogènes (vestiges des gènes 'env') et joueraient un rôle dans la formation du placenta.
Elles auraient également des propriétés immunosuppressives, essentielles pour une interface mère-enfant (dossier recherche).
Localiser le gène de la syncytine dans le génome humain
Localiser le gène de la syncytine (appelé ERVWE1) sur le génome humain à l'aide de Mapviewer
* Résultat:
Le gène codant pour la syncytine (ERVWE1) se trouve sur le chromosome 7
Trouver les protéines similaires à la syncytine humaine chez d'autres espèces
Pour trouver des protéines similaires à une protéine donnée, il faut utiliser un outil appelé BLAST (Basic Local Alignment Search Tool).
BLAST permet de comparer la séquence d'une protéine avec des millions d'autres séquences contenues dans une banque de données
et de retrouver celles qui lui ressemblent le plus, en quelques secondes.
Approche:
A partir de l'entrée UniProtKB correspondant à la syncytine humaine: Syncytin humaine
- Cliquer sur l'onglet BLAST
- Cliquer sur 'Option'
- Database (menu déroulant): choisissez 'UniProtKB/Swiss-Prot'
- Cliquer sur le bouton gris 'Blast'
Chez quelles espèces retrouve-t-on une protéine similaire à la syncytine humaine ?
Le rétrovirus à l'origine des syncytines aurait été 'capturé' par un ancêtre primate, il y a 45 à 70 millions d'années.
La syncytine n'est retrouvée que chez les descendants de ces primates (les simiens).
Quel est le nom des protéines virales les plus similaries à la syncytine humaine ?
L'ancêtre du gène de la syncytine est le gène viral 'env'.
Les syncytines ont 'récupéré' les propriétés fusiogènes des gènes viraux 'env'.
Comparer les séquences des protéines similaires à la syncytine humaine
Approche:
A partir des résultats du Blast sur UniProt:
Sélectionner des protéines similaires de différentes espèces (mammifères et virus)
Dans la barre verte qui apparaît en bas de l'écran, cliquez sur 'Clear, puis sur 'Align'
Vous pouvez ainsi visualiser les différences et les similitudes entre les différentes séquences en acides aminés.
Pour mieux voir les similarités: cliquer sur 'Similarity'.
Exemples:
* Comparer (aligner) les séquence de l'homme et du chimpanzé
* Comparer (aligner) les séquence de l'homme et du Baboon endogenous virus
Les virus et le génome humain (2)
Et si les virus avaient aussi 'piqué' du matériel génétique humain ?
L'homme a bénéficié de l'intégration de quelques gènes d'origine virale, mais l'inverse s'est produit aussi !
Trouver les protéines humaines similaires à une protéine du virus Epstein Barr
Approche:
A partir de l'entrée correspondant à une protéine du virus Epstein Barr dans UniProtKB:
- Cliquer sur l'onglet BLAST
- Cliquer sur 'Option'
- Database (menu déroulant): choisissez 'UniProtKB/Swiss-Prot'
- Cliquer sur le bouton gris 'Blast'
Quel est le nom de la protéine humaine similaire à la protéine du virus ? Quelle est sa fonction ?
Chez quelles autres espèces retrouve-t-on cette protéine ?
L'interleukine-10 est une protéine qui réduit la réponse immunitaire.
Les virus (Ebstein Barr, Herpes virus...) infectent les lymphocytes humains.
Pour pouvoir pénétrer dans la cellule, comme tous les virus, ils doit pouvoir échapper au système immunitaire.
Leur solution a été de 'piquer' le gène de l'interleukine-10 humaine.
En obligeant les cellules qu'ils infectent à produire de l'IL-10 en plus grande quantité, ils diminuent la réaction immunitaire de leur hôte !
Comparer les différentes séquences de l'interleukine-10 (IL-10)
Approche:
A partir des résultat du BLAST précédent:
- Sélectionner l'interleukin-10 de différentes espèces (mammifères et virus)
- Dans la barre verte qui apparaît en bas de l'écran, cliquez sur 'Clear' , puis sur 'Align'
Vous pouvez ainsi visualiser les différences et les similitudes entre les différentes séquences.
Pour mieux voir les similarités: cliquer sur 'Similarity'.
Exemples:
* Comparer (aligner) les séquence de l'IL-10 de l'homme et de la souris
* Comparer (aligner) les séquence de l'IL-10 de l'homme et du virus Epstein Barr
Pour en savoir plus sur ces virus:
* Lymphocryptovirus (Epstein-Barr, Herpes virus)
* Mastadenovirus (Adenovirus)
Le génome humain et les bactéries
'Selon la théorie endosymbiotique, (...) une cellule eucaryote primitive (ou une Archaea) aurait intégré un endosymbionte procaryote
il y a environ 1,5 à 2 milliards d’années.
Les études phylogénétiques indiquent que le plus proche parent de la mitochondrie connu actuellement est Rickettsia prowazekii,
une alpha proteobactérie parasite intracellulaire obligatoire (une cyanobactérie serait à l'origine du chloroplaste).
Au cours de l’évolution, la majorité des gènes de l’endosymbionte originel auraient été perdus ou bien transférés vers
le noyau de la cellule eucaryote hôte.' (Wikipedia).
Exemple:
* Protéines humaines produites par le génome de la mitochondrie
* Protéines humaines d'origine bactériennes produites par le génome 'nucléaire' (selon Nature (2001))
Quelle est la localisation subcellulaire de ces protéines ?
Aller sur le site UniProtKB
Choisir l'une des protéines humaines d'origine bactériennes produites par le génome 'nucléaire'.
Cliquer sur le numéro d'accession.
Regarder dans la section 'General annotation' quelle est la localisation subcellulaire de la protéine (si elle est connue...)
Combien de ces protéines ne sont pas localisées dans la mitochondrie ?
Il est intéressant de souligner que l'étude de ces transferts horizontaux n'est pas simple:
au moment du séquençage des génomes des eukaroytes, les séquences d'origine bactériennes sont souvent considérées comme des contaminations et éliminées d'office!
Origine endosymbiotique des mitochondries et des chloroplastes
En construisant un arbre phylogénétique en partant d'une protéine 'universelle' impliquée dans la synthèse des protéines
(exemple: un facteur d’élongation appelé EFTU ou EF1A selon les espèces),
on voit apparaître la séparation entre les eucaroytes, les archae et les bactéries (Arbre phylogénétique)
On remarque aussi et surtout que cette protéine, lorsqu'elle est d'origine chloroplastique ou mitochondriale se retrouve
dans l''embranchement' des protéines bactériennes: sa séquence en acides aminés est plus similaire à celle
des protéines bactériennes qu'à celle des protéines eucaryotiques.
Une histoire d'endosymbiose entre 2 eukaryotes
Elysia chlorotica est un mollusque qui se nourrit d'algues....et qui a intégré les chloroplastes de ces algues nourricières, dans les cellules de son tractus digestif.
Il manque cependant un certain nombre de gènes aux chloroplastes pour que la photosynthèse puisse avoir lieu: ces gènes se trouvent dans le génome nucléaire des algues.
Et bien, le mollusque a également 'volé' et intégré dans son génome nucléaire ces gènes essentiels (dont le gène psbO).
Ce mollusque peut ainsi utiliser l'énergie solaire ! (New scientist, PNAS)
* psbO 'volé' par Elysia.
* psbO de l'algue Vaucheria litorea).
Comparer (aligner) ces 2 protéines
Références
* The sequence of the human genome, Science (2001), 291(5507):1304-1351
(consortium privé; Celera, séquence du génome de Craig Venter)
* Initial sequencing and analysis of the human genome, Nature (2001), 409(6822):860-921.
(consortium publique; génome humain de 'reference' provenant de 15 individus anonymes)
* Spotlight: A virus for life
* LA RECHERCHE - l'origine virale du placenta
* Endogenous Retroviruses in Trophoblast Differentiation and Placental Development
* Plagiarized bacterial genes in the human book of life
* 'Horizontal gene transfer between bacteria and animals'
* 'Les anges gardiens de la stabilité du génome'
* Les analyses phylogénétiques sont faites en comparant les séquences en acides aminés d'une même protéine chez différentes espèces.
Quelques exemples d'arbres phylogénétiques avec Philophylo.
* Un tour guidé en bioinformatique.