Des génomes, des protéines et l'évolution
Remarques importantes:
- les sets de protéines proposés peuvent contenir des protéines qui portent un nom semblable, mais qui ne sont pas forcément des orthologues.
Ces sets sont une base pour vous aider à sélectionner des séquences qui vous intéressent.
- ce n'est pas parce qu'une protéine n'est pas dans un set donné (dans la banque de données) qu'elle n'existe pas chez l'espèce en question
(sauf chez les espèces pour lesquelles UniProtKB contient un set complet des protéines ('complete proteome': homme, levure, etc...)
Nom de la protéine: actin, cytoplasmic 1
Nom du gène: ACTB
Function: Protéine du cytosquelette
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (inclue la séquence): humain
Remarque: Multigene family...
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Aldehyde dehydrogenase, mitochondrial (ALDH2)
Nom du gène: ALDH2
Function: Protéine impliquée dans le métabolisme de l'alcool entre autre;
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (avec la séquence): humain
Remarque: Une mutation G -> A (E -K en position 504 de la protéine) résulte en une diminution drastique de l'activité de l'enzyme et donc à une sensibilité accrue à l'alcool.
Répartition de l'allèle dans la population: (clicker sur 'google map')
Info supplémentaire: Bio-Tremplins, Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Alpha-amylase
Nom du gène: AMY1
Function: Protéine impliquée dans le métabolisme des sucres (digestion de l'amidon);
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (avec la séquence): humain
Remarque: ...
Info supplémentaire: Spotlight
Set de séquences (UniProtKB !!! le set contient des protéines appelées aussi AMY-1, mais qui ne sont pas des enzymes amylase !!!) Set de séquences (fasta)
Nom de la protéine: ATP synthase subunit alpha
Nom du gène: ATPA
Function: Protéine appartenant à un complexe impliqué dans la production d'énergie (chaîne respiratoire);
Localisation chromosomique: humain, chimpanzé, pas disponible chez la souris
Info UniProt (avec la séquence): humain
Remarque: protéine universelle
Info supplémentaire: ....
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Collagène
Nom du gène: COL1A1
Function: Appartient à une famille de protéine présente dans la peau et les os;
Localisation chromosomique: humain, chimpanzé, souris, rat
Info UniProt (avec la séquence): humain
Remarque: on a pu séquencer des fragments de collagène du tyranosaure et du mammouth.
Info supplémentaire: Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Cytochrome B
Nom du gène: MT_CYB (gène mitochondrial)
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: ADN mitochondrial
Info UniProt (avec la séquence): humain
Remarque: gène 'universel'. Existe pour le mammouth et le dodo.
Info supplémentaire: L'ADN des mitochondries est plus 'solide' que l'ADN nucléaire. On a pu retrouvé cet ADN (et le séquencer) sur des restes d'animaux disparus.
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Cytochrome C
Nom du gène: cyc1 ou cyt1 selon les espèces
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (avec la séquence): humain
Remarque: gène 'universel' ayant peu évolué. Utile pour classer des espèces très 'éloignées' du point de vue évolutif.
Différents noms: plus approprié de rechercher les séquences homologues par Blast
Info supplémentaire: Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Erythropoietin
Nom du gène: EPO
Function: Régule la différenciation des érythrocytes
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (avec la séquence): humain
Remarque: bon modèle pour étudier l'évolution des mammifères
Info supplémentaire: Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Facteur d'élongation
Nom du gène: EF1A ou EFTU
Function: impliqué dans la synthèse des protéines
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain
Remarque: protéine universelle; permet d'illustrer l'endosymbiose (pour le chloroplaste et la mitochondrie)
Info supplémentaire: ...
Set de séquences (fasta)
Nom de la protéine: N-formyl peptide receptor
Nom du gène: FPR
Function: récepteur aux agents chemotactiques
Localisation chromosomique: humain, chimpanzé, mouse
Info UniProt (avec la séquence): humain
Remarque: en rapport avec l'exposé de Ivan Rodriguez
Info supplémentaire: Bio-Tremplins
Set de séquences (UniProtKB !!! des protéines avec une toute autre fonction ont le même nom !!!!) Set de séquences (fasta)
Nom de la protéine: L-gulonolactone oxidase
Nom du gène: GULO
Function: Protéine impliquée dans la fabrication de la vitamine C;
Localisation chromosomique: humain (pseudogène), souris, rat
Info UniProt (avec la séquence): mouse
Remarque: gène pas actif chez les primates (pseudogène: le gène existe, mais il n'est pas traduit en protéine)
Info supplémentaire: Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Histone H4
Nom du gène: HIST1H4A
Function: Protéine 'bobine' autour de laquelle s'enroule l'ADN;
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: gène dont la séquence est très conservée au cours de l'évolution. La protéine contient beaucoup d'acides aminés chargés positivement qui sont
essentielles pour interagir avec l'ADN chargé négativement (groupe phosphate)
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Hormone de croissance Somatotropin (Growth hormone)
Nom du gène: GH
Function: Hormone essentielle pour la croissance;
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: gène dupliqué chez certaines espèces
Info supplémentaire: Prolune (autre protéine importante pour la croissance: IGF1)
Set de séquences (UniProtKB !! contient des séquences qui ne sont pas des hormones de croissance (glycoprotein H)) Set de séquences (fasta)
Nom de la protéine: Homeobox protein Hox-B4
Nom du gène: HOXB4
Function: Appartient à une famille de protéines impliquée dans la régulation du développement de l'embryon (vertébrés); HOXA1 -> HOXA13 et HOXB1 -> HOXB10;
Localisation chromosomique: humain, souris, chimpanzé
Info UniProt (avec la séquence): humain
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Insulin
Nom du gène: INS
Function: Régule le taux de sucre dans le sang
Localisation chromosomique: humain, chimpanzé, souris (INS1) et souris (INS2) (duplication du gène chez la souris)
Info UniProt (avec la séquence): humain
Remarque: bon modèle pour étudier l'évolution des mammifères, duplication de gènes chez la souris et le rat
Info supplémentaire: Set de séquences (UniProtKB !! attention de bien sélectionner les séquences othologues) Set de séquences (fasta)
Nom de la protéine: alpha-lactalbumin
Nom du gène: LALBA
Function: Biosynthèse du lactose;
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain
Remarque: mammifères seulement; la structure 3D de cette protéine est connue chez certaines espèces
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Melanotropin receptor
Nom du gène: MC1R
Function: Des variations dans la séquence de cette protéine sont liées à différentes pigmentations de la peau;
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain
Remarque: distribution taxonomique
Info supplémentaire: Bio-Tremplins
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Rhodopsin
Nom du gène: RHO
Function: L'une des protéines photoréceptrices (vision avec de la lumière de faible intensité);
Localisation chromosomique: humain.
Info UniProt (avec la séquence): humain
Remarque: distribution taxonomique ...
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Red-sensitive opsin
Nom du gène: OPN1LW
Function: L'une des protéines photoréceptrices (vision du rouge);
Localisation chromosomique: humain, chimpanzé, mouse.
Info UniProt (avec la séquence): humain
Remarque:...
Info supplémentaire: l'un des gène associé avec le daltonisme ...(voir scénario 3)
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Cellular tumor antigen p53
Nom du gène: TP53
Function: Protéine impliquée dans la régulation du cycle cellulaire et de l'apoptose
Localisation chromosomique: humain, chimpanzé, mouse
Info UniProt (avec la séquence): humain
Remarque: La protéine humaine a accumulé beaucoup de variations, dont la majorité sont associées avec le cancer.
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Photosystem I P700 chlorophyll a apoprotein A1
Nom du gène: PSAA
Function: Protéine du photosystème
Localisation chromosomique: ADN chloroplaste
Info UniProt (avec la séquence): épinard
Remarque: Présent chez les plantes et les bactéries photosynthétiques.
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Récepteur à la dopamine
Nom du gène: DRD2
Function: Récepteur à la dopamine (il en existe plusieurs)
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human
Remarque: ....
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Récepteur à la FSH
Nom du gène: FSHR
Function: Récepteur à la FSH (Follicle-stimulating hormone)
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human
Remarque: sur le chromosome 2 (intéressant de comparer la localistion chromosomique de l'homme et du chimpanzé).
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Récepteur aux glucocorticoïdes
Nom du gène: NR3C1
Function: Récepteur aux glucocorticoïdes
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human
Remarque: ....
Info supplémentaire: ...
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Rubisco
Nom du gène: rbcl
Function: Impliquée dans la photosynthèse
Localisation chromosomique: ADN chloroplaste
Info UniProt (avec la séquence): épinard
Remarque: Présent chez les plantes et les bactéries photosynthétiques.
Info supplémentaire: protéine plutôt conservée au cours de l'évolution.
Set de séquences ((UniProtKB) seulement les plantes: viridiplantae) Set de séquences (fasta)
Nom de la protéine: Sous-unité alpha type 9 du canal de sodium
Nom du gène: SCN9A
Function: Protéine impliquée dans la perception de la douleur
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: Des variations dans la séquence de cette protéine sont associées avec la perte de sensibilité à la douleur (info en anglais)
Info supplémentaire: Prolune
Set de séquences ((UniProtKB) n=4) Set de séquences (fasta)
Nom de la protéine: Taste receptor type 1 member 2
Nom du gène: T1R2
Function: Protéine impliquée dans la perception du goût sucré
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: Pour être fonctionnelle,cette protéine 'travailler' en tandem avec T1R3.
Info supplémentaire: Prolune
Set de séquences (UniProtKB) Set de séquences (fasta)
Nom de la protéine: Type 1 vomeronasal receptor 1
Nom du gène: VN1R1
Function: Récepteur aux phéromones;
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs
centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes).
Info supplémentaire: Prolune
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB)
Nom de la protéine: Type 1 vomeronasal receptor 5
Nom du gène: VN1R5
Function: Récepteur aux phéromones;
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain
Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs
centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes).
Info supplémentaire: Bio-Tremplins
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB)
Nom de la protéine: Vasopressin V1a receptor
Nom du gène: AVPR1
Function: Récepteur de la vasopressine; joue un rôle dans la sociabilisation;
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain
Remarque:...
Info supplémentaire: Prolune
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB)
Remarques
- Beaucoup d'analyses phylogénétiques ont été faites sur la base de la comparaison de l'ARN ribosomal (12S et 16S). Ces analyses ne sont pas faciles à reproduire,
car les séquences sont très 'redondantes': il est donc difficile d'avoir un set propre de ces séquences en acides nucléiques utilisables pour construire un arbre.
- Des protéines qui appartiennent à de grandes familles multigéniques (comme les Kératines) sont difficiles à utiliser pour les analyses phylogénétiques.
Liens
- Liste de gènes et discussions sur leur évolution (M.Milinkovitch): Publication
- Liste de protéines orthologues (et distribution dans différents groupes (Archaea, Bacteria, Eukaryota, Mitochondria))