Des génomes, des protéines et l'évolution

 Remarques importantes: 
 - les sets de protéines proposés peuvent contenir des protéines qui portent un nom semblable, mais qui ne sont pas forcément des orthologues.
   Ces sets sont une base pour vous aider à sélectionner des séquences qui vous intéressent.
 - ce n'est pas parce qu'une protéine n'est pas dans un set donné (dans la banque de données) qu'elle n'existe pas chez l'espèce en question 
   (sauf chez les espèces pour lesquelles UniProtKB contient un set complet des protéines ('complete proteome': homme, levure, etc...) 

Nom de la protéine: Actin, cytoplasmic 1
Nom du gène: ACTB
Function: Protéine du cytosquelette
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (inclue la séquence): humain 
Remarque: Multigene family...
Info supplémentaire: ...
Set de séquences 

Nom de la protéine: Aldehyde dehydrogenase, mitochondrial (ALDH2) 
Nom du gène: ALDH2
Function: Protéine impliquée dans le métabolisme de l'alcool entre autre; 
Localisation chromosomique: humain, chimpanzé, souris 
Info UniProt (avec la séquence): humain 
Remarque: Une mutation G -> A (E -K en position 504 de la protéine) résulte en une diminution drastique de l'activité de l'enzyme et donc à une sensibilité accrue à l'alcool.
          Répartition de l'allèle dans la population: (clicker sur 'google map') 
Info supplémentaire: Bio-Tremplins, Prolune
Set de séquences  

Nom de la protéine: Alpha-amylase 
Nom du gène: AMY1
Function: Protéine impliquée dans le métabolisme des sucres (digestion de l'amidon); 
Localisation chromosomique: humain, chimpanzé, souris 
Info UniProt (avec la séquence): humain 
Remarque: ...
Info supplémentaire: Spotlight 
Set de séquences  !!! le set contient des protéines appelées aussi AMY-1, mais qui ne sont pas des enzymes amylase !!!

Nom de la protéine: ATP synthase subunit alpha 
Nom du gène: ATPA
Function: Protéine appartenant à un complexe impliqué dans la production d'énergie (chaîne respiratoire); 
Localisation chromosomique: humain, chimpanzé, pas disponible chez la souris
Info UniProt (avec la séquence): humain 
Remarque: protéine universelle
Info supplémentaire: ....
Set de séquences  

Nom de la protéine: Collagène
Nom du gène: COL1A1
Function: Appartient à une famille de protéine présente dans la peau et les os; 
Localisation chromosomique: humain, chimpanzé, souris, rat            
Info UniProt (avec la séquence): humain 
Remarque: on a pu séquencer des fragments de collagène du tyranosaure et du mammouth.
Info supplémentaire: Prolune
Set de séquences 

Nom de la protéine: Cytochrome B
Nom du gène: MT_CYB (gène mitochondrial)
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: ADN mitochondrial                
Info UniProt (avec la séquence): humain 
Remarque: gène 'universel'. Existe pour le mammouth et le dodo.
Info supplémentaire: L'ADN des mitochondries est plus 'solide' que l'ADN nucléaire. On a pu retrouvé cet ADN (et le séquencer) sur des restes d'animaux disparus.
Set de séquences  

Nom de la protéine: Cytochrome C
Nom du gène: cyc1 ou cyt1 selon les espèces 
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: humain,  chimpanzé, souris           
Info UniProt (avec la séquence): humain               
Remarque: gène 'universel' ayant peu évolué. Utile pour classer des espèces très 'éloignées' du point de vue évolutif. 
          Différents noms: plus approprié de rechercher les séquences homologues par Blast 
Info supplémentaire: Prolune, Example d'arbre avec explication  
Set de séquences    

Nom de la protéine: Erythropoietin
Nom du gène:  EPO
Function: Régule la différenciation des érythrocytes
Localisation chromosomique: humain,  chimpanzé,  souris         
Info UniProt (avec la séquence): humain 
Remarque: bon modèle pour étudier l'évolution des mammifères
Info supplémentaire: Prolune 
Set de séquences

Nom de la protéine: Facteur d'élongation
Nom du gène:  EF1A ou EFTU
Function: impliqué dans la synthèse des protéines
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain 
Remarque: protéine universelle; permet d'illustrer l'endosymbiose (pour le chloroplaste et la mitochondrie)
Info supplémentaire: ...
Set de séquences  

Nom de la protéine: N-formyl peptide receptor
Nom du gène: FPR
Function: récepteur aux agents chemotactiques
Localisation chromosomique: humain, chimpanzé, mouse    
Info UniProt (avec la séquence): humain 
Remarque: en rapport avec l'exposé de Ivan Rodriguez
Info supplémentaire: Bio-Tremplins
Set de séquences !!! des protéines avec une toute autre fonction ont le même nom !!!!  

Nom de la protéine: L-gulonolactone oxidase
Nom du gène: GULO
Function: Protéine impliquée dans la fabrication de la vitamine C; 
Localisation chromosomique: humain (pseudogène), souris, rat            
Info UniProt (avec la séquence): mouse 
Remarque: gène pas actif chez les primates (pseudogène: le gène existe, mais il n'est pas traduit en protéine)
Info supplémentaire: Prolune
Set de séquences

Nom de la protéine: Histone H4
Nom du gène: HIST1H4A
Function: Protéine 'bobine' autour de laquelle s'enroule l'ADN; 
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: gène dont la séquence est très conservée au cours de l'évolution. La protéine contient beaucoup d'acides aminés chargés positivement qui sont 
          essentielles pour interagir avec l'ADN chargé négativement (groupe phosphate)
Info supplémentaire: ...
Set de séquences  

Nom de la protéine: Hormone de croissance Somatotropin (Growth hormone) 
Nom du gène: GH
Function: Hormone essentielle pour la croissance; 
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: gène dupliqué chez certaines espèces
Info supplémentaire: Prolune (autre protéine importante pour la croissance: IGF1)
Set de séquences (!! contient des séquences qui ne sont pas des hormones de croissance (glycoprotein H))

Nom de la protéine:  Homeobox protein Hox-B4
Nom du gène: HOXB4
Function: Appartient à une famille de protéines impliquée dans la régulation du développement de l'embryon (vertébrés); HOXA1 -> HOXA13 et HOXB1 -> HOXB10; 
Localisation chromosomique: humain,  souris, chimpanzé            
Info UniProt (avec la séquence): humain 
Remarque: en rapport avec la présentation de M. Milinkovitch
Info supplémentaire: ....
Set de séquences  

Nom de la protéine: Insulin
Nom du gène:  INS
Function: Régule le taux de sucre dans le sang
Localisation chromosomique: humain, chimpanzé, souris (INS1) et souris (INS2) (duplication du gène chez la souris)       
Info UniProt (avec la séquence): humain 
Remarque: bon modèle pour étudier l'évolution des mammifères, duplication de gènes chez la souris et le rat
Info supplémentaire: Prolune 
Set de séquences (!! attention de bien sélectionner les séquences othologues) 

Nom de la protéine: alpha-lactalbumin 
Nom du gène: LALBA
Function: Biosynthèse du lactose; 
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain 
Remarque: mammifères seulement; la structure 3D de cette protéine est connue chez certaines espèces 
Info supplémentaire: présentation Milinkovitch
Set de séquences  

Nom de la protéine: Melanotropin receptor 
Nom du gène: MC1R
Function: Des variations dans la séquence de cette protéine sont liées à différentes pigmentations de la peau; 
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain 
Remarque: distribution taxonomique 
Info supplémentaire: Bio-Tremplins
Set de séquences 

Nom de la protéine: Rhodopsin 
Nom du gène: RHO
Function: L'une des protéines photoréceptrices (vision avec de la lumière de faible intensité); 
Localisation chromosomique: humain.
Info UniProt (avec la séquence): humain 
Remarque: distribution taxonomique ...
Info supplémentaire: ...
Set de séquences  
 
 Red-sensitive opsin 
Nom du gène: OPN1LW
Function: L'une des protéines photoréceptrices (vision du rouge); 
Localisation chromosomique: humain, chimpanzé, mouse.
Info UniProt (avec la séquence): humain 
Remarque:... 
Info supplémentaire: l'un des gène associé avec le daltonisme ...(voir scénario 3)
Set de séquences  
 
Nom de la protéine: Cellular tumor antigen p53 
Nom du gène: TP53
Function: Protéine impliquée dans la régulation du cycle cellulaire et de l'apoptose
Localisation chromosomique: humain, chimpanzé, mouse
Info UniProt (avec la séquence): humain 
Remarque: La protéine humaine a accumulé beaucoup de variations, dont la majorité sont associées avec le cancer.
Info supplémentaire: ...
Set de séquences 

Nom de la protéine: Photosystem I P700 chlorophyll a apoprotein A1
Nom du gène: PSAA
Function: Protéine du photosystème
Localisation chromosomique: ADN chloroplaste
Info UniProt (avec la séquence): épinard 
Remarque: Présent chez les plantes et les bactéries photosynthétiques.
Info supplémentaire: ...
Set de séquences

Nom de la protéine: Récepteur à la dopamine
Nom du gène: DRD2
Function: Récepteur à la dopamine (il en existe plusieurs)
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human 
Remarque: ....
Info supplémentaire: ...
Set de séquences

Nom de la protéine: Récepteur à la FSH
Nom du gène: FSHR
Function: Récepteur à la FSH (Follicle-stimulating hormone)
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human 
Remarque: sur le chromosome 2 (intéressant de comparer la localistion chromosomique de l'homme et du chimpanzé).
Info supplémentaire: ...
Set de séquences

Nom de la protéine: Récepteur aux glucocorticoïdes
Nom du gène: NR3C1
Function: Récepteur aux glucocorticoïdes
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): human 
Remarque: ....
Info supplémentaire: ...
Set de séquences

Nom de la protéine: Rubisco
Nom du gène: rbcl
Function: Impliquée dans la photosynthèse
Localisation chromosomique: ADN chloroplaste
Info UniProt (avec la séquence): épinard 
Remarque: Présent chez les plantes et les bactéries photosynthétiques.
Info supplémentaire: protéine plutôt conservée au cours de l'évolution.
Set de séquences (seulement les plantes: viridiplantae) 

Nom de la protéine: Sous-unité alpha type 9 du canal de sodium 
Nom du gène: SCN9A
Function: Protéine impliquée dans la perception de la douleur
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: Des variations dans la séquence de cette protéine sont associées avec la perte de sensibilité à la douleur (info en anglais) 
Info supplémentaire: Prolune
Set de séquences (n=4)  

Nom de la protéine: Taste receptor type 1 member 2
Nom du gène: T1R2
Function: Protéine impliquée dans la perception du goût sucré
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: Pour être fonctionnelle,cette protéine 'travailler' en tandem avec T1R3.
Info supplémentaire: Prolune
Set de séquences 

Nom de la protéine: Type 1 vomeronasal receptor 1 
Nom du gène: VN1R1
Function: Récepteur aux phéromones; 
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs 
          centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes). 
Info supplémentaire: Prolune
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment.

Nom de la protéine: Type 1 vomeronasal receptor 5 
Nom du gène: VN1R5
Function: Récepteur aux phéromones; 
Localisation chromosomique: humain
Info UniProt (avec la séquence): humain 
Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs 
          centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes). 
Info supplémentaire: Bio-Tremplins
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment.

Nom de la protéine: Vasopressin V1a receptor
Nom du gène: AVPR1
Function: Récepteur de la vasopressine; joue un rôle dans la sociabilisation; 
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain 
Remarque:...
Info supplémentaire: Prolune
Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment.  

    
Remarques
- Beaucoup d'analyses phylogénétiques ont été faites sur la base de la comparaison de l'ARN ribosomal (12S et 16S). Ces analyses ne sont pas faciles à reproduire, 
  car les séquences sont très 'redondantes': il est donc difficile d'avoir un set propre de ces séquences en acides nucléiques utilisables pour construire un arbre.
- Des protéines qui appartiennent à de grandes familles multigéniques (comme les Kératines) sont difficiles à utiliser pour les analyses phylogénétiques.

Liens
- Liste de gènes et discussions sur leur évolution (M.Milinkovitch): Publication
- Liste de protéines orthologues (et distribution dans différents groupes (Archaea, Bacteria, Eukaryota, Mitochondria))