You are here: Home  >  Education  >  Ateliers de bioinformatique

Des génomes, des protéines et l'évolution

 Remarques importantes: 
 - les sets de protéines proposés peuvent contenir des protéines qui portent un nom semblable, mais qui ne sont pas forcément des orthologues.
   Ces sets sont une base pour vous aider à sélectionner des séquences qui vous intéressent.
 - ce n'est pas parce qu'une protéine n'est pas dans un set donné (dans la banque de données) qu'elle n'existe pas chez l'espèce en question 
   (sauf chez les espèces pour lesquelles UniProtKB contient un set complet des protéines ('complete proteome': homme, levure, etc...) 

Nom de la protéine: actin, cytoplasmic 1
Nom du gène: ACTB
Function: Protéine du cytosquelette
Localisation chromosomique: humain, chimpanzé, souris
Info UniProt (inclue la séquence): humain 
Remarque: Multigene family...
Info supplémentaire: ...
Set de séquences (UniProtKB)     Set de séquences (fasta)

Nom de la protéine: Aldehyde dehydrogenase, mitochondrial (ALDH2) 
Nom du gène: ALDH2
Function: Protéine impliquée dans le métabolisme de l'alcool entre autre; 
Localisation chromosomique: humain, chimpanzé, souris 
Info UniProt (avec la séquence): humain 
Remarque: Une mutation G -> A (E -K en position 504 de la protéine) résulte en une diminution drastique de l'activité de l'enzyme et donc à une sensibilité accrue à l'alcool.
          Répartition de l'allèle dans la population: (clicker sur 'google map') 
Info supplémentaire: Bio-Tremplins, Prolune
Set de séquences  (UniProtKB)		Set de séquences  (fasta)

Nom de la protéine: Alpha-amylase 
Nom du gène: AMY1
Function: Protéine impliquée dans le métabolisme des sucres (digestion de l'amidon); 
Localisation chromosomique: humain, chimpanzé, souris 
Info UniProt (avec la séquence): humain 
Remarque: ...
Info supplémentaire: Spotlight 
Set de séquences  (UniProtKB !!! le set contient des protéines appelées aussi AMY-1, mais qui ne sont pas des enzymes amylase !!!)	Set de séquences (fasta)

Nom de la protéine: ATP synthase subunit alpha 
Nom du gène: ATPA
Function: Protéine appartenant à un complexe impliqué dans la production d'énergie (chaîne respiratoire); 
Localisation chromosomique: humain, chimpanzé, pas disponible chez la souris
Info UniProt (avec la séquence): humain 
Remarque: protéine universelle
Info supplémentaire: ....
Set de séquences  (UniProtKB)		Set de séquences  (fasta)

Nom de la protéine: Collagène
Nom du gène: COL1A1
Function: Appartient à une famille de protéine présente dans la peau et les os; 
Localisation chromosomique: humain, chimpanzé, souris, rat            
Info UniProt (avec la séquence): humain 
Remarque: on a pu séquencer des fragments de collagène du tyranosaure et du mammouth.
Info supplémentaire: Prolune
Set de séquences (UniProtKB)		Set de séquences (fasta)

Nom de la protéine: Cytochrome B
Nom du gène: MT_CYB (gène mitochondrial)
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: ADN mitochondrial                
Info UniProt (avec la séquence): humain 
Remarque: gène 'universel'. Existe pour le mammouth et le dodo.
Info supplémentaire: L'ADN des mitochondries est plus 'solide' que l'ADN nucléaire. On a pu retrouvé cet ADN (et le séquencer) sur des restes d'animaux disparus.
Set de séquences  (UniProtKB)	Set de séquences (fasta)	

Nom de la protéine: Cytochrome C
Nom du gène: cyc1 ou cyt1 selon les espèces 
Function: Protéine de la chaîne respiratoire
Localisation chromosomique: humain,  chimpanzé, souris           
Info UniProt (avec la séquence): humain               
Remarque: gène 'universel' ayant peu évolué. Utile pour classer des espèces très 'éloignées' du point de vue évolutif. 
          Différents noms: plus approprié de rechercher les séquences homologues par Blast 
Info supplémentaire: Prolune
Set de séquences  (UniProtKB)   Set de séquences (fasta)

Nom de la protéine: Erythropoietin
Nom du gène:  EPO
Function: Régule la différenciation des érythrocytes
Localisation chromosomique: humain,  chimpanzé,  souris         
Info UniProt (avec la séquence): humain 
Remarque: bon modèle pour étudier l'évolution des mammifères
Info supplémentaire: Prolune 
Set de séquences (UniProtKB)	Set de séquences (fasta)

Nom de la protéine: Facteur d'élongation
Nom du gène:  EF1A ou EFTU
Function: impliqué dans la synthèse des protéines
Localisation chromosomique: humain, chimpanzé
Info UniProt (avec la séquence): humain 
Remarque: protéine universelle; permet d'illustrer l'endosymbiose (pour le chloroplaste et la mitochondrie)
Info supplémentaire: ...
Set de séquences  (fasta)	
Nom de la protéine: N-formyl peptide receptor Nom du gène: FPR Function: récepteur aux agents chemotactiques Localisation chromosomique: humain, chimpanzé, mouse Info UniProt (avec la séquence): humain Remarque: en rapport avec l'exposé de Ivan Rodriguez Info supplémentaire: Bio-Tremplins Set de séquences (UniProtKB !!! des protéines avec une toute autre fonction ont le même nom !!!!) Set de séquences (fasta) Nom de la protéine: L-gulonolactone oxidase Nom du gène: GULO Function: Protéine impliquée dans la fabrication de la vitamine C; Localisation chromosomique: humain (pseudogène), souris, rat Info UniProt (avec la séquence): mouse Remarque: gène pas actif chez les primates (pseudogène: le gène existe, mais il n'est pas traduit en protéine) Info supplémentaire: Prolune Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Histone H4 Nom du gène: HIST1H4A Function: Protéine 'bobine' autour de laquelle s'enroule l'ADN; Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: gène dont la séquence est très conservée au cours de l'évolution. La protéine contient beaucoup d'acides aminés chargés positivement qui sont essentielles pour interagir avec l'ADN chargé négativement (groupe phosphate) Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Hormone de croissance Somatotropin (Growth hormone) Nom du gène: GH Function: Hormone essentielle pour la croissance; Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: gène dupliqué chez certaines espèces Info supplémentaire: Prolune (autre protéine importante pour la croissance: IGF1) Set de séquences (UniProtKB !! contient des séquences qui ne sont pas des hormones de croissance (glycoprotein H)) Set de séquences (fasta) Nom de la protéine: Homeobox protein Hox-B4 Nom du gène: HOXB4 Function: Appartient à une famille de protéines impliquée dans la régulation du développement de l'embryon (vertébrés); HOXA1 -> HOXA13 et HOXB1 -> HOXB10; Localisation chromosomique: humain, souris, chimpanzé Info UniProt (avec la séquence): humain Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Insulin Nom du gène: INS Function: Régule le taux de sucre dans le sang Localisation chromosomique: humain, chimpanzé, souris (INS1) et souris (INS2) (duplication du gène chez la souris) Info UniProt (avec la séquence): humain Remarque: bon modèle pour étudier l'évolution des mammifères, duplication de gènes chez la souris et le rat Info supplémentaire: Set de séquences (UniProtKB !! attention de bien sélectionner les séquences othologues) Set de séquences (fasta) Nom de la protéine: alpha-lactalbumin Nom du gène: LALBA Function: Biosynthèse du lactose; Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): humain Remarque: mammifères seulement; la structure 3D de cette protéine est connue chez certaines espèces Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Melanotropin receptor Nom du gène: MC1R Function: Des variations dans la séquence de cette protéine sont liées à différentes pigmentations de la peau; Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): humain Remarque: distribution taxonomique Info supplémentaire: Bio-Tremplins Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Rhodopsin Nom du gène: RHO Function: L'une des protéines photoréceptrices (vision avec de la lumière de faible intensité); Localisation chromosomique: humain. Info UniProt (avec la séquence): humain Remarque: distribution taxonomique ... Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Red-sensitive opsin Nom du gène: OPN1LW Function: L'une des protéines photoréceptrices (vision du rouge); Localisation chromosomique: humain, chimpanzé, mouse. Info UniProt (avec la séquence): humain Remarque:... Info supplémentaire: l'un des gène associé avec le daltonisme ...(voir scénario 3) Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Cellular tumor antigen p53 Nom du gène: TP53 Function: Protéine impliquée dans la régulation du cycle cellulaire et de l'apoptose Localisation chromosomique: humain, chimpanzé, mouse Info UniProt (avec la séquence): humain Remarque: La protéine humaine a accumulé beaucoup de variations, dont la majorité sont associées avec le cancer. Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Photosystem I P700 chlorophyll a apoprotein A1 Nom du gène: PSAA Function: Protéine du photosystème Localisation chromosomique: ADN chloroplaste Info UniProt (avec la séquence): épinard Remarque: Présent chez les plantes et les bactéries photosynthétiques. Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Récepteur à la dopamine Nom du gène: DRD2 Function: Récepteur à la dopamine (il en existe plusieurs) Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): human Remarque: .... Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Récepteur à la FSH Nom du gène: FSHR Function: Récepteur à la FSH (Follicle-stimulating hormone) Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): human Remarque: sur le chromosome 2 (intéressant de comparer la localistion chromosomique de l'homme et du chimpanzé). Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Récepteur aux glucocorticoïdes Nom du gène: NR3C1 Function: Récepteur aux glucocorticoïdes Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): human Remarque: .... Info supplémentaire: ... Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Rubisco Nom du gène: rbcl Function: Impliquée dans la photosynthèse Localisation chromosomique: ADN chloroplaste Info UniProt (avec la séquence): épinard Remarque: Présent chez les plantes et les bactéries photosynthétiques. Info supplémentaire: protéine plutôt conservée au cours de l'évolution. Set de séquences ((UniProtKB) seulement les plantes: viridiplantae) Set de séquences (fasta) Nom de la protéine: Sous-unité alpha type 9 du canal de sodium Nom du gène: SCN9A Function: Protéine impliquée dans la perception de la douleur Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: Des variations dans la séquence de cette protéine sont associées avec la perte de sensibilité à la douleur (info en anglais) Info supplémentaire: Prolune Set de séquences ((UniProtKB) n=4) Set de séquences (fasta) Nom de la protéine: Taste receptor type 1 member 2 Nom du gène: T1R2 Function: Protéine impliquée dans la perception du goût sucré Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: Pour être fonctionnelle,cette protéine 'travailler' en tandem avec T1R3. Info supplémentaire: Prolune Set de séquences (UniProtKB) Set de séquences (fasta) Nom de la protéine: Type 1 vomeronasal receptor 1 Nom du gène: VN1R1 Function: Récepteur aux phéromones; Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes). Info supplémentaire: Prolune Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB) Nom de la protéine: Type 1 vomeronasal receptor 5 Nom du gène: VN1R5 Function: Récepteur aux phéromones; Localisation chromosomique: humain Info UniProt (avec la séquence): humain Remarque: Cette protéine appartient à une famille de protéines qui a évolué de façon très différentes chez les rongeurs et les humains: les rongeurs ont plusieurs centaines de récepteurs, alors que chez les humains, on peine à en trouver: la majorité sont devenus des gènes inactifs (pseudogènes). Info supplémentaire: Bio-Tremplins Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB) Nom de la protéine: Vasopressin V1a receptor Nom du gène: AVPR1 Function: Récepteur de la vasopressine; joue un rôle dans la sociabilisation; Localisation chromosomique: humain, chimpanzé Info UniProt (avec la séquence): humain Remarque:... Info supplémentaire: Prolune Set de séquences: seulement 2 séquences (homme et chimpanzé) sont disponibles pour le moment (UniProtKB) Remarques - Beaucoup d'analyses phylogénétiques ont été faites sur la base de la comparaison de l'ARN ribosomal (12S et 16S). Ces analyses ne sont pas faciles à reproduire, car les séquences sont très 'redondantes': il est donc difficile d'avoir un set propre de ces séquences en acides nucléiques utilisables pour construire un arbre. - Des protéines qui appartiennent à de grandes familles multigéniques (comme les Kératines) sont difficiles à utiliser pour les analyses phylogénétiques. Liens - Liste de gènes et discussions sur leur évolution (M.Milinkovitch): Publication - Liste de protéines orthologues (et distribution dans différents groupes (Archaea, Bacteria, Eukaryota, Mitochondria))