You are here: Home  >  Education  >  Ateliers de bioinformatique

Atelier 7 - L'insuline de A à Z - Mieux comprendre une maladie génétique grâce à la bioinformatique

(English version)


Mise à jour: septembre 2022

Contexte biologique


L'insuline est une
protéine qui permet au sucre (glucose) de pénétrer dans les cellules des tissus, principalement le tissus adipeux, les muscles et le foie.

Il s'agit d'une hormone qui joue un rôle clé dans la régulation du taux de glucose dans le sang (effet 'hypoglycémiant').
Elle est fabriquée par des cellules spécialisées du pancréas appelées cellules bêta des îlots de Langerhans.
Le diabète de type I (insulino dépendant) est une maladie qui est due le plus souvent à l'absence d'insuline: pour différentes raisons encore mal comprises (virus, auto-immunité, etc.), les cellules du pancréas ne sont plus capables de produire cette protéine.
Le diabète de type II (non insulino dépendant) est la conséquence d'une résistance à l'insuline: pour une même quantité d'insuline, il y a moins de glucose qui entre dans les cellules.
La résistance à l'insuline est favorisée par la sédentarité et l'obésité.

Les causes génétiques du  diabète de  type I et du diabète  de type II ne sont pas encore bien connues. Il s'agit de  maladies dites 'multigéniques':  de nombreux gènes sont concernés (probablement une centaine).

Objectif

Cet atelier, composé de 6 activités, permet de découvrir comment la bioinformatique peut aider à mieux comprendre les causes d'une maladie génétique rare... et à étudier l'insuline de A à Z.


Activité 1: sur quel chromosome se trouve le gène de l'insuline ?

Voici un morceau de la séquence ADN du gène qui code pour l'insuline (séquence 'normale')...
  
     cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc

Question:


(1) Approche bioinformatique: Utiliser l'outil 'BLAT' (UCSC)

Info technique: 'BLAT' est un outil bioinformatique qui permet de comparer une séquence ADN avec la séquence entière d'un génome (soit un texte de 3 milliards de nucléotides pour le génome humain) et de retrouver, si elle existe, celle qui lui ressemble le plus, en quelques secondes. C'est un peu le 'google map' du génome humain

* Copier/coller la séquence ADN dans l'outil 'BLAT'
* Cliquer sur 'submit'
* Page 'BLAT Search Result': Choisir le meilleur score et cliquer sur 'browser'


Pour les experts: voici la séquence ADN du gène de l'insuline avec, en rouge, les séquences des 2 exons (présents dans l'ARN messager) qui seront traduites en acides aminés:

Activité 2: Comparer des séquences ADN et répertorier les mutations

Environ 1 nucléotide sur 1000 diffère d'une personne à l'autre, d'un génome à l'autre. Ces différences sont appelées variations ou mutations. Certaines n'ont aucune conséquence, d'autre sont associées avec des maladies génétiques. Les variations qui sont associées avec des maladies génétiques modifient le plus souvent la séquence d'une protéine: cette dernière est alors dysfonctionelle (C'est quoi une mutation?).

En 2008, des chercheurs ont étudié une famille norvégienne dont plusieurs membres sont diabétiques (type I et type II).
Toutes les personnes avec un  diabète de type I de cette famille sont porteuses de la même variation (rs121908261) dans le gène qui code pour l'insuline (Molven et al., 2008)
(C'est quoi une mutation?). Cette mutation n'a été retrouvée que dans une seule autre famille 2 ans plus tard (Meur et al., 2010).

Voici le pédigré de la famille (phénotype et liens de parenté):

 

Question:


Afin de répondre à cette question, les chercheurs ont extrait l'ADN de 8 des membres de cette famille et ont séquencé une partie du gène qui code pour l'insuline.
>1
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacctgccgggaggcagaggacc
>2
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>3
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacctgccgggaggcagaggacc
>4
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>5
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>6
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>7
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggagaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>8
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc


Comparer les 8 séquences et localiser la variation dans le gène de l'insuline qui est commune aux personnes diabétiques

Approche papier crayon:
...bandelettes de papier avec les séquences ADN à analyser manuellement afin de bien comprendre le principe de la comparaison de séquence et de l'alignement:


Approche bioinformatique:
Construire un alignement des 8 séquences à l'aide d'un outil bioinformatique et identifier la variation commune aux personnes diabétiques de type I

* Copier/Coller les 8 séquences (inclue la ligne '>1') dans l'outil d'alignement
* Sélectionner 'ADN' et cliquer sur 'Submit'
* Sur la page des résultats, la présence d'un * signifie que toutes les lettres de la colonne sont identiques. L'absence de *, signifie que une ou plusieurs lettres sont différentes.

Activité 3: Traduction ADN -> protéine et voir l'impact d'une mutation

Effet de la mutation sur la séquence de la protéine

L'insuline, comme toutes les protéines, est composée d'une succession d'acides aminés. L'ordre des acides aminés est déterminé par la séquence en acides nucléiques du gène de l'insuline: 3 'lettres ADN' correspondent à un acide aminé (symbolisé par les lettres: K pour lysine, M pour méthionine, etc.)

Voici un morceau de la séquence ADN du gène de l'insuline 'normale'.
aag acc cgc cgg gag 
Voici un morceau de la séquence ADN du gène de l'insuline avec la variation c -> t, associée avec un diabète.
aag acc tgc cgg gag 

Question:


Vous pourriez traduire manuellement les séquences en acide nucléique en séquence en acide aminé (code '1 lettre') en utilisant le code génétique ci-dessous:
 

Vous pouvez utiliser l'outil bioinformatique 'Translate'

Réponse: La mutation c -> t dans le gène de l'insuline conduit au remplacement de l'acide aminé R (arginine; codon cgc) par l'acide aminé C (cystéine; codon cgt) en position 55 de la séquence de la protéine: ce changement empêche la protéine insuline d'être 'coupée', un processus qui est essentiel pour que l'insuline puisse être fonctionnelle (Molven et al., 2008).

 

Informations médicales sur la famille
Le sujet (1) avec la mutation appelée R55C (hétérozygote) a présenté un diabète de type I à l'âge de 10 ans. Elle avait un taux de glucose dans le sang de 17.6 mmol/l.
Sa maman (3) a développé un diabète de type I à l'âge de 13 ans. Elle est sous traitement d'insuline (...).  Elle est aussi hétérozygote pour la mutation.
Le grand-père maternel (6) a été diagnostiqué diabétique de type II à l'âge de 40 ans. Il est traité à l'insuline (...). Ni lui ni sa femme (en bonne santé) ne sont porteurs de la mutation, ce qui suggère qu'il s'agit d'une mutation de novo qui pourraient avoir eu lieu par exemple dans les cellules germinales d'un des 2 grands-parents (...).
Les patients (1) et (3) porteurs de la mutation ont des taux de C-peptide quasi normaux, ce qui suggère qu'ils sont quand même capables de fabriquer de l'insuline. Les scientifiques ne comprennent pas pourquoi les patients (1) et (3) ont besoin de s'injecter de l'insuline à des doses aussi élevées (...) (Molven et al., 2008).
Pour les experts:
Il existe de nombreuses mutations (vairants) connues dans la séquence de la protéine insuline, certaines d'entre elles peuvent être responsables de différentes maladies génétiques:
https://www.uniprot.org/uniprotkb/P01308/entry#disease_variants

Activité 4: Visualiser la structure 3D de l'insuline

4. 1 Une séquence en acide aminé vue autrement...

Utiliser l'outil "Pepdraw" , un outil qui permet de 'visualiser'  la structure atomique d'une séquence d'acides aminés: http://pepdraw.com/:
comparer la séquence en acide aminé 'normale' (TPKTRREAED) avec la séquence en acide aminé 'mutée'(TPKTCREAED)

4.2 Structure 3D de l'insuline

La séquence d'une protéine détermine sa forme (structure 3D) - et sa fonction.
Les chercheurs sont capables (depuis 1958) de cristalliser des protéines et de les 'prendre en photo' à l'aide des rayons X.
Les résultats de ces expériences sont ensuite analysés grâce à des programmes bioinformatiques: on peut ainsi visualiser la structure des protéines... et de l'insuline
(C'est quoi la modélisation moléculaire?)

Visualiser la structure 3D de l'insuline  (PDB 2HIU)
* Sélectionner 3D view Structure à gauche de la page
* Dans la colonne de droite: 'Polymer'.Cliquer sur ... : clicker sur 'Add representation' : choisir  'cartoon' ou 'ball & stick' ou 'molecular surface'
* Dans 'Type properties' choisir ce que vous souhaitez colorer de différentes couleurs
               
   Vue 'Cartoon' (seul le 'backbone' des chaînes A (vert) et B (orange) est visible)                     Vue 'Ball & stick' (les atomes de chaque acide aminé sont visibles); chaque acide aminé a une couleur différente
 
 
Pour le fun, voici les données expérimentales brutes - les coordonnées spatiales (X, Y, Z) de chaque atome de chaque acide aminé de l'insuline ! (chercher 'ATOM' dans la page)

Remarque:  Il n'existe pas de données de structure 3D pour l'insuline avec la mutation R55C. Nous ne savons pas si il est possible de produire l'insuline avec la  mutation R55C en quantité suffisante pour pouvoir étudier sa structure 3D.


Voici une belle galerie de photos, pour se faire une idée de la taille relative et des formes de différentes protéines (agrandies x 3'000'000) (pdf (5Mb)).
Retrouver l'insuline parmi les différentes protéines et comparer sa taille avec celle des autres protéines.

Activité 5: L'insuline est-elle spécifique à l'être humain ?

5.1 BLAST


Voici la séquence complète en acide aminé de l'insuline humaine (UniProtKB/Swiss-Prot: P01308):
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN

Question:


Approche bioinformatique:
Faire un 'BLAST' contre une banque de données de protéines appelée UniProtKB


Info technique: BLAST est un outil bioinformatique qui permet de comparer la séquence d'une protéine avec des millions d'autres séquences contenues dans les banques de données et de retrouver, si elles existent, celles qui lui ressemblent le plus, en quelques secondes. On peut ainsi rapidement savoir si une protéine existe dans une espèce donnée.

* Copier/coller la séquence dans l'outil 'BLAST' 
* Sélectionner 'Target Database = UniProtKB/Swiss-Prot'
* Cliquer sur le bouton 'Run BLAST'
* Rechercher les images correspondant au nom latin des différentes espèces sur Google (exemple 'Octodon degus')

L'insuline est une très vieille protéine dont l'origine pourrait remonter à plus de 1 milliard d'années.
Elle est présente chez les animaux, mais on retrouve aussi des protéines insulin-like chez les champignons et les protistes (wikipedia)


5.2 Alignement multiple


Voici une liste de protéines insuline de différentes espèces (dans la banque de données UniProtKB/Swiss-Prot)
* Sélectionner les espèces de votre choix (mammifères, poissons, oiseaux; inclure l'insuline humaine)
* Construire un alignement multiple (Align)
* Dans la page des résultats: 'Highlight Annotation' 'Disulfide bond' et 'Natural Variant':
    - noter la conservation des cystéines impliquées dans les ponts disulfures.
    - noter la conservation de l'acide aminé R55.
    - noter que les régions les plus conservées correspondent aux chaînes A et B de l'insuline 'coupée'

5.3 Introduction à la phylogénie

Vous pouvez également comparer les séquences d'insuline de différentes espèces et esquisser un arbre phylogénétique avec PhiloPhylo

Pour aller plus loin: Atelier 3 - Phylogénie, biodiversité et pizza

Activité 6: www.chromosomewalk.ch

 
www.chromosomewalk.ch est une exposition virtuelle pour (re)découvrir le monde des gènes, des protéines et de la bioinformatique....

Depuis la liste des chromosomes humains: rechercher 'insuline'

Vérifiez que vous êtes de vrais experts : quiz expert !



Pour nous contacter...