Atelier 7 - L'insuline de A à Z - Mieux comprendre une maladie
génétique grâce à la bioinformatique
(English
version)
Mise
à jour: septembre 2022
Contexte
biologique
L'insuline
est une protéine
qui permet au sucre (glucose) de pénétrer dans les cellules
des tissus, principalement le tissus adipeux, les muscles et le foie.
Il s'agit d'une hormone
qui joue un rôle clé dans la régulation du taux de glucose dans le sang (effet 'hypoglycémiant'). Elle
est fabriquée par des cellules spécialisées du pancréas appelées
cellules bêta des
îlots de Langerhans.
Le diabète
de type I (insulino dépendant) est une maladie qui est due
le plus souvent à l'absence d'insuline: pour différentes raisons
encore mal comprises (virus, auto-immunité, etc.), les cellules du
pancréas ne sont plus capables de produire cette protéine.
Le diabète de type II (non
insulino dépendant) est la conséquence d'une résistance à
l'insuline: pour une même quantité d'insuline, il y a moins de
glucose qui entre dans les cellules. La
résistance à l'insuline est favorisée par la sédentarité et l'obésité.
Les causes génétiques du diabète de type I et du
diabète de type II ne sont pas encore bien connues. Il s'agit
de maladies dites 'multigéniques': de nombreux gènes
sont concernés (probablement une centaine).
Objectif
Cet
atelier, composé de 6 activités, permet de découvrir comment la
bioinformatique peut aider à mieux comprendre les causes d'une
maladie génétique rare... et à étudier l'insuline de A à Z.
Activité 1: sur quel chromosome se trouve le gène
de l'insuline ?
Voici un morceau de la séquence ADN du
gène
qui code pour l'insuline (séquence 'normale')...
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
Question:
- Sur lequel de nos 23 chromosomes est localisé ce gène ?
(1) Approche bioinformatique: Utiliser l'outil
'BLAT' (UCSC)
Info technique: 'BLAT' est un outil bioinformatique qui permet de
comparer une séquence ADN avec la séquence entière d'un génome
(soit un texte de 3 milliards de nucléotides pour le génome humain) et de
retrouver, si elle existe, celle qui lui ressemble le plus, en quelques
secondes. C'est un peu le 'google map' du génome humain
* Copier/coller la séquence ADN dans l'outil
'BLAT'
* Cliquer sur 'submit'
* Page 'BLAT Search Result': Choisir le meilleur score et cliquer sur
'browser'
- Sur quel chromosome est localisé le gène de l'insuline ?
- Quelles sont les positions de la séquence sur le chromosome ('numéro'
des nucléotides) ?
- Amusez-vous à 'écrire' une séquence au hasard (d'environ 30 lettres),
toujours avec un alphabet de 4 lettres (a,t,g,c) dans 'BLAT' :
la retrouvez-vous dans notre génome ?
Pour les experts: voici la séquence ADN du gène de l'insuline avec,
en rouge, les séquences des 2 exons (présents dans l'ARN messager) qui
seront traduites en acides aminés:
Activité 2: Comparer des séquences ADN et
répertorier les mutations
Environ 1 nucléotide sur 1000 diffère d'une personne à l'autre, d'un génome
à l'autre. Ces différences sont appelées variations ou mutations. Certaines
n'ont aucune conséquence, d'autre sont associées avec des maladies
génétiques. Les variations qui sont associées avec des maladies génétiques
modifient le plus souvent la séquence d'une protéine: cette dernière est
alors dysfonctionelle (
C'est
quoi une mutation?).
En 2008, des chercheurs ont étudié une famille norvégienne dont plusieurs
membres sont diabétiques (type I et type II).
Toutes les personnes avec un diabète de type I de cette famille sont
porteuses de la même variation
(rs121908261)
dans le gène qui code pour l'insuline (
Molven
et al., 2008)
(C'est
quoi une mutation?). Cette mutation n'a été retrouvée que dans une
seule autre famille 2 ans plus tard (Meur
et al., 2010).
Voici le
pédigré de la famille
(phénotype et liens de parenté):
Question:
- Est-ce que le bébé est porteur de la mutation associée avec un
diabète de type I ?
Afin de répondre à cette question, les chercheurs ont extrait l'ADN de 8 des
membres de cette famille et ont séquencé une partie du gène qui code pour
l'insuline.
>1
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacctgccgggaggcagaggacc
>2
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>3
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacctgccgggaggcagaggacc
>4
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>5
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>6
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>7
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggagaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
>8
cagccgcagcctttgtgaaccaacacctgtgcggctcacacctggtggaagctctctacc
tagtgtgcggggaacgaggcttcttctacacacccaagacccgccgggaggcagaggacc
Comparer les 8 séquences et localiser la variation dans le gène de
l'insuline qui est commune aux personnes diabétiques
Approche papier crayon:
...bandelettes de papier avec les séquences ADN à analyser manuellement
afin de bien comprendre le principe de la comparaison de séquence et de
l'alignement:
Approche bioinformatique:
Construire un alignement des 8 séquences à l'aide d'un outil bioinformatique
et identifier la variation commune aux personnes diabétiques de type I
* Copier/Coller les 8 séquences (inclue la ligne '>1') dans l'outil d
'alignement
* Sélectionner 'ADN' et cliquer sur 'Submit'
* Sur la page des résultats, la présence d'un * signifie que toutes les
lettres de la colonne sont identiques. L'absence de *, signifie que une ou
plusieurs lettres sont différentes.
Activité 3: Traduction ADN -> protéine et voir
l'impact d'une mutation
Effet de la mutation sur la séquence de la
protéine
L'insuline, comme toutes les protéines, est composée d'une succession
d'acides aminés. L'ordre des acides aminés est déterminé par la séquence en
acides nucléiques du gène de l'insuline: 3 'lettres ADN' correspondent à un
acide aminé (symbolisé par les lettres: K pour lysine, M pour méthionine,
etc.)
Voici un morceau de la séquence ADN du gène de l'insuline 'normale'.
aag acc cgc cgg gag
Voici un morceau de la séquence ADN du gène de l'insuline avec la
variation c -> t, associée avec un diabète.
aag acc tgc cgg gag
Question:
- Est-ce que la mutation c->t modifie la séquence en acide aminé
de l'insuline ?
- Est-ce que la mutation aag -> aaa modifie la séquence en acide
aminé de l'insuline ?
Vous pourriez traduire manuellement les séquences en acide nucléique en
séquence en acide aminé (code '1 lettre') en utilisant le code génétique
ci-dessous:
Vous pouvez utiliser l'outil bioinformatique 'Translate'
Réponse: La mutation c -> t dans le gène de l'insuline conduit au
remplacement de l'acide aminé R (arginine; codon cgc) par l'acide aminé C
(cystéine; codon cgt) en position 55 de la séquence de la protéine: ce
changement empêche la protéine insuline d'être 'coupée', un processus qui
est essentiel pour que l'insuline puisse être fonctionnelle (
Molven et al.,
2008).
Informations médicales sur la famille
Le sujet (
1) avec la mutation
appelée R55C (hétérozygote) a présenté un diabète de type I à l'âge de 10
ans. Elle avait un taux de glucose dans le sang de 17.6 mmol/l.
Sa maman (
3) a développé un diabète
de type I à l'âge de 13 ans. Elle est sous traitement d'insuline
(...). Elle est aussi hétérozygote pour la mutation.
Le grand-père maternel (
6) a été
diagnostiqué diabétique de type II à l'âge de 40 ans. Il est traité à
l'insuline (...). Ni lui ni sa femme (en bonne santé) ne sont porteurs de la
mutation, ce qui suggère qu'il s'agit d'une
mutation
de novo
qui pourraient avoir eu lieu par exemple dans les cellules germinales d'un
des 2 grands-parents (...).
Les patients
(1) et
(3) porteurs de la mutation
ont des taux de C-peptide quasi normaux, ce qui suggère qu'ils sont quand
même capables de fabriquer de l'insuline. Les scientifiques ne comprennent
pas pourquoi les patients
(1) et
(3)
ont besoin de s'injecter de l'insuline à des doses aussi élevées (...)
(
Molven
et al., 2008).
Pour les experts:
Il existe de nombreuses mutations (vairants) connues dans la séquence de la
protéine insuline, certaines d'entre elles peuvent être responsables de
différentes maladies génétiques:
https://www.uniprot.org/uniprotkb/P01308/entry#disease_variants
Activité 4: Visualiser la structure 3D de
l'insuline
4. 1 Une séquence en acide aminé vue autrement...
Utiliser l'outil "Pepdraw" , un outil qui permet de 'visualiser' la
structure atomique d'une séquence d'acides aminés:
http://pepdraw.com/:
comparer la séquence en acide aminé 'normale' (
TPKTRREAED)
avec la séquence en acide aminé 'mutée'(
TPKTCREAED)
4.2 Structure 3D de l'insuline
La séquence d'une protéine détermine sa forme (structure 3D) - et sa
fonction.
Les chercheurs sont capables (depuis 1958) de cristalliser des protéines et
de les 'prendre en photo' à l'aide des rayons X.
Les résultats de ces expériences sont ensuite analysés grâce à des
programmes bioinformatiques: on peut ainsi
visualiser la structure
des protéines... et de l'insuline
(
C'est
quoi la modélisation moléculaire?)
Visualiser la structure 3D de l'insuline
(PDB 2HIU)
* Sélectionner 3D view Structure à gauche de la page
* Dans la colonne de droite: 'Polymer'.Cliquer sur ... : clicker sur 'Add
representation' : choisir 'cartoon' ou 'ball & stick' ou
'molecular surface'
* Dans 'Type properties' choisir ce que vous souhaitez colorer de
différentes couleurs
Vue '
Cartoon' (seul le
'backbone' des chaînes A (vert) et B (orange) est visible)
Vue '
Ball & stick' (les
atomes de chaque acide aminé sont visibles); chaque acide aminé a une
couleur différente
Pour le fun, voici les données expérimentales brutes -
les
coordonnées spatiales (X, Y, Z) de chaque atome de chaque acide aminé de
l'insuline ! (
chercher 'ATOM' dans la page)
Remarque: Il n'existe pas de données
de structure 3D pour l'insuline avec la mutation R55C. Nous
ne savons pas si il est possible de produire l'insuline avec la
mutation R55C en quantité suffisante pour pouvoir étudier sa structure 3D.
Voici une belle galerie de
photos,
pour se faire une idée de la taille relative et des formes de différentes
protéines (agrandies x 3'000'000) (
pdf
(5Mb)).
Retrouver l'insuline parmi les différentes protéines et comparer sa taille
avec celle des autres protéines.
Activité 5: L'insuline est-elle spécifique à
l'être humain ?
5.1 BLAST
Voici la séquence complète en acide aminé de l'insuline humaine
(UniProtKB/Swiss-Prot:
P01308):
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
Question:
- Cette protéine est-elle spécifique à l'être humain ?
Approche bioinformatique:
Faire un
'BLAST'
contre une banque de données de protéines appelée UniProtKB
Info technique: BLAST est un outil bioinformatique qui permet de
comparer la séquence d'une protéine avec des millions d'autres séquences
contenues dans les banques de données et de retrouver, si elles existent,
celles qui lui ressemblent le plus, en quelques secondes. On peut ainsi
rapidement savoir si une protéine existe dans une espèce donnée.
* Copier/coller la séquence dans l'outil
'BLAST'
* Sélectionner '
Target Database = UniProtKB/Swiss-Prot'
* Cliquer sur le bouton 'Run BLAST'
* Rechercher les images correspondant au nom latin des différentes espèces
sur Google (exemple
'Octodon
degus')
L'insuline est une très vieille protéine dont l'origine pourrait remonter à
plus de 1 milliard d'années.
Elle est présente chez les animaux, mais on retrouve aussi des protéines
insulin-like chez les champignons et les protistes (wikipedia)
5.2 Alignement multiple
Voici une
liste
de protéines insuline de différentes espèces (dans la banque de
données UniProtKB/Swiss-Prot)
* Sélectionner les espèces de votre choix (mammifères, poissons, oiseaux;
inclure l'insuline humaine)
* Construire un alignement multiple (
Align)
* Dans la page des résultats: '
Highlight
Annotation' '
Disulfide bond'
et '
Natural Variant':
- noter la conservation des cystéines impliquées dans les
ponts disulfures.
- noter la conservation de l'acide aminé R55.
- noter que les régions les plus conservées correspondent
aux chaînes A et B de l'insuline 'coupée'
5.3 Introduction à la
phylogénie
Vous pouvez également comparer les séquences d'insuline de différentes
espèces et esquisser un arbre phylogénétique avec
PhiloPhylo
Pour aller plus loin:
Atelier
3 - Phylogénie, biodiversité et pizza
Activité 6: www.chromosomewalk.ch
www.chromosomewalk.ch
est une exposition virtuelle pour (re)découvrir le monde des gènes, des
protéines et de la bioinformatique....
Depuis la
liste
des chromosomes humains: rechercher 'insuline'
- Sur quel chromosome se trouve le gène de l'insuline ?
- Quelle est la taille de ce chromosome (nombre de nucléotide et cm) ?
- Combien de gènes contient ce chromosome ?
- Qu'est-ce que l'étude de l'insuline a amenè de particulier en terme
de connaissance scientifique ? (info)
Vérifiez que vous êtes de vrais experts : quiz
expert !
Pour nous contacter...