Découvrez des outils bioinformatiques incontournables
Une petite mise en bouche - Activité
BLAST - ADN / Activité
BLAST - protéines
Notre exposition virtuelle www.chromosomewalk.ch
Activité 1: Comparaison de séquences
Il était une fois un gène qui influence la qualité de notre cire d'oreille -
humide ou sèche...
Voici un morceau de la séquence ADN de ce gène, chez 2 athlètes différents:
>Seq1
tgatccaaagcttacggagtcgcttagatgagaacaccatccctccactgtcagtccatg
atgcctcagacaaaaatgtccaaaggcttcaccgcctttgggaagaagaagtctcaaggc
gagggattgaaaaagcttcagtgcttctggtgatgctgaggttccagagaacaaggttga
ttttcgatgcacttctgggcatctgcttctgcattgccagtgtactcgggccaatattga
>Seq2
tgatccaaagcttacggagtcgcttagatgagaacaccatccctccactgtcagtccatg
atgcctcagacaaaaatgtccaaaggcttcaccgcctttgggaagaagaagtctcaaggc
gagggattgaaaaagcttcagtgcttctggtgatgctgaggttccagagaacaaggttga
ttttcgatgcacttctgggcatctgcttctgcattgccagtgtactcaggccaatattga
Questions:
- Comparer les 2 séquences et localiser la variation g -> a
- Sachant que les japonais (qui ont le plus souvent une cire
d'oreille sèche) ont le variant 'a', quelle séquence est celle de
l'athlète japonais ?
Approche bioinformatique: Construire un alignement des 2 séquences
Copier/coller les 2 séquences (inclue la ligne '>Seq') dans l'outil d'alignement et
cliquer sur l'icône 'align', puis sur 'Similarity' (colonne à droite)
Activité 2: BLAT - ADN
Voici un morceau de la séquence ADN du gène qui influence la qualité de
notre cire d'oreille - humide ou sèche...
ttttcgatgcacttctgggcatctgcttctgcattgccagtgtactcaggccaatattga
Questions:
- Sur lequel de nos 23 chromosomes est localisé ce gène ?
- Combien de lettres peut-on changer et retrouver quand même le bon
résultat ?
- Amusez-vous à 'écrire' une séquence au hasard (d'environ 30
lettres), toujours avec un alphabet de 4 lettres (A,T,G,C): la
retrouvez-vous dans notre génome ?
Approche bioinformatique: Faire un
'BLAT'
contre le génome humain
Copier/coller la séquence et cliquer sur 'submit', puis cliquer sur
'browser'
Approche bioinformatique (pour les experts): Faire un
'BLAT' contre
le génome humain
Copier/coller la séquence et cliquer sur 'submit', puis cliquer sur
'browser', comme précédemment
Puis, dans la section 'Variations and repeats', sélectionner Common
SNPs(135) 'full' et Genome variants 'full': cliquer sur 'refresh'.
Les variations répertoriées dans différentes populations sont maintenant
visibles, comme la variation g -> a, qui est associée avec une cire
d'oreille sèche, que l’on retrouve surtout en Asie et dans la population
japonaise.
Info technique: BLAT est un outil bioinformatique qui permet de comparer une
séquence ADN avec la séquence entière d'un génome (soit un texte de 3
milliards de lettres pour le génome humain)et de retrouver, si elle existe,
celle qui lui ressemble le plus, en quelques secondes. On peut ainsi
rapidement retrouver sur quel chromososome se trouve une séquence ADN
donnée.
Activité 3: TRADUCTION ADN -> protéine
Eero Mäntyranta, un athlète finlandais, a obtenu une médaille d’or de ski de
fond aux Jeux Olympiques d’hiver de 1964.
Il avait un taux particulièrement élevé de globules rouges, mais il n'était
pas dopé!
Les chercheurs ont découvert qu'il avait 'simplement' une mutation dans le
gène appelé EPOR.
Voici un morceau de la séquence ADN du gène EPOR 'muté'. La mutation est
associée avec un taux élevé de globules rouges.
...tcc gat ggc ccc tac tcc aac cct tct gag aac agc ctt atc cca...
Question:
- Traduire la séquence en acide nucléique (ADN) en séquence en acide
aminé (protéine; code acide aminé '1 lettre') (à la main)
- Comparer avec la séquence 'normale' en acide aminé (...S D G P Y S
N P Y E N S...): quelle est la différence ?
Approche bioinformatique: Copier/coller la séquence ADN dans l'outil
'Translate'
Choisir l'output format 'compact ("M", "-", no spaces)' et cliquer sur
'Translate sequence'
Info:
Plusieurs résultats sont visibles, car il est possible de traduire une
séquence ADN en commençant à la première lettre (5'3' Frame 1)
tcc gat ggc ccc tac tcc aac cct tat gag aac agc ctt atc cca
...en commençant à la seconde lettre (5'3' Frame 2)
ccg atg gcc cct act cca acc ctt atg aga aca gcc tta tcc ca
...en commençant à la troisième lettre (5'3' Frame 3)
cga tgg ccc cta ctc caa ccc tta tga gaa cag cct tat ccc a
...ou en lisant la séquence à l'envers (3'5' Frame 1, 2 ou 3)
Activité 4: BLAST - Protéine
Voici la séquence en acide aminé d'un morceau de la protéine EPOR 'normale',
qui joue un rôle important dans la production des globules rouges:
S D G P Y S N P Y E N S
Question:
- Cette protéine est-elle spécifique à l'être humain ?
Approche bioinformatique: Faire un
'BLAST'
contre une banque de données de protéines, UniProtKB
(copier coller la sequence dans la boîte 'Sequence', puis cliquer sur le
bouton 'BLAST')
Info technique: BLAST (Basic Local Alignment Search Tool) est un outil
bioinformatique qui permet de comparer la séquence d'une protéine avec des
millions d'autres séquences contenues dans les banques de données et de
retrouver, si elles existent, celles qui lui ressemblent le plus, en
quelques secondes. On peut ainsi rapidement savoir si une protéine existe
dans une espèce donnée, ou identifier une séquence inconnue.
Pour nous contacter...