Download Análisis de la diversidad nucleotídica en el gen G6pd

Document related concepts
Transcript
Análisis de la diversidad nucleotídica en el gen G6pd
El gen G6pd (gen ligado al sexo) codifica la síntesis del enzima glucosa 6 fosfato
deshidrogenasa, enzima implicada en la vía de las pentosas fosfato y que actúa como
mecanismo fundamental de protección de los hematíes frente a la oxidación. Su déficit
es responsable de algunos tipos de anemia hemolítica. En Drosophila, el polimorfismo
del gen G6pd ha sido extensamente utilizado como modelo empírico y sus relaciones
filogenéticas y funcionales con otros taxones han sido estudiadas. En esta práctica,
estudiaremos el patrón de polimorfismo nucleotídico y de divergencia entre D.
melanogaster y D. simulans, y examinaremos la concordancia entre el polimorfismo y
la divergencia en regiones sinónimas y no sinónimas.
Bibliografía
Eanes W., M. Kirchner M. and Yoon J. 1993. Evidence for adaptive evolution of the
G6pd gene in Drosophila melanogaster and Drosophila simulans lineages. Proc. Natl.
Acad. Sci. USA. 90:7475- 7479.
Secuencia del gen G6pd (L13900)
Mayúscula: exón. Minúscula: intrón. Subrayado: primer codón.
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
10
20
30
40
50
60
70
80
gAGATCACACCGCCCTGGATCTCATAATCAAGTCACTCAAGTCGCCTACAATGGTCTGCGAGGGAACCCACTTTGACGGC
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
90
100
110
120
130
140
150
160
AAGATTCCGCACACGTTCGTCATCTTTGGGGCGTCGGGCGATCTGGCCAAGAAGAAGATCTACCCCACGCTCTGGTGGCT
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
170
180
190
200
210
220
230
240
CTACCGCGATGACCTGCTGCCCAAGCCGACCAAGTTCTGCGGCTATGCCCGTTCCATGCTGACCGTCGATAGCATCAAGG
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
250
260
270
280
290
300
310
320
AGCAGTGTCTGCCGTACATGAAGGTgcgttcgggatttggtcataggccatttgcatcgcattaacccaacccattgcca
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
330
340
350
360
370
380
390
400
cacaggtCCAGCCGCACGAGCAGAAGAAGTACGAGGAGTTCTGGGCCCTCAATGAGTACGTGTCCGGCAGATATGACGGA
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
410
420
430
440
450
460
470
480
CGCACTGGCTTCGAGCTGCTTAACCAGCAGCTGGAGATTATGGAGAACAAGAACAAGGCCAACCGCATCTTCTATCTGGC
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
490
500
510
520
530
540
550
560
CCTGCCGCCCAGCGTCTTCGAGGAGGTGACTGTCAACATCAAGCAGATCTGCATGTCGGTCTGgtgagtataagatcaag
....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|
570
580
590
600
610
620
630
640
atcaagatccagatgcatttaatttgaaacccgatacttatgtacacctataacccgttcgcttgcagCGGTTGGAACCG
....|....|....|
650
CGTGATTATC.....
Sesión 1
A) Obtención de las secuencias del gen G6pd en D. melanogaster
Las secuencias del gen G6pd que utilizaremos en esta práctica están disponibles en la
base de datos GenBank (http://www.ncbi.nlm.nih.gov) con los números de acceso
L13876- L13920. Utilizaremos una muestra de 12 secuencias de D. melanogaster de las
32 disponibles en la base de datos.
Crea una archivo (formato texto) especificando los siguientes números de acceso
L13889
L13897
L13898
L13899
L13900
L13901
L13904
L13906
L13909
L13912
L13917
L13920
En la pagina web http://www.ncbi.nlm.nih.gov/Entrez/, la opción Batch Entrey permite
obtener un conjunto de secuencias a partir de sus números de acceso correspondientes.
Utiliza la opción display Fasta para mostrar las secuencias, la opción Display Fasta Text
para obtener las secuencias en formato Fasta texto. Copia y pega todas las secuencias en
un archivo nuevo (programa word).
A partir de estas secuencias crea un archivo (formato texto) y alinea las secuencias con
el programa clustalW http://www.ebi.ac.uk/clustalw/ utiliza una salida en
formato pir.
Con el alineamiento obtenido mediante el clustalW, copia y pega las secuencias en un
archivo nuevo, guárdalo en formato texto.
Utiliza el programa DnaSP (software instalado) para visualizar el alineamiento.
B) Análisis de la variabilidad nucleotídica en D. melanogaster.
Observa los datos en Display/ view data, ¿Qué tipos de polimorfismo observas?
Utiliza la secuencia del gen G6pd para establecer el marco de lectura correspondiente y
asigna la región codificante (Data / Assign coding region) según los siguiente datos:
Exon 1: 2- 265
Intron1: 266- 327
Exon 2: 328- 543
Intron 2: 544- 628
Exon 3 : 629-1706.
I. Considerando el 1er intron del gen G6pd, y las secuencias de D. melanogaster,
1) ¿Cuantós sitios polimórficos hay?
2) Calcula el polimorfismo nucleotidico 
ps = sitios segregantes por sitio nucleotídico =
 = ps/a a = 1 + 1/2 + 1/3 + …1/(n-1).
3) Calcula la diversidad nucleotídica
=
n
2 (  xi  x j  ij)
( n  1)
i j
4) Repite estos cálculos con el módulo Análisis / DNA polymorphism.
¿Qué diferencia hay entre ambas estimas ( y )?
II. Consideramos la región 75-104 del exón 1.
5) ¿Cuántos sitios polimórficos hay? ¿Qué tipo de polimorfismo es?
6) Calcula la diversidad nucleotídica en esta región.
7) Calcula la diversidad nucleotídica sinónima y no sinónima en esta región.
Para eso hay que calcular Ns y Na (número de posiciones sinónimas y no sinónimas,
respectivamente)
Na = N(0) + 2/3 N(2) + 1/3 N(3)
Ns = N(4) + 1/3 N(2) + 2/3 N(3)
s =
n
2 (  xi  x j  ij) donde ij = S/Ns (S es el número de nucleótidos que
( n  1)
i j
difieren entre las secuencias i, j)
a =
n
2 (  xi  x j  ij) donde ij = S/Na
( n  1)
i j
GAC GGC AAG ATT CCG CAC ACG TTC GTC ATC
8) Repite estos cálculos con el módulo Análisis / Synonymous and Nonsyn.
substitutions
Sesión 2
Obtenga las secuencias del gen G6pd en D. simulans siguiendo los pasos
efectuados en la sesión 1. Los números de acceso de estas secuencias
son:
L13876
L13877
L13878
L13879
L13881
L13882
L13883
L13884
L13891
L13892
L13893
L13894
Edita y alinea las secuencias como en la sesión anterior.
Crea un archivo con el conjunto de las secuencias alineadas de D. melanogaster y D.
simulans.
Con el DnaSP, abra este archivo y asigna la región codificante.
III. Calcula la diversidad nucleotídica (sinónima y no sinónima) en las distintas
regiones (exones y intrones) en D. melanogaster y D. simulans (Análisis / Synonymous
and Nonsyn. Substitutions).
Para considerar las secuencias de una sola especie, utiliza el módulo Data/ includeexclude sequences.
D. melanogaster
s
a
D. simulans
s
a
Exon 1
Exon 2
Exon 3
Total
D. melanogaster

D. simulans

Intron 1
Intron 2
Total
Comenta los resultados
IV. Representa gráficamente los resultados (Análisis/ DNA polumorphism/ sliding
window/ compute)
V. Comparación del nivel de polimorfismo intraespecífico con la divergencia
interespecífica.
1) Consideremos el primer exon.
Clasifica el tipo de polimorfismo observado en las siguientes categorías: polimorfismo
sinónimo, polimorfismo no sinónimo, diferencia fijada sinónima y diferencia fijada no
sinónima.
Sitio
47
D. melanogaster
T
D. simulans
G
Tipo
Fijado sinónimo
2) Aplique un test de 2 para averiguar si hay diferencias entre los distintos tipos de
cambio.
3) Repita los cálculos con todas la secuencia (Análisis/ McDonal and Kreitman test,
substitutions in coding regions).
4) Interpreta los resultados obtenidos.
VI. ¿Qué crees que pasaría si calculásemos la diversidad nucleotídica en otro gen del
cromosoma X? ¿Y en un gen autosómico?