Download Estructura del genoma humano: perspectivas en biomedicina

Document related concepts

Genoma humano wikipedia , lookup

Gen wikipedia , lookup

Genómica funcional wikipedia , lookup

Genómica comparativa wikipedia , lookup

Secuencia Alu wikipedia , lookup

Transcript
Estructura del genoma humano:
perspectivas en biomedicina
Julio Escribano
Facultad de Medicina
Universidad de Castilla-La Mancha
1- El proyecto Genoma Humano.
2- Estructura molecular del Genoma Humano.
3- Variación de la secuencia del genoma humano.
4- Papel de los genes en las enfermedades comunes.
Evolución del concepto de gen
Unidad elemental de la
herencia
....CACTGG...
(unidad de transcripción)
Intrón
Exón
Carácter
1866
Mendel
GEN
1909
Pre- 1953
Johansen
1953
Watson
Crick
1980
Genética molecular
Algunas cifras sobre el genoma humano
El
El genoma
genoma humano
humano contiene:
contiene:
•• 3x10
3x1099 pares
pares de
de bases
bases
•• 25.000genes
25.000genes aprox.
aprox.
La
La secuencia
secuencia de
de nucleótidos
nucleótidos del
del
genoma
genoma humano
humano ocupa:
ocupa:
•• 3000
3000 libros
libros de
de unas
unas 500
500
páginas
páginas cada
cada uno
uno
•• una
una única
única línea
línea de
de texto
texto de
de unos
unos
5000
5000 km
km
Nueva York
Madrid
Historia del proyecto Genoma Humano
Conferencia en Alta, Utha, EEUU (DOE)
El
El Congreso
Congreso de
de EEUU
EEUU aprueba
aprueba el
el proyecto
proyecto aa 15
15 años
años
Se inicia la ejecución del proyecto
Nace
Nace “The
“The Institute
Institute for
for Genomic
Genomic Research”
Research” (TIGR)
(TIGR)
Mapa genético
Mapa físico (ESTs)
Creación de Celera
Secuencia completa del primer cromosoma (22)
Borrador de la secuencia del genoma humano
Secuencia completa del genoma humano
1984
1988
1991
1992
1994
1996
1998
1999
2000
2003
Objetivo del proyecto genoma humano
Determinar la secuencia completa del genoma humano
Objetivos técnicos y éticos
•• Desarrollo
Desarrollo de
de técnicas
técnicas de
de secuenciación
secuenciación rápidas
rápidas yy automatizadas
automatizadas
•• Desarrollo
Desarrollo de
de bases
bases de
de datos
datos yy programas
programas informáticos
informáticos para
para manejar
manejar
yy analizar
analizar el
el enorme
enorme volumen
volumen de
de información
información generado
generado
•• Discusión
Discusión de
de aspectos
aspectos éticos
éticos yy legales
legales relacionados
relacionados con
con el
el genoma
genoma
humano
humano
•• Desarrollo
Desarrollo de
de políticas
políticas adecuadas
adecuadas para
para garantizar:
garantizar:
•• la
la privacidad
privacidad de
de los
los datos
datos genéticos
genéticos
•• el
el respeto
respeto aa la
la diversidad
diversidad genética
genética
•• la
la correcta
correcta utilización
utilización del
del diagnóstico
diagnóstico genético
genético
La secuenciación de los genomas se ha
realizado en laboratorios tipo factoría
LA CARRERA HACIA EL GENOMA
11p15.4
11p15.4
......TCTAAGTCACAGAGGCTTTTTGTTCCCCCAGACACTCTTGCAGATTAGTCCAGGCAGAAACAGTTAGATGTCCCCA
GTTAACCTCCTATTTGACACCACTGATTACCCCATTGATAGTCACACTTTGGGTTGTAAGTGACTTTTTATTTATTTGTAT
TTTTGACTGCATTAAGAGGTCTCTAGTTTTTTATCTCTTGTTTCCCAAAACCTAATAAGTAACTAATGCACAGAGCACAT
TGATTTGTATTTATTCTATTTTTAGACATAATTTATTAGCATGCATGAGCAAATTAAGAAAAACAACAACAAATGAATGC
ATATATATGTATATGTATGTGTGTATATATACACACATATATATATATATTTTTTCTTTTCTTACCAGAAGGTTTTAATCCA
AATAAGGAGAAGATATGCTTAGAACCGAGGTAGAGTTTTCATCCATTCTGTCCTGTAAGTATTTTGCATATTCTGGAGA
CGCAGGAAGAGATCCATCTACATATCCCAAAGCTGAATTATGGTAGACAAAACTCTTCCACTTTTAGTGCATCAACTTC
TTATTTGTGTAATAAGAAAATTGGGAAAACGATCTTCAATATGCTTACCAAGCTGTGATTCCAAATATTACGTAAATACA
CTTGCAAAGGAGGATGTTTTTAGTAGCAATTTGTACTGATGGTATGGGGCCAAGAGATATATCTTAGAGGGAGGGCTG
AGGGTTTGAAGTCCAACTCCTAAGCCAGTGCCAGAAGAGCCAAGGACAGGTACGGCTGTCATCACTTAGACCTCACC
CTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGGAGCAGGGAGGGCAGGAGCCAGGGCTGGGCATAAAA
GTCAGGGCAGAGCCATCTATTGCTTACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGG
TGCATCTGACTCCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAG
GCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCATGTGGAGACAGAGA
AGACTCTTGGGTTTCTGATAGGCACTGACTCTCTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTAC
CCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGAAG
GCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAACCTCAAGGGCACCTTTGCCACA
CTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCCTGAGAACTTCAGGGTGAGTCTATGGGACGCTTGATGTTTT
CTTTCCCCTTCTTTTCTATGGTTAAGTTCATGTCATAGGAAGGGGATAAGTAACAGGGTACAGTTTAGAATGGGAAACA
GACGAATGATTGCATCAGTGTGGAAGTCTCAGGATCGTTTTAGTTTCTTTTATTTGCTGTTCATAACAATTGTTTTCTTTT
GTTTAATTCTTGCTTTCTTTTTTTTTCTTCTCCGCAATTTTTACTATTATACTTAATGCCTTAACATTGTGTATAACAAAAG
GAAATATCTCTGAGATACATTAAGTAACTTAAAAAAAAACTTTACACAGTCTGCCTAGTACATTACTATTTGGAATATAT
GTGTGCTTATTTGCATATTCATAATCTCCCTACTTTATTTTCTTTTATTTTTAATTGATACATAATCATTATACATATTTATG
GGTTAAAGTGTAATGTTTTAATATGTGTACACATATTGACCAAATCAGGGTAATTTTGCATTTGTAATTTTAAAAAATGC
TTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAA
TGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATCTCTGCATAT
AAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTG
CTTTTATTTTATGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCATGTTCATACCTCTT
ATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTCACCCCACCA
GTGCAGGCTGCCTATCAGAAAGTGGTGGCTGGTGTGGCTAATGCCCTGGCCCACAAGTATCACTAAGCTCGCTTTCTT
GCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACTGGGGGATATTATGAAGGGCCTTGAG
CATCTGGATT......
11p15.4
11p15.4
beta-globina
beta-globina
.........tctaagtcacagaggctttttgttcccccagacactcttgcagattagtccaggcagaaacagttagatgtccccagttaacctcctatttgacaccactga
ttaccccattgatagtcacactttgggttgtaagtgactttttatttatttgtatttttgactgcattaagaggtctctagttttttatctcttgtttcccaaaacctaataagta
actaatgcacagagcacattgatttgtatttattctatttttagacataatttattagcatgcatgagcaaattaagaaaaacaacaacaaatgaatgcatatatatgta
tatgtatgtgtgtatatatacacacatatatatatatattttttcttttcttaccagaaggttttaatccaaataaggagaagatatgcttagaaccgaggtagagttttcat
ccattctgtcctgtaagtattttgcatattctggagacgcaggaagagatccatctacatatcccaaagctgaattatggtagacaaaactcttccacttttagtgcat
caacttcttatttgtgtaataagaaaattgggaaaacgatcttcaatatgcttaccaagctgtgattccaaatattacgtaaatacacttgcaaaggaggatgtttttag
tagcaatttgtactgatggtatggggccaagagatatatcttagagggagggctgagggtttgaagtccaactcctaagccagtgccagaagagccaaggaca
ggtacggctgtcatcacttagacctcaccctgtggagccacaccctagggttggccaatctactcccaggagcagggagggcaggagccagggctgggca
taaaagtcagggcagagccatctattgcttacatttgcttctgacacaactgtgttcactagcaacctcaaacagacaccatggtgcatctgactcctgaggaga
agtctgccgttactgccctgtggggcaaggtgAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGgttggtatcaaggttacaagaca
ggtttaaggagaccaatagaaactgggcatgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtctattttcccacccttag
GCTGCTGGTGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATG
GGCAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAAC
CTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCCTGAGAACTTCAGGgtga
gtctatgggacgcttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggataagtaacagggtacagtttagaatgggaaacagacgaat
gattgcatcagtgtggaagtctcaggatcgttttagtttcttttatttgctgttcataacaattgttttcttttgtttaattcttgctttctttttttttcttctccgcaatttttactatt
atacttaatgccttaacattgtgtataacaaaaggaaatatctctgagatacattaagtaacttaaaaaaaaactttacacagtctgcctagtacattactatttggaat
atatgtgtgcttatttgcatattcataatctccctactttattttcttttatttttaattgatacataatcattatacatatttatgggttaaagtgtaatgttttaatatgtgtacac
atattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggca
ataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatctctgcatataaatatttctgcatataa
attgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagcta
ggcccttttgctaatcatgttcatacctcttatcttcctcccacagCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGC
AAAGAATTCACCCCACCAGTGCAGGCTGCCTATCAGAAAGTGGTGGCTGGTGTGGCTAATGCCCTGGCCCACAAG
TATCACTAAGCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACTGGG
GGATATTATGAAGGGCCTTGAGCATCTGGATT.................
¿Cómo es el material hereditario a
escala molecular?
Organización molecular del
genoma humano
Genoma
Humano
3.200 Mb
37%
37%
36%
36%
ADN génico y
relacionado
1,200 Mb
ADN no codificante
1,152 Mb
- Pseudogenes
- Fragmentos génicos
- Intrones, extremos
5´y 3´no traducidos
Genoma
Mitocondrial
16,6 kb
37 genes
Genoma
Nuclear
3.200 Mb
30.000
25.000 genes aprox.
63%
63%
ADN extragénico
- Genes de ARNr: 2
- Genes de ARNt: 22
- Genes de ARNm: 13
1,5%
1,5%
ADN codificante
48 Mb
ADN repetido
En tándem
ADN de copia única
y poco repetido
Disperso
1,400 Mb
- Satélite
- Minisatélite
- Microsatélite
-
43%
43%
LINEs (640 Mb)
SINEs (420 Mb)
LTR (250 Mb)
Transp. (90 Mb)
Basado en Venter y col., 2001. Science 291, 1304-1350.
ADN extragénico repetido
En tánden
• Microsatélite (5%)
Disperso
Elementos transponibles
• Minisatélite (1%)
• Satélite (3%)
• SINE (13%) Alu (10%)
• LTR (8%)
• LINE (21%)
• Transposones (3%)
El ADN satélite se separa mediante
centrifugación del resto del ADN genómico
Banda satélite
Banda
principal
100
100 kb-1Mb
kb-1Mb
ATTGCATTCCATATC
ATTGCATTCCATATC
ATTGCATTCCATATC
ATTGCATTCCATATC
ATTGCATTCCATATC
ATTGCATTCCATATC
Satélite
Satélite
100
100 pbpb- 100
100 kb
kb
GCATTC
GCATTC
GCATTC
GCATTC
GCATTC
GCATTC
Minisatélite
Minisatélite
VNTR
VNTR
150
150 pb
pb
CA
CA
CA
CA
CA
CA
Microsatélite
Microsatélite (STR)
(STR)
Localización cromosómica de las principales clases de ADN
repetitivo
Strachan y Read. 1999. Garland Science
ADN extragénico repetido
En tánden
• Microsatélite (5%)
Disperso
Elementos transponibles
• Minisatélite (1%)
• Satélite (3%)
• SINE (13%) Alu (10%)
• LTR (8%)
• LINE (21%)
• Transposones (3%)
Estructura de los elementos Alu
• Originadas a partir de RNA 7SL
• Funciones reguladoras de la expresión génica
• Inductoras en recombinación no alélica que
originando deleciones e inserciones
Hasler, J. et al. Nucl. Acids Res. 2006 34:5491-5497
Genes
El genoma
humano contiene
• 20,000-25,000 genes
Codifican
100,000-200,000 proteínas
Un gen
Un gen
Una enzima
(Una proteína)
Varias proteínas
(Un polipéptido)
(Varios polipétidos)
Distribución de los genes en los cromosomas humanos
Cromosoma
Tamaño
(Mpb)
Predicción del
nº de genes
Densidad de genes
(genes/Mpb)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
X
Y
Localización
desconocida
Total
Media
220
240
200
186
182
172
146
146
113
130
132
134
99
87
80
75
78
79
58
61
33
36
128
19
75
2,453
1,816
1,611
1,145
1,366
1,467
1,219
940
1,018
1,027
1,586
1,342
582
873
804
995
1,210
472
1,409
697
286
641
992
104
11
7
8
6
7
8
8
6
8
7
12
10
5
10
10
12
15
6
23
11
8
17
7
5
1,047
9
2907
116
Venter
Venter yy col.
col.
Science.
2001
Science. 2001
291,
291, 1304-1351.
1304-1351.
Tamaño de los genes
28 kb (Tamaño medio de los genes)
beta-globina 1,5 kb
Factor VIII
NF1
150 kb
350 kb
Distrofina (DMD)
...
...
2500 kb (79 exones)
Distrofia
Distrofia
muscular
muscular de
de
Duchenne
Duchenne
¿Qué funciones desempeñan los genes
(de clase II)?
Funciones moleculares de los genes humanos
Venter
Venter yy col.
col. Science.
Science. 2001
2001 291,
291, 1304-1351.
1304-1351.
ENCODE: Encyclopedia of DNA Elements
• Objetivo: identificar todos los elementos funcionales
del genoma humano.
• Estudio inicial de diferentes regiones cromosómicas
(1%).
• Consorcio de laboratorios.
La mayor parte del genoma se
transcribe
% de regiones genómicas de ENCODE presentes en transcritos
The Encode Proyect Consortium. NATURE| Vol 447| 14 June 2007
Funciones de los RNAs no codificantes
(ncRNAs)
•
•
•
•
•
Síntesis de proteínas (tRNAs y rRNAs).
Procesamiento del RNA (snoRNAs, snRNAs)
Regulación de la expresión génica (miRNAs).
Epigenética.
Sin función propia.
Algunos de los RNAs no codificantes
intervienen fenómenos epigenéticos
Costa, F.F. Gene (2008)
La organización génica es compleja
Gerstein et al., Genome Res. 2007 17: 669-681
Otras conclusiones de ENCODE
• Se han identificado numerosos sitios de
inicio de la transcripción (aprox. 10
veces superior al número de genes
conocidos).
• Una fracción importante de los
elementos funcionales tienen un
comportamiento evolutivo neutro.
¿Qué es un gen?
Una secuencia genómica (unidad de
transcripción) que codifica un producto
funcional: proteína o RNA
El número de genes no permite explicar la complejidad de
los organismos vivos
25.000
25.000
13.338
18.266
6.144
25.706
C. elegans
D. melanogaster
S. cerevisiae
H. sapiens
P. troglodites
A. thaliana
Variación de la secuencia del
genoma humano
• La mayor parte de las variaciones en la secuencia del
genoma humano son debidas a cambios de un solo
nucleótido o SNP (Single Nucleotide Polimorphism).
• Otras variaciones son debidas a inserciones, deleciones
e inversiones de pocos nucleótidos y a diferencias en la
longitud de secuencias repetidas.
Variación de la secuencia del genoma humano
Las variaciones en la secuencia de nucleótidos
originan cambios fenotípicos que determinan:
• variaciones fenotípicas normales.
• el riesgo de padecer enfermedades
• la respuesta a factores ambientales (fármacos p. ej.)
Un SNP es un cambio de secuencia que afecta a un solo
nucleótido, con una frecuencia >1%.
Individuo 1 ···ATTTAGATCGCGATAGA···
Individuo 2 ···ATTTAGATCTCGATAGA···
Dos individuos como promedio se diferencian en
1,5-3 millones de SNPs (0,1%)
Variantes estructurales del genoma: variación
en el número de copias (CNV)
Segmentos >1 kb
Cooper Et Al., 39. 2007. Nature Genetics Supplement. S22-s29
Localización de 1447 regiones
cromosómicas con CNVs
Redon et al. NATURE. 2006. 444, 444-454.
Total entries: 29289 (hg18)
CNVs: 11784
Inversions: 182
InDels (100bp-1Kb): 17323
Total CNV loci: 4878
http://projects.tcag.ca/variation/
Individuo 1
Individuo 2
Individuo 3
Individuo 4
Influencia de las variantes estructurales en
el fenotipo
Carson And Scherer. Nature Reviews Genetics (7). 2006, 85-97.
Estivill and Armengol. Plos Genetics. 2007. 3(10), 1787-1789
¿Qué papel juegan los genes en las distintas
enfermedades?
Las principales causas de mortalidad
tienen factores genéticos
1. Enfermedades cardiacas (31.0% de las
muertes en 1998)
2. Cáncer (23.2%)
3. Accidentes cerebro-vasculares (6.8%)
4. Diabetes (2.8%)
Hamosh et al., Nucleic Acids Research, 2005, Vol. 33, D514-D517
http://www.ncbi.nlm.nih.gov/Omim/mimstats.html
Se han identificado unos 2000 genes genes
responsables de enfermedades humanas (aprox.
10 % del total).
Genes asociados con la enfermedad de Alzheimer
Comienzo de
la enfermedad
Temprano
Producto génico
Asociación con la Cromosoma
enfermedad
Proteína precursora de amiloide
(APP)
Presenilina 1 (PS1)
Presenilina 2 (PS2)
++
21
++
++
14
1
Apolipoproteína E
Alfa2-macroglobulina (a2M)
FE65
Producto génico del cromosoma
12 distinto de LRP y a2M
++
+
+
+
19
12
11
12
Tardio
Frecuencia de alelos de APOE en enfermos de
Alzheimer y en controles
Estudios genómicos de asociación
Couzin and Kaiser. 2007. SCIENCE. 316, 820-822.
Estudio de asociación genómica de 7 enfermedades
comunes (14000 casos y 3000 controles)
The Wellcome Trust Case Control Consortium. NATURE. (447). 2007, 661-678.
2010 – ¿Medicina personalizada?
2008
2010
C
A
B
C
Prescripción
Prescripción empírica=
empírica= tiempo
tiempo yy dinero
dinero
Prescripción
Prescripción personalizada
personalizada
(farmocogenómica)=mayor
(farmocogenómica)=mayor eficacia
eficacia