Download Genoma Humano - Blog de Química Biológica Patológica

Document related concepts

Genoma humano wikipedia , lookup

Gen wikipedia , lookup

Secuencia Alu wikipedia , lookup

Genómica comparativa wikipedia , lookup

Genómica funcional wikipedia , lookup

Transcript
Química Biológica Patológica
Técnicas de Biología Molecular
aplicadas a Bioquímica Clínica
2015
Tema 1
 Dra. Silvia Varas
[email protected]
Tema 1
Genoma Humano
 Proyecto Genoma Humano
 Controversias Éticas
 Mutaciones mas comunes según
Human Gene Mutation Database
 Deleciones y Mutaciones puntuales
 Estrategias de laboratorio

DEFINICIONES
Genoma: es el set completo de genes
de un organismo
 Transcriptoma: completo set de genes
que se expresan (todas las moléculas
de RNA)
 Proteoma: completo set de
polipéptidos codificado por un
genoma completo

GENOMA





Es la base de la herencia de un organismo
Larga secuencia de ADN que contiene toda
la información que define a un organismo.
Físicamente, esta formado por diferentes
moléculas de ADN o cromosomas
Funcionalmente, el genoma esta dividido
en genes
Cada gen es la secuencia de ADN que
codifica para un tipo de RNA (algunos son
polipéptidos posteriormente).
Genoma Humano
Su detallado conocimiento esta ligado
al proyecto genoma humano
 En 1986 el Dpto de Energía de los
EEUU lideró la iniciativa y puso en
marcha el mayor proyecto biomédico
de la historia. Oficialmente se inicia en
octubre 1990. Hasta conseguir la
secuenciación completa en 2005.

Proyecto Genoma Humano

El Proyecto Genoma Humano ha
identificado la mayoría de los
genes presentes en el núcleo de
las células humanas y ha
establecido la localización que
ocupan estos genes en los 23
pares de cromosomas del núcleo.
Proyecto Genoma Humano

En 1990 se inició
oficialmente.

En los 1ºcinco años:
construir mapas genéticos
(de ligamiento) y de mapas
físicos (clones) de todo el
genoma.

En el etapa de mayor
actividad del programa se
secuenciaba 1000 nt/seg.
Francis Collins (director del
CONSORCIO Proyecto Genoma
Humano) y Craig Venter
(gerente de Celera Genomics)
MAPAS




Genéticos: marcadores usados
en estudios de ligamiento
RFLP
VNTR, STR
SNP




Físicos
Mapas de restricción
STS Sitio Etiquetado
de pares de bases
(Pequeña secuencia
de localización y
secuencia conocida.
Inicialmente
separados en 100Kb).
Proyecto Genoma Humano:
representación


Si cada par de nucleótidos se
dibuja para abarcar 1 mm,
entonces el genoma humano se
extendería 3.200 kilometros lo
suficiente para cruzar la línea
a través del centro de África
(línea roja).
A esta escala, habría, en
promedio, un gen codificante
para proteína cada 130 m. Un
gen promedio se extendería por
30 m, pero las secuencias
codificantes de este gen podría
abarcar algo más de 1 metro.
Genoma Humano: citas
International Human Genome
Sequencing Consortium (2001) Initial
sequencing and analysis of the human
genome. Nature 409, 860–933.
 International Human Genome
Sequencing Consortium (2004)
Finished: the euchromatic sequence of
the human genome. Nature 431, 931–
45.

Genoma humano


El genoma
humano haploide
consiste de 3200
millones pb de
DNA
Se suponía en un
principio que el
genoma humano
podría tener unos
50.000 a 100.000
genes genes
distribuidos en
los 23 pares de
cromosomas de la
célula
Genoma humano: Historia



Si 6.000 genes pueden producir una
levadura, y 14.000 a una mosca, ¿cuántos
se necesitan para codificar un ser, una
criatura compleja humano, curiosa y lo
suficientemente inteligente como para
estudiar su propio genoma?
Hasta que los investigadores completaron
el primer borrador de la secuencia del
genoma humano, la estimación más citada
fue 100.000. Pero ¿de dónde esa cifra?
¿Y de donde sale la nueva estimación de
sólo 25.000?

Walter Gilbert, un físico convertido en biólogo y
quien ganó el Premio Nobel por el desarrollo de
técnicas de secuenciación de ADN, fue uno de los
primeros en lanzar una estimación aproximada del
número de genes humanos.

A mediados de la década de 1980, Gilbert sugerido
que los humanos podrían tener 100.000 genes, una
estimación basada en el tamaño medio de los pocos
genes humanos conocidos en el momento
(aproximadamente 3x104 pares de nucleótidos) y el
tamaño de nuestro genoma (3x109 pares de
nucleótidos). Hizo un cálculo que produjo un
número con una redondez agradable tal, que terminó
siendo citado ampliamente en artículos y libros de
texto.
Comparación de secuencias de nucleótidos de muchos
vertebrados diferentes revela regiones de alta
conservación

La secuencia de nucleótidos
examinado en este
diagrama es de un pequeño
segmento del gen humano
para una proteína
transportadora de
membrana plasmática.

La secuencia del exón se
conserva en todas las
especies, incluyendo el
pollo y pescado. Tres
bloques de la secuencia del
intrón que se conservan en
los mamíferos, pero no en
la de pollo o pescado, se
muestran en azul. las
funciones de secuencias de
intrones más conservadas
en el genoma humano
(incluyendo estos tres) no
son conocidos.
Tipos de Secuencia
Constitución



Gran % del genoma humano consiste de secuencia repetidas.
Incluyen grandes duplicaciones y repeticiones sencillas.
Los genes ocupan solo el 25% del genoma humano, pero las
secuencias que codifican proteínas son solo una pequeña parte de
esa fracción(1%).
La mayor parte del genoma humano está compuesto de no codificante y secuencias de
nucleótidos repetitivos. Las LINEs, SINEs, transposones similar a retroviral, y los
transposones-ADN son elementos genéticos móviles que se han multiplicado en nuestro
genoma mediante la replicación de sí mismos y la inserción de las nuevas copias en diferentes
posiciones.
Las repeticiones simples son secuencias de nucleótidos cortas (menos de 14 pares de
nucleótidos) que se repiten una y otra vez durante largos períodos. Las duplicaciones de
segmentos son bloques grandes del genoma (1000-200.000 pares de nucleótidos) que están
presentes en dos o más lugares en el genoma.
Las secuencias únicas que no son parte de ningún intrones o exones (verde oscuro) incluyen
elementos reguladores de genes, así como las secuencias cuyas funciones no se conocen.
Los bloques más altamente repetidas de ADN en la heterocromatina aún no se han
secuenciado por completo; por lo tanto, cerca del 10% de las secuencias de ADN humano
que no están representados en este diagrama



SINE (Short Interspersed Nuclear
Elements, elementos nucleares dispersos
cortos): elementos Alu, 250-280
nucleótidos, con unas 1.500.000 copias.
Los LINE (Long Interspersed Nuclear
Elements, o elementos nucleares
dispersos largos) constituyen un 20 por
ciento del genoma humano. Son
secuencias con un con un tamaño de
varias kilobases
Transposones ADN
Organización del Cromosoma
48x106=1,5%
A) El cromosoma 22, uno de los más
pequeños cromosomas humanos,
contiene 48 X 106 pares de nucleótidos
y constituye aproximadamente el 1,5%
de todo el genoma humano. La mayor
parte del brazo izquierdo del
cromosoma 22 se compone de
secuencias cortas repetidas de ADN
que son empacados ​en una forma
particularmente compacta de la
cromatina (heterocromatina).
(B) una expansión de diez veces de una
porción del cromosoma 22 muestra
unos 40 genes. los de color marrón
oscuro se conocen como genes y los
rojos se predice genes.
(C) una porción ampliada de (B) muestra
toda la longitud de varios genes.
(D) el arreglo intrón-exón de un gen típico se
muestra después de una ampliación de
diez veces más. cada exón (rojo) codifica
para una porción de la proteína, mientras
que la secuencia de ADN de los intrones
(gris) es relativamente poco importante.
(Adaptado de la Human Genome Sequencing Consortium International,
Nature 409:860-921, 2001
Proyecto Genoma Humano: ESTADISTICAS

Se estima que el genoma humano contiene en torno a los 20 000-25 000
genes.

Alrededor de un 50 por ciento del genoma humano está constituido por ADN
repetitivo.

Se puede estimar que la densidad media de genes es de 1gen/ 100 kb,
aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por
ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma
Y). Por tanto, se puede deducir una frecuencia media de 10 genes/ Mb de
secuencia.

El tamaño promedio de un gen humano es de 20-30 kb, aunque hay grandes
diferencias de unos genes a otros.

El número de exones que forman un gen es muy variable (desde genes que
tienen un solo exón hasta algunos genes con 100 exones o más), pero podemos
establecer un valor promedio de 7-8 exones/gen.

El tamaño medio de un exón es de 150 nucleótidos. Por lo que respecta a los
intrones, en cambio, existe una enorme variabilidad de tamaños, y no es
infrecuente encontrar en casi todos los genes algún intrón de gran tamaño.

El tamaño medio de un ARNm es de 1,8-2,2 kb incluyendo las regiones notraducidas flanqueantes. La longitud media de una región codificante es de 1,4
kb.
Proyecto Genoma Humano: HALLAZGOS
El rasgo más notable del genoma humano es el pequeño porcentaje que codifica
para proteínas, RNAs estructurales y RNAs catalíticos. Casi la mitad del ADN
restante se compone de elementos genéticos móviles que han colonizado nuestro
largo genoma durante el tiempo evolutivo.
Una segunda característica notable del genoma humano es el tamaño grande del
promedio de los genes (27.000 pares de nucleótidos). Sólo se requieren
alrededor de 1.300 pares de nucleótidos que codifica una proteína de tamaño
medio (unos 430 aminoácidos en los seres humanos). La mayor parte del ADN
que permanece en un gen consiste en largos tramos de ADN no codificadora en
los intrones entre los exones que codifican proteínas relativamente cortos
Además de los intrones y exones, cada gen se asocia con secuencias de ADN
reguladoras que aseguran que el gen se expresa en el nivel y el momento
adecuado, y en el tipo apropiado de célula. En los seres humanos, estas
secuencias de ADN reguladoras están normalmente distribuidos en decenas de
miles de pares de nucleótidos, mucha de la cual parece ser ADN "espaciador". Los
exones y secuencias reguladoras comprenden menos del 2% del genoma
humano.
Otra característica sorprendente del genoma humano es su número relativamente
pequeño de genes. Las estimaciones anteriores habían sido de alrededor de
100.000. Aunque el número exacto todavía no está claro, estimaciones revisadas
indican que el número de genes humanos en alrededor de 25.000, nos compara
al números de genes de animales multicelulares más simples, tales como
Drosophila (14.000), C. elegans (19.000).
Proyecto Genoma Humano:
búsqueda del número de genes
Si a una secuencia la leemos de a tripletes solo hay 3 posibles caminos de la
traducción a aminoácidos. Estas posibilidades se llaman marcos de lectura
En ADN genómico: cuando se busca en el recuento teórico del
número de genes se tuvieron se buscaron el número de ORFs
(open reading frames): secuencias de 100 codones comprendida
entre un codón de inicio (AUG) de la traducción y un codón de
terminación, descontando las secuencias que corresponden a los
intrones en caso de haberlas. Se encuentra acotado por los UTRs,
o secuencias no traducidas. Existen programas que son usados
para la búsqueda de ORFs, los cuales se inician con el codón
ATG, y terminan con un codón de terminación TAA, TAG, o TGA.
POLIMORFISMO / SNP






Se llama polimorfismo genético a la coexistencia
de múltiples alelos en un locus de una población.
Un locus es polimorfico cuando esta presente
>1% en una población.
Cuando 2 alelos se comparan y hay solo 1 nt de
diferencia se llama SNP, (pronunciado como
snips) (single nucleotide polymorphisms).
Hay mas de 10 millones de SNP
Se han identificado mas de 6 millones de SNP
Hay 1 SNP/1330 pb.
Los Polimorfismos de un solo nucleótido (SNPs) son
secuencias en el genoma que difieren en un solo par de
nucleótidos entre una porción de la población y otra.
Proyecto Genoma Humano:
Individualidad Genética
No hay 2 personas iguales (excepto gemelos)
Cuando se compra la misma región del genoma en 2
personas difiere en 0,1%  3 millones de diferencias en
el genoma
La mayoría son de un único cambio de nucleótidos
llamados SNPs
La gran ventaja de los SNP sobre los demás tipos de
marcadores, además de ser tan abundantes y estar muy
uniformemente distribuidos por todo el genoma humano, es la
posibilidad de analizarlos mediante métodos automatizables a
gran escala, como los microarrays
Proyecto Genoma Humano:
Individualidad Genética
Otro importante origen de la
variación heredadas de nuestros
ancestros es la duplicación y
deleción de grandes blocks de
DNA. Cuando el genoma de
cualquier persona es comparada
con el genoma de referencia
estándar se observa al menos
100 diferencias que involucran
grandes blocks de secuencia.
Algunas de estas diferencias son
muy comunes, sin embargo
otras estas presentes en una
pequeña minoría de la
población.
En un estudio, por ejemplo, los
investigadores compararon el
genoma de un ser humano "normal"
con la secuencia original generada
por el Proyecto Genoma Humano y
encontraron que se diferenciaban por
297 variantes estructurales de
segmentos de tamaño intermedio (8
kilobases): 139 inserciones, 102
deleciones y 56 inversiones.
Este es un nivel notable e inesperado
de la variación genómica a gran
escala
¿El genoma humano es patentable?
El 11 de Noviembre de 1997, la UNESCO aprobó
la DECLARACIÓN UNIVERSAL SOBRE GENOMA
HUMANO Y LOS DERECHOS DEL HOMBRE,
fijando tres principios:

La dignidad del individuo cualesquiera sean sus
características genéticas.

Rechazo al determinismo genético.

El Genoma Humano es PATRIMONIO DE LA
HUMANIDAD.
Controversias éticas
El conocimiento del genoma humano tiene también
diversas implicaciones éticas, jurídicas y sociales,
estimulando un debate internacional sobre algunos
aspectos:

Patentar secuencias de genes humanos para uso
comercial.

Confidencialidad en la información obtenida, como
por ejemplo, poner la información sobre genética
humana a disposición de empresas de seguros.

La libertad a no saber si se es o no portador de una
enfermedad genética.
EN RESUMEN:
GENOMA HUMANO
Longitud del ADN
Número de genes
3,2x109 pb
Gen mas largo
2,4 x106 pb
 25.000
Tamaño medio de gen
Menor nº de exones /gen
Mayor nº de exones /gen
Nº medio de exones /gen
27.000 pb
1
178
10,4
Tamaño del exón mas largo
17.106 pb
Tamaño medio de exon
Nº de pseudogenes
% de la secuencia del DNA en los exones
(secuencias que codifican proteínas
% de la secuencia del DNA en secuencias
altamente conservadas*
% de DNA elementos altamente repetitivos
*: incluye
145 pb
Mas de 20.000
1,5%
3,5%
 50%
DNa que codifica 5’ y 3’ UTRs (untranslated regions of mRNAs), genes de RNAs estructural y
cataliticos, regiones regulatorias de ADN y regiones conservadas de función desconocidas.
Polimorfismo y Mutación
Cuando la frecuencia alelica, del alelo
más raro es del uno por ciento o
mayor, ese locus se llama locus
polimórfico, y esa variación se
denomina polimorfismo.
 Cuando la variación es menos
frecuente es una mutación, es más
grave y desencadenan una
enfermedad

Human Gene Mutation
Database
(HGMD)

http://www.hgmd.org/
Número Total de
Mutaciones
Missense/nonsense
Splicing
9%
2%
56%
Regulatory
Small deletions
15%
Small insertions
Gross deletions
6%
5%
7%
Small indels, Repeat variations, Gross
insertions/duplications, Complex
rearrangements
Total: 148.413 mutaciones informadas 24-06-14
Espectro de diferentes tipos de mutaciones en
genes humanos
(Human Gene Mutation Database)
Mutaciones sin sentido
Mutaciones con cambio de sentido

14.363 mutaciones en 783 genes
Espectro de diferentes tipos de mutaciones en
genes humanos
(Human Gene Mutation Database)
24-6-14
Complex rearrangements
1504
Gross
insertions/duplications
2600
Repeat variations
434
Small indels
2173
Gross deletions
10963
Small insertions
9423
Small deletions
22610
Regulatory
2884
Splicing
13641
 Single base pair substitutions
Missense/nonsense
82176
Mutaciones sin sentido/con cambio de sentido
Mutaciones Puntuales
Hay de 2 TIPOS:
 La clase más común es la transición
de una pirimidina por otra pirimidina.
O de una purina por otra purina.
 La menos común es la transversión en
la cual una purina reemplaza a una
pirimidina o viceversa

80%
Missense (Mutaciones con
cambio de sentido)
Nonsense (Mutaciones sin
sentido)
20%
Mutaciones Puntuales: Sustituciones de una
única par de base en genes que causan
enfermedades hereditarias
Hotspots
Son regiones del genoma donde la
frecuencia de las mutaciones esta
incrementada en al menos 1 orden
de magnitud.
 Una causa es la metilación de 5metil-citosinatimidina
 En los hotspots (5-CH -C) la mutación
es una transición de G-C por A-T

3
DELECIONES DE GENES



Las deleciones son responsables de mas
500 enfermedades hereditarias en
humanos.
Y estas deleciones pueden ser clasificadas
en base a la longitud del ADN
delecionado.
Algunas deleciones consiste de solo unas
pocas pares de bases hasta varias cientos
de kilobases
DELECIONES DE GENES



2,5 a 5% de pacientes con hemofilia A
son debidos a deleciones en el gen F8C
(Factor VIII) con perdida de 26 exones de
un longitud 186 Kb
84% de los pacientes con deficiencia
sulfatasa esteroidal (STS), con perdida de
10 exones de una longitud de 146 kb de
ADN genómico.
Grandes deleciones son comunes en la
distrofia muscular de Duchenne, GH,
RLDL y el gen de 1-globina
PEQUEÑAS
DELECIONES

Existe un total
de 2.368
deleciones de
genes
causantes de
enfermedades
con una
longitud de 20
bp o menos
Espectro de diferentes tipos de mutaciones en
genes humanos
(Human Gene Mutation Database)
24-6-15
Complex rearrangements
1504
Gross
insertions/duplications
2600
Repeat variations
434
Small indels
2173
Gross deletions
10963
Small insertions
9423
Small deletions
22610
Regulatory
2884
Splicing
13641
 Single base pair substitutions
Missense/nonsense
82176
Mutaciones sin sentido/con cambio de sentido
MUTACIONES PUNTUALES
En la región regulatoria
 En el splicing
 Sin sentido (nonsense)
 Con cambio de sentido (missense)

Estrategias en el laboratorio
de Biología Molecular






Grandes Deleciones
Southern Blotting
Microsatellites and
SNPs
GAP-PCR
MAPH and MLPA
Long-range PCR

Mutaciones Puntuales y
deleciones pequeñas

RFLP-PCR(ER-PCR)
Mutagenesis mediada
por PCR
Alelo-Específicas:
MAS-PCR
ARMS- MARMS
DOT-ASO





Estrategias en el laboratorio
de Biología Molecular II

Desconozco la mutación o polimorfismo
SSCP
(single strand conformation polymorphism)
 DGGE
(Denaturing Gradient Gel Electrophoresis)

SSCP


SSCP (single strand conformation
polymorphism) es un método simple y
accesible para detectar alteraciones en la
secuencia en un fragmento obtenido por
PCR
Fundamento: se basó en el hecho de que
los fragmentos de ADN de una sola hebra
relativamente cortos pueden migrar en un
gel no desnaturalizante no sólo de su
tamaño sino también por su secuencia.
Pasos



Amplificación: La muestra se enriquece en
ssADN por medio de una PCR asimétrica (uno de
los primers esta en mayor cantidad que el otro).
Los fragmentos de ADN amplificados se someten
a la desnaturalización con calor o agentes
químicos, tales como formamida.
Posteriormente, los fragmentos de ADN
desnaturalizados se someten a electroforesis a
través de un gel de poliacrilamida no
desnaturalizante.
El carril 1 corresponde al patrón WT para cualquier locus
dado analizado.
2- Control homocigota para la mutación A y 4- para la B
3- corresponde a un caso heterocigotos A
5- doble heterocigota para las mutaciones A y B,
6-Homocigota pequeña delecion .
7- Heterocigotos y homocigotos para una pequeña
deleción.
8- Heterocigotos para una pequeña inserción.
Inserción 
Delecion 
DGGE (Denaturing Gradient
Gel Electrophoresis)
Los productos de PCR son
cargados en un gel con un
gradiente desnaturalizante
simple complejo
20%
Típicamente 20-80%
formamida
ADN doble cadena migra
hasta encontrar su melting
El melting es determinado
por su secuencia y
contenido de GC
80%
Las diferentes secuencias
migran a diferentes
distancias
• DESNATURALIZACIÓN DEL DNA
1. Composición de bases
2. Longitud DNA doble
3. Presencia de agentes
desnaturalizantes
Agentes desnaturalizantes.
Formamida: Baja la T° de melting a 0,72°C cada 1%
DGGE (Denaturing Gradient
Gel Electrophoresis) II
Ventajas
Puedo cortar las bandas y
secuenciar
Puedo detectar pequeñas
diferencias en la secuencia de DNA
 Desventajas
 Puede haber complejidad en el
chorreado de las muestras
 Requiere una aparatología
específica
TUBOS EPPENDORF
200 l
500 l
1,5ml
Pipetas Automáticas
P-1000
100-1000 l
P-200
20-200 l
P-100
10-100 l
P-10
0,5-10 l
Termocicladores
Extracción de ADN

Todos los alumnos harán una
extracción de muestra de sangre por
punción venosa.
Bibliografía
Eric D. Green: The Human Genome
Project and Its Impact on the Study of
Human Disease
 Stylianos E. Antonarakis, Michael
Krawczak, David N. Cooper: The
Nature and Mechanisms of Human Gene
Mutation
