Download N - USC

Document related concepts

Transcripción genética wikipedia , lookup

Ácido ribonucleico wikipedia , lookup

Transcriptasa inversa wikipedia , lookup

Ácido desoxirribonucleico wikipedia , lookup

Historia de la biología del ARN wikipedia , lookup

Transcript
CURSO de VERANO 2009:
LA BIOINFORMÁTICA COMO PUENTE ENTRE LA GENÉTICA Y
SUS APLICACIONES INDUSTRIALES Y BIOMÉDICAS
Introducción a la genética y la
biología molecular
Dr. Manel Vera Rodríguez
([email protected])
Breve historia de la genética:
• 1865: G.J. Mendel presenta sus experimentos con guisantes que muestran los
principios de la herencia
• 1888: W. Waldeyer acuña el término de cromosoma
• 1900: H. de Vries, C. Correns y E. von Tschermak redescubren la leyes de
Mendel
• 1905: Bateson da el nombre de genética a la disciplina
• 1908: Hardy y Weinberg formulan el principio de la genética de poblaciones
• 1910: Morgan descubre la mutación white (ojo blanco) y la herencia ligada al
sexo en Drosophila
• 1941: G.W. Beadle & E.L. Tatum proponen el concepto 1gen-1enzima
• 1944: Avery demuestra que el ADN es el material hereditario
• 1953: Watson y F. Crick describen la estructura en doble hélice del ADN
• 1958: M.S. Meselson y F.W. Stahl demuestran que la replicación del ADN es
semiconservativa
• 1968: Okazaky y colaboradores demuestran la síntesis discontínua de la
cadena retardada de ADN
• 1974: R.D. Kornberg describe la estructura de la cromatina (nucleosomas)
• 1978: W. Gilbert acuña los términos intrón y exón
• 1986: Saiki, K.B. Mullis y colaboradores describen la Reacción en Cadena de la
Polimerasa (PCR)
• 1990: Empieza el proyecto Genoma Humano
• 1995: Primer organismo unicelular secuenciado: Haemophilus influenzae
• 1996-1997: I. Wilmut y K. Campbell clonan el primer mamífero (oveja Dolly)
Historia de la genética
Qué es el ADN?
Definición:
El Ácido DesoxiriboNucleico (ADN) es el portador de la
información genética en las células, compuesto por dos cadenas
complementarias de nucleótidos enrolladas en una doble hélice,
capaz de autorreplicarse y de dirigir la síntesis de ARN.
DNA (nomenclatura inglesa): DeoxiriboNucleic Acid
•
•
•
•
•
•
•
•
•
•
•
La estructura del ADN
El monómero del ADN es un nucleótido.
Los nucleótidos están formados por un azúcar
(desoxi-ribosa), una base nitrogenada y un grupo
fosfato.
Los componentes del nucleótido están unidos por
fuertes enlaces covalentes (fosfodiester).
Las bases son purinas (Guanina y Adenina) y
pirimidinas (Citosina y Timina).
La estructura del ADN está formada por 2 cadenas
complementarias.
Las 2 cadenas están orientadas en direcciones
opuestas, quedando en cada una un extremo 5’
(fosfato) y un extremo 3’ (hidroxilo).
La unión entre las 2 cadenas se realiza mediante
enlaces de hidrógeno entre 2 bases (1 de cada
cadena), formando un “par de bases”.
La Adenina se une siempre a la Timina mediante 2
enlaces. La Guanina se une siempre a la Citosina
mediante 3 enlaces.
Los grupos hidroxilo libres del fosfato son los que dan
una fuerte carga eléctrica negativa y el carácter ácido
a la molécula
La molécula de ADN se enrrolla en la forma de una
doble hélice.
Por cada 10 pares de bases, la molécula gira 360º. La
estructura recuerda a una escalera de caracol.
La estructura del ADN
Estructura del ADN
Genes y Genomas
•
Un gen es un fragmento de ADN
que contiene la información
necesaria (en forma de secuencia
de bases) para codificar la
síntesis de una proteína o un
ARN. Podemos considerar a un
gen como una unidad de
información.
•
No todo el material genético de un
organismo está organizado en
genes. Existe ADN no codificante.
En las células humanas
solamente el 3% del ADN da lugar
a la síntesis de proteínas
•
El genoma de un organismo es el
conjunto de material genético que
contienen sus células.
Tamaño de los genomas
•
El virus más pequeño contiene poco más de 4.000 pares de bases.
Una bacteria contiene como media 5.106 pares de bases (5.000
Kb o 5 Mb) (2 m de longitud).
•
Como norma general las bacterias (células procariotas) contienen
una sola molécula de ADN circular, mientras que las células
eucarióticas (animales y vegetales) contienen varias moléculas de
ADN lineal organizadas en cromosomas.
•
Una célula humana contiene 3.000 Mb distribuidas en 46
cromosomas. Cada cromosoma contiene una molécula lineal de
ADN.
Tamaño de los genomas
Tamaño Genoma
Organismo
(pares de bases)
Fago λ
5×104
Escherichia coli
4×106
Levadura
2×107
Caenorhabditis elegans
8×107
Drosophila melanogaster
2×108
Humano
3×109
Organización del material
genético
• El material genético de las células
procarióticas se organiza
habitualmente en 1 sólo cromosoma
que contiene una molécula de ADN
circular.
• El material genético de las células
eucarióticas se organiza en
cromosomas. Cada uno está
formado por una mólecula de ADN
en doble hélice lineal asociado a
proteínas básicas (histonas)
formando la cromatina.
Estructura del cromosoma eucariota
Mitosis
Definición: División celular caracterizada por la replicación de los
cromosomas y la formación de dos núcleos hijos idénticos entre sí
(cariocinesis), seguido de la partición del citoplasma (citocinesis),
para formar dos células hijas. Tiene cuatro fases:
Mitosis
Animación Mitosis
Cariotipo
Definición: ordenamiento de los cromosomas de una célula metafásica
de acuerdo a su tamaño y morfología.
A: Metacéntricos grandes
B: Submetacéntricos grandes
C: Submetacéntricos medianos
D: Acrocéntricos medianos
E: Submetacéntricos pequeños
F: Metacéntricos pequeños
G: Acrocéntricos pequeños
Par sexual
Cariotipo humano:
2n= 46 (Diploide= doble dotación cromosómica, cromosomas por pares)
23 pares de cromosomas homólogos
Cariotipo
El cariotipo es característico de cada especie
Qué es el ARN?
Definición:
El Ácido RiboNucleico (ARN) se distingue del ADN por la
presencia del azúcar ribosa y la pirimidina Uracilo; incluye ARN
mensajero (ARNm), ARN de transferencia (ARNt) y ARN
ribosómico (ARNr). También es el material genético de muchos
virus, llamados retrovirus.
RNA (nomenclatura inglesa): RiboNucleic Acid
Estructura del ARN
•
•
•
•
•
•
El ARN (ácido ribonucleico) contiene
ribosa en lugar de desoxi-ribosa.
Está formado por las mismas bases
nitrogenadas, excepto la Timina que
se sustituye por Uracilo.
El Uracilo es también complementario
de la Adenina.
A diferencia del ADN está formado
por una única cadena de
nucleótidos.
La longitud de la cadena es mucho
menor que en el ADN.
Se pueden formar enlaces entre
bases complementarias dentro de la
misma cadena, lo que origina
estructuras tridimensionales
complejas.
Tipos de ARN
TIPO
ABUNDANCIA
Nº BASES
FUNCION
ARNr
Ribosómico
80%
120-3500
Estructura de
los ribosomas
ARNt
Transferencia
15%
75
Transporte de
aminoácidos
ARNm
Mensajero
5%
variable
Síntesis de
proteínas
Dogma fundamental de la
biología molecular
Cómo es el flujo de información genética en los seres vivos.
Tres procesos fundamentales:
Replicación
Transcripción
ADN
Traducción
ARN
Transcripción inversa
(retrovirus)
PROTEÍNAS
De los genes a las proteínas
La replicación del ADN
La replicación del ADN
Conservativa
Semiconservativa
Dispersiva
Esquema Experimentos Meselson y Stahl (1958)
La replicación del ADN
•
Catalizada por una ADNpolimerasa que añade nucleótidos
al extremo 3’-OH de la cadena
naciente (sentido polimerización=
5’ a 3’).
•
La ADN-polimerasa necesita un
cebador de ARN.
•
Los nucleótidos se añaden por
emparejamiento complementario
con las bases de la cadena molde.
•
Los sustratos, desoxiribonucleótido trifosfato (dNTP) se
hidrolizan al añadirse, liberando
energía para la síntesis del ADN.
•
Existen diversas proteínas que
colaboran en la replicación.
DNA pol
ARN
cebador
La replicación del ADN
Transcripción
• La síntesis del ARNm la
realiza una ARN polimerasa
en dirección 5’--> 3’.
• Los ribonucleótidos se
añaden por emparejamiento
complementario con las
bases de la cadena molde de
ADN.
• La presencia de Adenina en
el ADN determina la adición
de un Uracilo en el ARN.
Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing
Transcripción
Eucariotas
Procariotas (bacterias)
Características
generales de la
transcripción
Cada gen codifica proteínas y por
ende, cada molécula de mRNA
transcrita, codifica un único
polipéptido: mRNA monocistrónico
La transcripción y la traducción son
procesos secuenciales que ocurren
en el núcleo y el citoplasma,
respectivamente
Una única molécula de mRNA puede
codificar varios polipéptidos: mRNA
policistrónico
La traducción y la transcripción ocurren
en forma acoplada en el mismo (único)
compartimento celular
RNA
polimerasas
involucradas
Hay 3 polimerasas diferentes:
-RNA polimerasa I: precursor del
rRNA que formará las subunidades
de los ribosomas (28S, 5,8S y 18S). RNA polimerasa II: mRNA y
algunos snRNA.
- RNA polimerasa III: tRNA, un
tipo de rRNA (5S) y una variedad de
RNA pequeños
Hay una sola RNA polimerasa que cataliza
la biosíntesis de los tres tipos de RNA:
mRNA, tRNA y rRNA
Secuencias
reguladoras de
la
transcripción
Hay múltiples regiones de control.
Algunas secuencias están cerca del
sitio de inicio (caja TATA) y otras
más distantes
Hay 2 secuencias (denominadas
secuencias consenso) a -10 y -35 pares de
bases desde el sitio de inicio de la
transcripción
A partir de Curtis, Barnes, Schnek & Massarini. Biología. 7ª ed. Editorial Médica Panamericana
La transcripción en procariotas
• Los genes que codifican proteínas involucradas en la misma
ruta metabólica suelen presentarse agrupados en el
cromosoma, formando operones, lo que permite la expresión
coordinada.
• Una región reguladora adyacente al operón, determina su
transcripción- es el “operador”.
• Proteínas reguladoras funcionan con los operadores, para
controlar la transcripción de los genes.
La transcripción en eucariotas
•
•
•
•
•
•
•
La Cromatina limita el acceso de las proteínas reguladoras a los
promotores.
Existen factores proteicos que deben reorganizar la cromatina.
Las RNA polimerasas I, II y III transcriben rRNA, mRNA y tRNA,
respectivamente.
Las 3 polimerasas interaccionan con los promotores a través de los
“factores de transcripción”.
La “TATA box” (TATAAA) es un promotor “consenso”.
Los factores de transcripción reconocen secuencias promotoras
específicas e inician la transcripción (algunos factores se unen a
secuencias específicas en la región codificante del gen).
Además de promotores, los genes eucariotas tienen “enhancers”, o
“upstream activation sequences”.
Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing
Estructura del gen eucariota
•
•
•
•
•
Los genes eucariotas están
divididos en exones (se
traducen a aminoácidos) e
intrones (no codificantes).
Ejemplos: El gen de la actina
tiene un intrón de 309-pb que
separa los primeros 3
aminoácidos de los restantes
350.
El gen del colágeno pro-alpha2 del pollo, mide 40-kb, con 51
exones que suman sólo 5 kb.
Los exones suelen medir entre
45 y 249 bases.
El mecanismo por el que se
escinden los intrones y por el
que se unen los exones, es
complejo y muy preciso (“RNAsplicing”)
Estructura del gen eucariota
Maduración RNAm en eucariotas
Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing
Transcripción y maduración RNAm
Traducción del mensaje
genético
• La información contenida en la secuencia de bases del ADN
es trasladada o traducida a una secuencia de aminoácidos en
una proteína, a través del ARN que actúa como intermediario
Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing
Las proteínas
Aminoácidos que forman las proteínas
Alanina
Ala
A
Isoleucina
Ile
I
Arginina
Arg
R
Leucina
Leu
L
Asparragina
Asn
N
Lisina
Lys
K
Aspártico
Asp
D
Metionina
Met
M
Cisteína
Cys
C
Prolina
Pro
P
Fenilalanina
Phe
F
Serina
Ser
S
Glicina
Gly
G
Tirosina
Tyr
Y
Glutámico
Glu
E
Treonina
Thr
T
Glutamina
Gln
Q
Triptófano
Trp
W
Histidina
His
H
Valina
Val
V
No polar Polar Alcalino Ácido
Las proteínas
Aminoácidos que forman las proteínas
Alanina
Ala
A
Isoleucina
Ile
I
Arginina
Arg
R
Leucina
Leu
L
Asparragina
Asn
N
Lisina
Lys
K
Aspártico
Asp
D
Metionina
Met
M
Cisteína
Cys
C
Prolina
Pro
P
Fenilalanina
Phe
F
Serina
Ser
S
Glicina
Gly
G
Tirosina
Tyr
Y
Glutámico
Glu
E
Treonina
Thr
T
Glutamina
Gln
Q
Triptófano
Trp
W
Histidina
His
H
Valina
Val
V
No polar Polar Alcalino Ácido
Aa esenciales
(obtenidos de la dieta)
Síntesis de proteínas
•
•
•
•
•
La síntesis transcurre desde
el extremo N-terminal al
extremo C-terminal.
Los ribosomas leen el ARNm
en la dirección 5’--3’.
La traducción tiene lugar en
polirribosomas o polisomas.
Hay más de un ribosoma
traduciendo cada ARNm
simultáneamente.
La elongación de la cadena
proteica tiene lugar por
adición secuencial de
aminoácidos al extremo Cterminal.
El ARNt tiene en el extremo 3’
el lugar de unión del aa, y en
uno de sus bucles el
anticodón complementario al
codón del ARNm
Garret & Grisham. Biochemistry 2ª ed. Saunders College Publishing
Síntesis de proteínas
Initiation
El código genético
•
•
•
•
Cada aminoácido está
codificado por una secuencia
de 3 nucleótidos en el ARNm
llamada codón.
Las combinaciones de las 4
bases tomadas de 3 en 3
originan 64 posibles
permutaciones.
Puesto que solamente existen
20 aminoácidos formando
parte de las proteínas, el
código es redundante o
degenerado: existen codones
sinónimos.
Existe además un codón que
marca el inicio de una
proteína y 3 codones que
marcan el fin.
El código genético
ORIGIN (Ribonucleasa pancreática bovina)
1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
//
ggcagaaact
gtgcggtcat
tgctggtgcg
agcacatgga
agagccggaa
tggctgatgt
attgctacca
agtaccccaa
agggaaaccc
agagcagcaa
gtcctggggg
cacacacaca
aacccacact
ggttgtgagg
accacctgaa
gccttctctc
catggctctg
ggtccagcct
ctccagcact
cctgaccaaa
ccaggccgtg
gagctactcc
ctgtgcctac
gtacgtgcca
gatgcaccac
caatagctca
ggattccctg
tgctcccctg
tgggacctgt
aaaaaaaaaa
tctcagacat
aagtccctgg
tccctgggca
tccgctgcca
gatcgatgca
tgctcccaga
accatgagca
aagaccaccc
gtccactttg
ttcatcacaa
agttagttag
gcatgaaagc
gcctgagtct
gttaaccaaa
aaaa
caaactagag
tcctgttgtc
aggaaactgc
gcagctccaa
agccagtgaa
aaaatgttgc
tcaccgactg
aggcgaataa
atgcttcagt
aggcacctgc
ggctcttatc
aataactcaa
tgcccctggt
tcactgcttc
acccaggttt
gctgttggtc
agcagccaag
ctactgtaac
cacctttgtg
ctgcaagaat
ccgtgagacc
acacatcatt
gtaggtctct
ctctcccctc
tctgcgcacc
gctagttaag
ggtttggggg
tttcaataaa
ctccagggga
ctggtgctgc
tttgagcggc
cagatgatga
cacgagtccc
gggcagacca
ggcagctcca
gtggcttgtg
acctaaggcc
atgtttcctt
ttaccagaaa
tcttctatcc
gtgaggagtg
catacttgca
El código genético
ORIGIN (Ribonucleasa pancreática bovina)
1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
//
ggcagaaact gccttctctc tctcagacat caaactagag acccaggttt ctccagggga
gtgcggtcat catggctctg aagtccctgg tcctgttgtc gctgttggtc ctggtgctgc
tgctggtgcg ggtccagcct tccctgggca aggaaactgc agcagccaag tttgagcggc
agcacatgga ctccagcact tccgctgcca gcagctccaa ctactgtaac cagatgatga
agagccggaa cctgaccaaa gatcgatgca agccagtgaa cacctttgtg cacgagtccc
tggctgatgt ccaggccgtg tgctcccaga aaaatgttgc ctgcaagaat gggcagacca
attgctacca gagctactcc accatgagca tcaccgactg ccgtgagacc ggcagctcca
agtaccccaa ctgtgcctac aagaccaccc aggcgaataa acacatcatt gtggcttgtg
agggaaaccc gtacgtgcca gtccactttg atgcttcagt gtaggtctct acctaaggcc
agagcagcaa
gatgcaccac ttcatcacaa aggcacctgc ctctcccctc atgtttcctt
CDS
72..524
gtcctggggg
caatagctca agttagttag ggctcttatc tctgcgcacc ttaccagaaa
/gene="RNASE1"
cacacacaca
ggattccctg gcatgaaagc
aataactcaa gctagttaag tcttctatcc
/note="ribonuclease
A (pancreatic)"
aacccacact
tgctcccctg gcctgagtct tgcccctggt ggtttggggg gtgaggagtg
/codon_start=1
ggttgtgagg
tgggacctgt gttaaccaaa tcactgcttc tttcaataaa catacttgca
/product="ribonuclease"
accacctgaa
aaaaaaaaaa aaaa
/protein_id="NP_001014408.2"
/db_xref="GI:68299789"
/db_xref="GeneID:282340"
/translation="MALKSLVLLSLLVLVLLLVRVQPSLGKETAAAKFERQHMDSSTS
AASSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSY
STMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASV"
El código genético
ORIGIN (Ribonucleasa pancreática bovina)
1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
//
ggcagaaact gccttctctc tctcagacat caaactagag acccaggttt ctccagggga
gtgcggtcat catggctctg aagtccctgg tcctgttgtc gctgttggtc ctggtgctgc
tgctggtgcg ggtccagcct tccctgggca aggaaactgc agcagccaag tttgagcggc
agcacatgga ctccagcact tccgctgcca gcagctccaa ctactgtaac cagatgatga
agagccggaa cctgaccaaa gatcgatgca agccagtgaa cacctttgtg cacgagtccc
tggctgatgt ccaggccgtg tgctcccaga aaaatgttgc ctgcaagaat gggcagacca
attgctacca gagctactcc accatgagca tcaccgactg ccgtgagacc ggcagctcca
agtaccccaa ctgtgcctac aagaccaccc aggcgaataa acacatcatt gtggcttgtg
agggaaaccc gtacgtgcca gtccactttg atgcttcagt gtaggtctct acctaaggcc
agagcagcaa
gatgcaccac ttcatcacaa aggcacctgc ctctcccctc atgtttcctt
CDS
72..524
gtcctggggg
caatagctca agttagttag ggctcttatc tctgcgcacc ttaccagaaa
/gene="RNASE1"
cacacacaca
ggattccctg gcatgaaagc
aataactcaa gctagttaag tcttctatcc
/note="ribonuclease
A (pancreatic)"
aacccacact
tgctcccctg gcctgagtct tgcccctggt ggtttggggg gtgaggagtg
/codon_start=1
ggttgtgagg
tgggacctgt gttaaccaaa tcactgcttc tttcaataaa catacttgca
/product="ribonuclease"
accacctgaa
aaaaaaaaaa aaaa
/protein_id="NP_001014408.2"
/db_xref="GI:68299789"
/db_xref="GeneID:282340"
/translation="MALKSLVLLSLLVLVLLLVRVQPSLGKETAAAKFERQHMDSSTS
AASSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTNCYQSY
STMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASV"
El código genético
N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C
pautas 3
de
2
N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C
lectura 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C
(ORF’s)
sentido de lectura para la secuencia de la cadena superior
DNA
5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’
3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’
sentido de lectura para la secuencia de la cadena inferior
pautas
de
lectura
(ORF’s)
-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N
-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N
-3
C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N
(ORF’s: Open Reading Frame, pauta abierta de lectura)
El código genético
N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C
pautas 3
de
2
N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C
lectura 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C
(ORF’s)
sentido de lectura para la secuencia de la cadena superior
DNA
5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’
3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’
sentido de lectura para la secuencia de la cadena inferior
pautas
de
lectura
(ORF’s)
-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N
-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N
-3
C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N
(ORF’s: Open Reading Frame, pauta abierta de lectura)
El código genético
N- ile leu phe arg val ile arg pro ... thr arg asn phe thr ... arg -C
pautas 3
de
2
N- tyr phe ile ser ser asn ser thr leu asn ala lys leu his leu thr -C
lectura 1 N- leu phe tyr phe glu ... phe asp leu lys arg glu thr ser leu asn -C
(ORF’s)
sentido de lectura para la secuencia de la cadena superior
DNA
5’- TTATTTTATTTCGAGTAATTCGACCTTAAACGCGAAACTTCACTTAAC –3’
3’- AATAAAATAAAGCTCATTAAGCTGGAATTTGCGCTTTGAAGTGAATTG –5’
sentido de lectura para la secuencia de la cadena inferior
pautas
de
lectura
(ORF’s)
-1 C- ... lys ile glu leu leu glu val lys phe ala phe ser ... lys val -N
-2 C- ile lys asn arg thr ile arg gly ... val arg phe lys val ... arg -N
-3
C- asn ... lys ser thr asn ser arg leu arg ser val glu ser leu ser -N
(ORF’s: Open Reading Frame, pauta abierta de lectura)
Mutaciones
Variabilidad genética
Las mutaciones son el proceso principal
para crear variabilidad genética.
Definición: Cambios entre los individuos
para un determinado gen o carácter. Si
existen diferentes variantes de un mismo
gen, se dice que es “polimórfico”, si no hay
variabilidad el gen es “monomórfico”.
Variabilidad genética
SNPs
•
•
•
•
•
Los SNPs o “polimorfismos de nucleótido único” son
variaciones de la secuencia de bases de una región del
genoma, que afectan a un único nucleótido.
Para ser considerado un SNP debe ocurrir en al menos un 1%
de la población.
Los SNPs proporcionan el 90% de la variación genética
humana y ocurren cada 100 o 300 bases a lo largo de todo el
genoma (tanto en regiones codificantes como no codificantes).
2 de cada 3 SNPs corresponden a la sustitución de C por T.
Una gran parte no tienen efecto alguno sobre las funciones
celulares, pero algunos pueden producir alteraciones o
cambios diversos.
SNPs y Haplotipos
• Un determinado número de SNPs en una región concreta, crea
un haplotipo (diferentes secuencias que puede tener un
fragmento concreto de ADN).
 Cada haplotipo contiene SNPs característicos.
 Mapa de Haplotipos (Hap Map): mapa de los haplotipos y
los SNPs que los caracterizan.
 Está permitiendo la identificación de genes y variaciones
que afectan a la salud humana.
Haplotipos
[
[
#ATcs1
#ATcs2
#ATcs3
#ATcs4
1
1234567890
ATTTTTCAGC
ATTTTTCAGC
ATTTTTCAGC
ATTTTTCAGC
1111111112
1234567890
TATGTACAAT
TATGTACAAT
TATGTACAAT
TATGTACAAT
2222222223
1234567890
AACAATTGTT
AACAATTGTC
AACAATTGTT
AACAATTGTT
3333333334
1234567890
GTACCTTGCT
GTACCTTGCT
GTACCTTGCT
GTACCTTGCT
4444444445
1234567890
AACCCAATGT
AACCCAATGT
AACCCAATAT
AACCCAATGT
5555555556
1234567890
TATACTACAT
TATACTACAT
TATACTACAT
TATACTACAT
6666666667
1234567890
CTATGTATAA
CTATGTATAA
CTATGTATAA
CTATGTATAG
7777777778 ]
1234567890 ]
TATTACATAT
TATTACATAT
TATTACATAT
TATTACATAT
[
[
[
#ATcs1
#ATcs2
#ATcs3
#ATcs4
8888888889
1234567890
TATGTATTTA
TATGTATTTA
TATGTATTTA
TATGTATTTA
1
9999999990
1234567890
CCCATATATA
CCCATATATA
CCCATATATA
CCCATATATA
1111111111
0000000001
1234567890
TAATATAGCA
TAATATAGCA
TAATATAGCA
TAATATAGCA
1111111111
1111111112
1234567890
TG-TGAGTAG
TG-TGAGTAG
TGATGAGTAG
TG-TGAGTAG
1111111111
2222222223
1234567890
TACATCATAT
TACATCATAT
TACATCATAT
TACATCATAT
1111111111
3333333334
1234567890
GTATTATCAA
GTATTATCAA
GTATTATCAA
GTATTATCAA
1111111111
4444444445
1234567890
CATTAGTGAA
CATTAGTGAA
CATTAGTGAA
CATTAGTGAA
1111111111 ]
5555555556 ]
1234567890 ]
TTTAACCCCT
CTTAACCCCT
TTTAACCCCT
TTTAACCCCT
Haplotipos
[
[
#ATcs1
#ATcs2
#ATcs3
#ATcs4
1
1234567890
ATTTTTCAGC
..........
..........
..........
1111111112
1234567890
TATGTACAAT
..........
..........
..........
2222222223
1234567890
AACAATTGTT
.........C
..........
..........
3333333334
1234567890
GTACCTTGCT
..........
..........
..........
4444444445
1234567890
AACCCAATGT
..........
........A.
..........
5555555556
1234567890
TATACTACAT
..........
..........
..........
6666666667
1234567890
CTATGTATAA
..........
..........
.........G
7777777778 ]
1234567890 ]
TATTACATAT
..........
..........
..........
[
[
[
#ATcs1
#ATcs2
#ATcs3
#ATcs4
8888888889
1234567890
TATGTATTTA
..........
..........
..........
1
9999999990
1234567890
CCCATATATA
..........
..........
..........
1111111111
0000000001
1234567890
TAATATAGCA
..........
..........
..........
1111111111
1111111112
1234567890
TG-TGAGTAG
..-.......
..A.......
..-.......
1111111111
2222222223
1234567890
TACATCATAT
..........
..........
..........
1111111111
3333333334
1234567890
GTATTATCAA
..........
..........
..........
1111111111
4444444445
1234567890
CATTAGTGAA
..........
..........
..........
1111111111 ]
5555555556 ]
1234567890 ]
TTTAACCCCT
C.........
..........
..........
Haplotipos y variabilidad
• La variación de la secuencia de bases en un gen determinado
puede cambiar la proteína codificada por ese gen.
Microsatélites
•
•
Los microsatélites son secuencias de ADN no codificante con
motivos repetidos en tándem (entre 1-6 pares de bases)
repartidas por todo el genoma
Normalmente son marcadores codominantes y neutrales y son
utilizados en estudios de genética de poblaciones y en análisis de
parentesco
Microsatélites
Formación de microsatélites:
•
Fallos de la polimerasa (Slipped-strand mispairing)
•
Inestabilidad del acoplamiento de las dos cadenas en individuos
heterocigotos (mutaciones más frecuentes cuando la diferencia de
tamaño entre las cadenas es más elevada)
Microsatélites
Homocigoto
(378/378)
Homocigoto
(378/378)
Heterocigoto
(376/378)
Homocigoto
(376/376)
Variabilidad genética:
Definiciones
• Gen: Todo segmento de ADN que se encuentra a continuación de un
promotor y que puede ser transcrito por una ARN polimerasa y originar
un ARN funcional (ARNm, ARNr, ARNt, ARNsn, ribozima u otros tipos
de ARN)
• Alelo: Cada una de las formas diferentes de un gen. Los alelos
ocupan la misma posición (locus) en los cromosomas homólogos.
• Locus: La posición de un gen en un cromosoma; para cualquier locus
dado puede haber varios alelos posibles
Variabilidad genética: alelos
¿Cómo podemos detectar la
variabilidad genética del
ADN en el laboratorio?
PCR (Reacción en Cadena de la
Polimerasa)
Principio: Se basa en la metodología de la replicación. Se utilizan cebadores o
primers que flanquean la región de interés y son necesarios para que la ADN
polimerasa actúe. Realizándose múltiples ciclos de replicación, conseguimos
una amplificación exponencial del producto.
PCR (Reacción en Cadena de la
Polimerasa)
Principio: Se basa en la metodología de la replicación. Se utilizan cebadores o
primers que flanquean la región de interés y son necesarios para que la ADN
polimerasa actúe. Realizándose múltiples ciclos de replicación, conseguimos
una amplificación exponencial del producto.
Consiste en tres pasos:
- Desnaturalización del ADN molde a 95ºC
PCR (Reacción en Cadena de la
Polimerasa)
Principio: Se basa en la metodología de la replicación. Se utilizan cebadores o
primers que flanquean la región de interés y son necesarios para que la ADN
polimerasa actúe. Realizándose múltiples ciclos de replicación, conseguimos
una amplificación exponencial del producto.
Consiste en tres pasos:
- Desnaturalización del ADN molde a 95ºC
- Hibridación o annealing del cebador con ADN molde a Ta idónea
PCR (Reacción en Cadena de la
Polimerasa)
Principio: Se basa en la metodología de la replicación. Se utilizan cebadores o
primers que flanquean la región de interés y son necesarios para que la ADN
polimerasa actúe. Realizándose múltiples ciclos de replicación, conseguimos
una amplificación exponencial del producto.
Consiste en tres pasos:
- Desnaturalización del ADN molde a 95ºC
- Hibridación o annealing del cebador con ADN molde a Ta idónea
- Extensión mediante actuación de la ADN polimerasa a 72ºC
Animación PCR
PCR (Reacción en Cadena de la
Polimerasa)
Secuenciación (Sanger)
• La secuenciación de DNA usando el método de Sanger (1977)
emplea 2’3’-dideoxinucleótidos trifosfatados además de los
normales 2’-deoxinucleótido trifosfatado
• Ya que los 2’3’-dideoxinucleótidos trifosfato carecen del grupo 3’
hidroxilo, y la polimerización del DNA ocurre solo en la dirección
3’, cada vez que un 2’3’-dideoxinucleótido trifosfato es
incorporado la extención se detiene
2’-deoxinucleótido
monofosfato
OH
HO P O
Fosfato
NH2
Base
N
O
CH2
5’
4’
N
O
Azucar
2’
3’
OH
H
1’
N
N
Secuenciación (Sanger)
• La secuenciación de DNA usando el método de Sanger (1977)
emplea 2’3’-dideoxinucleótidos trifosfatados además de los
normales 2’-deoxinucleótido trifosfatado
• Ya que los 2’3’-dideoxinucleótidos trifosfato carecen del grupo 3’
hidroxilo, y la polimerización del DNA ocurre solo en la dirección
3’, cada vez que un 2’3’-dideoxinucleótido trifosfato es
incorporado la extención se detiene
OH
HO P O
Fosfato
NH2
Base
N
O
CH2
5’
2’3’-dideoxinucleótido
monofosfato
4’
N
O
Azucar
2’
3’
H
H
1’
N
N
Secuenciación
Secuenciación
Secuenciación
Fragmentos de ADN marcados fluorescentemente migran a través del capilar
Fragmentos de ADN pasan a través del láser y detector óptico
Electroforesis
capilar
Secuenciación
Cromatograma
Insertar cromatogramas