Download Guia Problemas 2016 corregida

Document related concepts

Genómica funcional wikipedia , lookup

Genética inversa wikipedia , lookup

Genoma humano wikipedia , lookup

Secuencia Alu wikipedia , lookup

Gen wikipedia , lookup

Transcript
GENETICA MOLECULAR
en su 18º año consecutivo bajo el actual formato
Guía de Problemas de Ejercitación
autor:
Norberto D. Iusem
2016
1
Equipo docente de Genética Molecular 2016
Elección de temas, clases teóricas y coordinacion general:
Norberto Iusem ([email protected])
Clases de Seminarios/Problemas:
Liliana Dain ([email protected])
Ezequiel Surace ([email protected])
Rocío Sampayo ([email protected])
Laboratorio:
Lucía Chemes ([email protected])
Manuel Sánchez ([email protected])
Paula Dos Santos Claro ([email protected])
Página web de la materia: http://www.fbmc.fcen.uba.ar/materias/genmol
2
Indice
Página
Origen de la vida. Primeras células……………………………………………….4
Análisis parciales de los genomas............................................................................6
Familias génicas
Evolución de genes
DNA repetitivo
Perpetuación, fidelidad, integridad y dinamismo de los genomas……………..11
Recombinación
Transposones
Estrategias de búsqueda e identificación de genes a partir de fenotipo
o patrón de expresión………………………………...............................................17
Complementación funcional o adquisición de nuevo fenotipo
Transposon tagging
Clonado posicional
Expresión diferencial
Búsqueda de función de genes conocidos (Knockout, knockin)…………………29
Genómica……………………………………………………………………………31
Proyectos genoma
Microarrays
Cromatina…...............................................................................................................47
Epigenética…………………………………………………………………………..52
Imprinting
Inactivación del cromosoma X
Silenciamiento génico.................................................................................................61
Ciclo celular, cáncer, virus oncogénicos...................................................................65
Telómeros y telomerasas............................................................................................69
Genética Humana………………………………….....................…………………..74
Terapia génica.............................................................................................................84
Problemas integratorios (tipo examen)......................................................................87
3
Origen de la vida
Primeras células
4
Origen de la vida. Primeras células
1) A 100 ºC, temperatura habitual de crecimiento de los procariotas hipertermófilos, las vidas
medias in vitro de las bases nitrogenadas del RNA son:
para A y G, 1 año; para U, 12 años; para C, 19 días. (fuente: The stability of the RNA bases:
Implications for the origin of life. Levy M, Miller SL. Proc Natl Acad Sci U S A. 1998 95: 7933-8).
¿Estos datos son compatibles con las ideas de Darwin, Oparin y Woese de una “sopa caliente”
como escenario pre-biótico para las reacciones que generaron las primeras biomoléculas sencillas?
2) Es muy aceptada entre los científicos la idea de que existieron riboorganismos, es decir, células
primitivas sin ADN ni proteínas pero con moléculas de ARN, responsables de la información
genética o actuando como ribozimas. ¿Los resultados de los análisis químicos hechos sobre el
meteorito Murchison, de origen extraterrestre y caído en Australia en 1969, apoyan tal creencia?
3) Nyctotherus ovalis es un eucariota unicelular ciliado, con hidrogenosoma, que vive en el intestino
de las cucarachas. Llamativamente, se ha observado la liberación de gas metano por estos
organismos, que no tienen ni en su núcleo ni en sus organelas los genes necesarios para su síntesis.
¿Cómo se explica esta producción de metano? ¿La observación mencionada fortalece la hipótesis de
Martin y Müller o la de Margulis para explicar el surgimiento de los primeros eucariotas con
organelas?
4) Giardia lamblia y Entamoeba histolytica son protistas sin mitocondrias ni hidrogenosomas, que
usan enzimas típicas de la fermentación para sobrevivir en condiciones anareobias como las del
lumen intestinal de mamíferos, donde habitan. Se ha observado que en su genoma hay vestigios de
genes procariotas involucrados en la producción de Hidrógeno gaseoso, inactivos.
¿Qué hipótesis sobre el origen de estos protistas es fortalecida por dicha observación?
5) Es conocida la estable “simbiosis” entre el alga verde Vaucheria litorea y moluscos marinos, p ej
babosas (sea slugs) como Elysia chlorotica, que habita las costas del Atlántico Norte. Por lo tanto,
estos animales adquieran un peculiar y vistoso “camouflage” verde (ver Figura) y logran hacer
fotosíntesis de azúcares, de modo que viven de CO2 como única fuente de C, y luz!
En realidad, las únicas estructuras de origen algal que se han encontrado en el molusco son
cloroplastos y solamente en las células de su ramificado tracto digestivo. Teniendo en cuenta la
dependencia de genes nucleares para la biogénesis, mantenimiento y funcionalidad de organelas
contemporáneas que quedaron con genomas pequeños, ¿cómo se explica el origen de estos
“moluscos verdes” a la luz de los resultados del siguiente paper?: “Genome analysis of Elysia
chlorotica egg DNA provides no evidence for horizontal gene transfer into the germ line of this
kleptoplastic mollusc”. Bhattacharya D, ……, Rumpho ME. Mol Biol Evol 2013.
5
Análisis parciales del genoma
Familia génicas
Evolución de genes
DNA repetitivo
6
1) Analizando las secuencias nucleotídicas en regiones de miembros de una familia génica
conservada en varias especies, ¿qué se puede inferir acerca de la historia evolutiva de dicha familia
en los siguientes casos?:
i) si se observan más similitudes entre genes ortólogos que entre parálogos
ii) si se observan más similitudes entre genes parálogos que entre ortólogos
-----------------------------------------------------------------------------------------------------------------------2) basado en Lemey et al (2005) Mol Biol Evol 4: 942-951.
Comparando secuencias nucleotídicas entre cepas del virus HIV que fueron apareciendo
últimamente, la tasa de sustituciones para el gen env del virus HIV resultó 0.1%/año para codones
sinónimos, y 0.2%/año para codones no sinónimos.
a) Compare estos valores con los del reloj molecular de primates (0.3% /MY): ¿por qué cree que
existe esa enorme diferencia?
b) ¿A qué se debe la diferencia de valor entre codones sinónimos y no sinónimos en env? ¿Cuál es la
presión de selección qué deben vencer los virus animales?
-----------------------------------------------------------------------------------------------------------------------3) Interesante correlación molecular-fenotípica con implicancias evolutivas, simplificada a partir del paper
de Helen Rosemberg (2002), Nature Genetics 30: 411-415, citado en el paper de Seminarios (Hittinger &
Carroll)
Fig. 1. Mono asiático en el Zoo de Filadelfia, pobre
El mono asiático (Pygathrix nemaeus, también llamado “douc langur” o “red-shanked douc” [mono
de pantorrilla roja]) (Fig. 1) es un colorido primate en peligro de extinción que se alimenta, en lugar
de bananas o insectos, de hojas, las cuales son fermentadas en el intestino por bacterias que
acidifican el medio, llevándolo a pH = 6. Se supone que las bacterias luego son desintegradas y su
RNA, de simple y doble hebra, también es aprovechado por el mono, al ser digerido en el
acidificado intestino por la ribonucleasa (RNasa) pancreática. Esta enzima está codificada por un
gen cuya organización, común a todos los primates, se muestra en la Figura 2.
7
Promotor
(408 pb)
exon
(35 pb)
intrón
(703 pb)
exon 2
(634 pb)
Fig. 2. Esquema de la organización conservada del gen RNasa de todos los primates.
Con el objeto de estudiar las propiedades de la enzima, y al no disponer de un método para
purificarla a partir de páncreas o intestino del mono, los investigadores decidieron producirla en
bacterias por ingeniería genética. Para ello, primeramente hicieron una reacción de PCR usando
DNA genómico del mono douc langur como molde y un determinado par de oligonucleótidos
primers que abarcaban al exón 2. El DNA así amplificado fue usado como inserto, colocándolo en
un vector plasmídico, y el plásmido recombinante resultante fue usado para transformar E. coli.
Para gran sorpresa, al purificar los plásmidos de las colonias (clones) obtenidas y secuenciar sus
insertos, aproximadamente la mitad de aquéllas tenía el gen esperado de acuerdo a la Fig. 2, y la
otra mitad tenía una versión del gen levemente diferente. A partir de ese momento, a la variante
original se la llamó “A” y a la nueva, “B”. Las secuencias de aminoácidos deducidas para cada una
de las proteínas codificadas se muestran en la Figura 3.
RNAasa “A”:
RNAasa “B”:
MALDKSLVIL PLLVVVLLVL GWAQPSLGRE SRAKKPQRQH MDSGSSPSSS
.......... .......... ........G. .Q.E...... ..........
STYCNQMMKR RNMTQGRCKP VNTPVHEPLV DVQNVCPQEK VTCKNGQTNC
.........L ......W..S .......... .......... ..........
FKSNSKMHIT DCRLTNGSKY PNCAYRTSPK ERHIIVACEG SPYVPVHPDA
.......... E......... .....Q.... .......... .........D
SVEDST
......
Figura 3. Secuencia de aminoácidos en código de una letra de la RNasa A y de la RNasa B. En la secuencia
B, sólo se indican los aminoácidos que son diferentes con respecto a “A” (los puntos representan los
aminoácidos de B que son los mismos que los de A para cada posición). Notar la diferencia en carga
eléctrica de ambas que resulta de las sustituciones: A es más básica que B, es decir, más protonada que B a
pH ácido (muchas cargas positivas que se repelen), y por lo tanto es probable que se despliegue y
desnaturalice a bajo pH.
De las colonias transformadas se purificó la RNasa A o B y a cada una se le midió su actividad
enzimática in vitro sobre ssRNA en función del pH (Figura 4).
8
Fig. 4. Actividad enzimática (en unidades arbitrarias) para cada RNasa sobre ssRNA en función del pH
Sin embargo, usando dsRNA como sustrato, RNasa A mostró alta actividad a pHs entre 6 y 8, y en
cambio la actividad de RNAasa B resultó nula (datos no mostrados).
Los autores del trabajo comprobaron que el mono asiático es el único primate que tiene dos genes
parálogos de ribonucleasa y por lo tanto hipotetizaron que el gen de RNasa B del mono asiático se
generó en la evolución de los primates por duplicación del gen de RNasa A y que luego divergió de
éste por acumulación y fijación sucesiva de mutaciones que confirieron una ventaja adaptativa.
a) ¿Está Ud. de acuerdo, en principio, con esa hipótesis? Si ocurrió realmente así, y teniendo en
cuenta el fenotipo de estos monos mencionado al principio, ¿cuál habrá sido la presión selectiva que
operó sobre el “nuevo” gen RNasa B?
b) Analizando los resultados de actividad enzimática sobre dsRNA, se puede afirmar que -además
de lo discutido en a)- “se relajó” la selección purificadora (negativa) contra las “mutaciones” no
sinónimas presentes en RNasa B ¿Por qué?
Finalmente, se contabilizaron y clasificaron las sustituciones halladas en las secuencias:
par de genes de RNasa
comparados
A y B de douc langur
A de douc langur y el
único de mono rhesus
número de sustituciones nucleotídicas
región codificante
intrón (Fig. 2)
sinónimas
no sinónimas
2
9 (Fig. 3)
11
4
10
49
c) ¿Los datos de la tabla robustecen o debilitan la hipótesis discutida en a) y b) en relación a un
escenario en el cual la variante RNasa B fue objeto de selección positiva darwiniana (evolución
adaptativa)?
d) Usando los datos de la tabla y un valor de reloj molecular para regiones libres de presión de
selección = 0.003 sustituciones/sitio/MY (es decir 0.3% /MY), estime el tiempo de la duplicación
génica que generó a ambas ribonucleasas.
e) ¿Son compatibles los datos de la tabla y su respuesta anterior con el tiempo de divergencia entre
el mono asiático y el mono rhesus (Macaca mulatta), el cual, a partir de datos de 14C de registros
fósiles, se sabe ocurrió al menos hace 10 MY?
9
Perpetuación de los genomas.
Fidelidad y mutaciones
Dinamismo de los genomas:
Recombinación
Transposición
10
Perpetuación, integridad y dinamismo de los genomas
1) basado en resultados y cálculos de:




Johnson & Johnson (2001) J. Biol. Chem. 276: 38097
Tuppen et al (2010), Biochimica et Biophysica Acta (BBA) – Bioenergetics 1797: 113–128
Khrapko et al (1997) Proc Natl Acad Sci (PNAS) 94: 13798–13803
http://book.bionumbers.org/what-is-the-mutation-rate-during-genome-replication/
A continuación se compara la fidelidad de varias DNA Polimerasas, expresada en valores
aproximados de frecuencias de error, medidas in vitro
Tipo de DNA Polimerasa
frecuencia aproximada de error
DNA Pol III de E coli completa (holoenzima
con todas sus subunidades)
1 x 10-6/sitio *
DNA Pol de Pfu (un archeon), que a veces se
usa en PCR
1 x 10-6
DNA Pol γ (mitocondrial)
1 x 10-6
Taq Pol (la que se usa habitualmente en PCR)
1 x 10-5
RT de retrovirus HIV
6 x 10-4
* ejemplo de notación: 1 x 10-6 significa 1 error cada 1.000.000 de nt incorporados
a) ¿A qué se deben las diferencias observadas en algunos casos?
b) ¿A qué se debe la diferencia entre el valor de la DNA Pol III y la tasa de mutación en E coli in vivo,
que es aproximadamente 1 x 10-10/sitio
c) ¿A qué podrá obedecer la mayor tasa de mutación in vivo (del orden de 10-8/sitio) observada en los
genomas mitocondriales comparando con los nucleares?
d) Estime la tasa teórica de sustitución/sitio/millón de años en todo el genoma de primates y compárela
con el valor experimental de reloj molecular para regiones neutras usado en el problema de las pág. 7-9
(no tenga en cuenta eventuales cambios en tamaños poblacionales que podrían influir en la fijación de
mutaciones)
Datos:
- tasa de mutación in vivo en genomas nucleares de eucariotas, valor estimado: igual al de procariotas,
= 1 x 10-10/sitio
- tamaño del genoma haploide de primates: 3 x 109 pb
- número de divisiones celulares a partir de un cigoto de primate hasta una gameta madura de un adulto
generado a partir de ese cigoto: en el macho, 400; en la hembra, 30
- tiempo intergeneracional promedio en primates: 20 - 25 años, es decir, 4 - 5 generaciones/siglo
11
Perpetuación, integridad y dinamismo de los genomas
2) basado en Boyko et al. (2010), PLoS One 5(3):e9514.
Las reacciones adaptativas -fisiológicas, celulares y moleculares- frente al estrés abiótico en plantas
están asociadas a cambios en la expresión genética. Es interesante que varios tipos diferentes de estrés
(p. ej. frío, calor, sequedad, UV, etc.) suelen converger en las mismas respuestas moleculares. Sin
embargo, la luz UV activa otras vías de señalización específicas debido a su directa interacción con
el DNA. Para revelar algunos de estos mecanismos involucrados frente a estrés, se eligió el modelo
Arabidopsis, generando transgénicas que llevan la construcción de la Figura 1:
LUCIFER
FERASA
Figura 1.
LUCI: parte 5’ del gen luciferasa, incluyendo el promotor 35S
de FER: parte media del gen
ASA: parte 3’ del gen luciferasa
: secuencia irrelevante conectora
Figura 2.
Hojas de plantas ya adultas con actividad
luciferasa, revelada y visualizada como
manchas
Cuando plántulas (es decir, muy jóvenes) transgénicas fueron sometidas a luz UV, muchas de ellas
adquirieron actividad de luciferasa en todos los órganos (un ejemplo se ve en Fig. 2).
a) ¿Cómo explica los resultados de la Figura 2? ¿Qué proceso molecular sufrió el transgén? ¿Qué
actividad bioquímica tiene la enzima endógena que actuó sobre él? ¿Cuál habrá sido la señal de su
reclutamiento?
Ayuda: piense por qué los autores pusieron la secuencia FER repetida como parte del transgén.
b) Dibuje un modelo sencillo del mecanismo de la transformación ocurrida en el transgén.
12
Perpetuación, integridad y dinamismo de los genomas
3) basado en Bender y Kleckner (1986) Cell. 45(6): 801-815
Para averiguar si el transposón Tn10 de E. coli transpone en forma replicativa o no-replicativa, se
transformaron células en cultivo líquido de una cepa de E. coli RecA- lac- con el siguiente plásmido
suicida (sin origen de replicación):
/ Transposasa de Tn10 /
AmpR
IR
Lac Z+
IR
Lac ZEl gen β-galactosidasa presente en el plásmido había sido previamente modificado in vitro de tal
manera que su hebra codificante era wild-type, pero su hebra no codificante portaba una mutación, de
modo de crear un apareamiento erróneo o mismatch en la doble hélice (que resultó estable porque estas
bacterias tenían mutaciones en su genoma que impedían la habitual reparación de mismatches).
Las bacterias transformadas fueron inmediatamente sembradas a alta densidad (200.000 bacterias en
total) en varias placas de Petri con medio de cultivo sólido conteniendo ampicilina, IPTG y X-gal, en
incubadas en estufa a 37ºC overnight.
Al día siguiente se observaron sólo 2 colonias, las cuales mostraban este aspecto:
Tomado de Introduction to Genetic Analysis. Griffiths
et al Ed. Freeman.
a) ¿Por qué se observaron tan pocas colonias en total?
b) ¿Qué implica el aspecto observado de las colonias? En base a su respuesta, ¿cree que el Tn10
transpone replicativa o no-replicativamente?
13
Perpetuación, integridad y dinamismo de los genomas
4) basado en los aprox. 300 trabajos de H. Kazazian; entre ellos Genes Dev. (2009) 23: 1303-1312.
El autor citado, deseoso de contar con un modelo in vivo (animal entero) para investigar los curiosos
elementos genéticos LINE, generó un ratón macho transgénico portando la siguiente construcción derivada
de un LINE subclase L1, activo, en heterocigosis:
Figura con el mismo diseño que en el paper de Esnault et al. (Guía de Seminarios)
y en detalle:
1.500 pb
primers para PCR
PL1: Promotor de L1 (muy poco activo)
PCMV: Promotor del virus CMV (muy activo)
SD: sitio dador de splicing
SA: sitio aceptor de splicing
pAS: señal de poli-adenilación
GFP: ORF de Green Fluorescent Protein partido en dos
a) Observe el particular e ingenioso diseño del transgén ¿Qué cree que ocurrirá si se activa la expresión del
mismo en el animal transgénico?
Una vez obtenidos los animales transgénicos, se observó lo siguiente:
Análisis fenotípico del animal transgénico adulto: “normal”, con la particularidad de que algunos de sus
órganos resultaron verdes, incluyendo testículo.
Análisis genotípico del animal transgénico adulto (sacrificado, luego de dejar descendencia): consistió en PCR
con los primers indicados en el esquema de arriba:
14
Perpetuación, integridad y dinamismo de los genomas
b) Observando el resultado del análisis de DNA mediante PCR ¿qué procesos moleculares cree que ocurrieron
in vivo a partir de la incorporación del transgen?
Intuitivamente y sin pensarlo mucho, los autores creían que el evento de integración del retrotranscripto iba a
ocurrir en el mismo cromosoma que el transgén y además muy cerca del mismo.
c) Si la cruza de ese ratón transgénico con un ratón hembra wild type arrojó los siguientes resultados:
De los 40 ratones F1 obtenidos:
42,5% heredaron la banda de 1500 pb solamente
7,5% heredaron la banda de 500 pb solamente
7,5% heredaron ambas
42,5% no heredaron ninguna.
¿Se convalida esta creencia de los autores?
d) Con el objeto de hallar el locus donde se insertó el retrotranscripto, se hicieron dos experimentos usando
DNA genómico de la cola de cuatro ratones F1 tomados al azar entre los que heredaron la banda de 500 pb
solamente:
- Southern blot, cortando con una enzima de restricción (que no corta al transgén) y usando GFP como sonda:
los cuatro dieron 1 sola banda del mismo tamaño (data not shown). Un resultado similar se obtuvo con una
segunda enzima de restricción.
- PCR inversa: se concluyó que un alelo del gen FOXP2 (involucrado en lenguaje y audición) quedó
interrumpido.
Análisis fenotípicos finos revelaron déficit de audición en estos cuatro ratones, contrastando con su padre que
oía perfectamente.
¿Cuál escenario in vivo, entre los siguientes, es más fácil de imaginar y cuáles no? Fundamente en base a los
resultados obtenidos del padre y los hijos, tanto genotípicos como fenotípicos asociados al nivel de audición.
i) el L1 se activó en el cigoto del ratón transgénico padre
ii) el L1 generó múltiples e independientes inserciones en las células germinales del padre
iii) el L1 generó inserciones en distintas células del embrión temprano del padre: la mayoría en células que
dieron lugar a algunos tejidos somáticos y además 1 inserción en una célula germinal que dio lugar a una
cierta fracción de gametas maduras
e) ¿Podría ocurrir un nuevo evento de transposición a partir del retrotranscripto ya integrado al genoma?
f) Recordando lo visto en clases teóricas: ¿qué tipo de proteína es la codificada por el ORF2? Se sabe que un
dominio de esta proteína tiene actividad de endonucleasa. ¿Para qué le sirve al L1 tener esa actividad?
g) Evidencias experimentales recientes revelaron que las secuencias Alu se transcriben (Mariner et al., (2008)
Mol Cell. 29: 99-509). Al no tener ningún ORF, ¿cómo podrían llegar a transponerse?
Para reflexionar: ¿Cree Ud. que la transposición es un fenómeno natural “frecuente” en la vida de
una célula? ¿Convivimos pacíficamente con nuestro transposones?¿Pueden afectar la correcta
expresión de los genes de los genomas que los hospedan?¿Pueden causar enfermedades en humanos?
15
5) basado en Ruffner et al. (1987) Molecular Biology and Evolution 4(1):1-9.
Las secuencias Alu están presentes en seis sitios dentro de los intrones de los genes de albúmina
humanos (son seis parálogos). Esta misma familia de genes en la rata no posee secuencias Alu. El
hecho de que los humanos posean en estos genes secuencias Alu mientras que las ratas no, plantea
dos posibles hipótesis: o bien las secuencias Alu “invadieron” los genes de humanoides en épocas
evolutivas recientes (después de la separación de los linajes de rata y humano), o bien las
secuencias Alu fueron de alguna forma eliminadas de los genes en el linaje rata. Los linajes de rata
y humano divergieron hace aproximadamente 85 millones de años.
Para distinguir entre estas dos posibilidades, se secuenciaron las seis secuencias Alu que se
encuentran en distintos miembros de la familia de genes de albúmina humanos. Los extremos de los
elementos Alu insertados y las correspondientes secuencias intrónicas flanqueantes se muestran en
la figura 1.
Figura 1: Secuencias nucleotídicas de los extremos de 6 elementos Alu insertos en la familia de genes de albúmina
humanos y las correspondientes secuencias intrónicas flanqueantes. Las líneas puntuadas indican nucleótidos en la parte
interna de las Alu.
a) Marque los límites izquierdo y derecho de las secuencias Alu insertadas y subraye las diferencias
en cada par de repeticiones directas (recuerde que todos los elementos genéticos móviles generan
duplicaciones directas en el sitio target cuando se insertan).
b) La tasa de sustitución nucleotídica en regiones genómicas (nucleares) libres de presión de
selección (reloj molecular), en primates, ha sido estimada en 3 x 10-3 sustituciones por millón de
años en cada sitio (= 0.3 % / MY). Calcule el tiempo transcurrido desde la inserción de las mismas
(suponga que las seis inserciones ocurrieron al mismo tiempo).
c) ¿Por qué se usaron estas secuencias flanqueantes para realizar este tipo de cálculo? ¿Por qué no
se incluyeron segmentos más grandes del intrón para el cálculo? ¿Por qué no se tienen en cuenta las
diferencias entre secuencias Alu entre sí?
d) ¿Ud. se inclina por un escenario en el cual las secuencias Alu invadieron los genes humanos
“recientemente” o por otro en el que en fueron eliminadas del genoma de la rata?
16
Estrategias de búsqueda e identificación de genes
a partir de fenotipo o patrón de expresión
Complementación o adquisición de nuevo fenotipo
Transposon tagging
Clonado posicional
Expresión diferencial
17
Complementación (rescate de un fenotipo perdido por mutación) o adquisición de nuevo
fenotipo (problemas 1-5)
1) Un gen bacteriano de extrema patogenicidad y protagonista en trabajos científicos hace varias
décadas es el del neumococo con el que trabaron Frederick Griffith en 1928 y Oswald Avery et al.
en 1944, aunque estos investigadores no pudieron plantear sus intenciones en esos términos.
Reinterprete los pioneros y famosos experimentos de transformación genética de la era preingeniería genética usando las herramientas conceptuales actuales, indicando:
 las características genéticas de las dos cepas en cuestión
 las condiciones de calentamiento para matar a las bacterias virulentas
 un mecanismo posible de la transformación genética de la que Griffith y Avery fueron testigos.
¿Habrá sido alta o baja la eficiencia de transformación de las no virulentas?
18
2) Tomado y modificado del libro Molecular Biotechnology de Glick BR & Pasternak JJ. ASM Press.
La ingeniería genética o tecnología del DNA recombinante no sería posible sin una larga colección de
enzimas de restricción originarias de los más diversos microorganismos. Para evitar el manejo de
diferentes condiciones óptimas de cultivo, las empresas que las comercializan históricamente han
clonado los genes de estas enzimas en E. coli. Por ejemplo, a continuación reproducimos dos
protocolos alternativos que se han usado para disponer industrialmente de clones productores de la
enzima Pst I de Providencia stuartii :
Protocolo I :
1. Extraer DNA cromosómico de P. stuartii y cortarlo con una pequeña cantidad de Msp I (tubo 1)
2. Cortar plásmido Bluescript con Cla I (tubo 2)
3. Mezclar tubos 1 y 2 junto con ligasa (tubo 3)
4. Transformar una cepa de E. coli (RecA- ; Eco RI nucleasa- y metilasa- ; β-gal-) con el contenido de
tubo 3
5. Incubar en medio líquido en presencia de ampicilina
6. Agregar fago λ mutado en el gen del represor o en el operador (fago lítico) proveniente de un
lisado de E. coli de la misma cepa
7. Plaquear en medio sólido que contiene ampicilina, IPTG y X-gal
8. Observar las colonias
9. Hacer cultivos líquidos a partir de cualquiera de las colonias
10. Centrifugar y resuspender las bacterias en medio hipotónico (shock osmótico)
11. Centrifugar y recuperar el sobrenadante
Preguntas sobre el protocolo I
a) ¿Por qué se usa Msp I para cortar el DNA bacteriano y no Cla I? (buscar las secuencias de
reconocimiento para responder)
b) ¿Qué contiene el tubo 3?
c) ¿En qué consiste el screening de los clones de interés? ¿Para qué se puso fago λ* ?
d) ¿Ud. esperaría que la mayoría de las colonias fueran blancas o azules en el paso 8?
*aclaración: la replicación de λ lítico por círculo rodante no ocurre inmediatamente al ingresar a la
bacteria porque antes deben transcribirse parte de sus genes involucrados en replicación.
pregunta bonus: ¿cómo averiguaría si la mutación del λ lítico usado se encuentra en el gen de la
proteína represora o en el operador al cual ella se une en trans?
Protocolo II
pasos 1-5. Igual que en protocolo I
6. Aislar (totalidad de) plásmidos y tratarlos in vitro con Pst I (tubo 6)
7. Transformar E. coli (RecA- ; Eco RI nucleasa- ; metilasa- ; β-gal-) con el contenido de tubo 6
8. Plaquear en medio sólido que contiene ampicilina, IPTG y X-gal
9. Recuperar las colonias
10-12. Igual que 9-11 de Protocolo I
Preguntas sobre protocolo II
f) ¿En qué consiste el screening de los clones de interés? Sabiendo que sólo los plásmidos intactos
generan transformantes, ¿cuál es el objeto del tratamiento con Pst I in vitro? ¿Qué otro gen, cuyo
producto es activo solamente durante replicación in vivo y relacionado funcionalmente al gen de la
endonucleasa de restricción, tuvo que estar presente para explicar la viabilidad de las bacterias?
g) Casi todos los clones obtenidos presentaron actividad de endonucleasa de restricción in vitro ¿Qué
tipo de organización genómica esperaría Ud. con respecto a los dos genes mencionados en f)?
19
3) Se ha clonado un gen de ratón pero no se tiene la más remota idea de su función bioquímica (es
decir, qué clase de proteína codifica) debido a que la búsqueda mediante BLAST de secuencias
homólogas ingresadas a GenBank reveló que los genes reconocidos como ortólogos tampoco tienen
función conocida asociada. Dichas secuencias ortólogas se hallaron exclusivamente en metazoos
pero no en levaduras. Además, tampoco se sabe su función fisiológica dado que su knock-out en
ratones resultó letal embrionario.
Para intentar averiguar su función bioquímica, se transformaron levaduras haploides S. Pombe con
ese gen de ratón colocado en un vector plasmídico de expresión para levaduras que tiene dos
particularidades:
i) es de muy bajo número de copias y tiende a perderse si no existe presión de selección.
ii) confiere color rojo a las colonias (porque complementa una mutación en levaduras dobles mutantes
auxótrofas y así permite que se acumule una sustancia intermediaria en la biosíntesis de adenina, de
color rojo).
Las levaduras transformadas fueron mutagenizadas con UV y al plaquearlas en ausencia de presión de
selección para el vector, se vio que todas las colonias eran blancas, excepto una que permaneció roja.
Cuando ese clon rojo fue trasformado con una library de cDNA de levaduras (construida en un vector
convencional), generó colonias todas de color rojo, excepto una blanca. Al secuenciar el inserto de la
colonia blanca, se vio que su secuencia correspondía a una glicosil-transferasa de proteínas
desnaturalizadas, las cuales, al actuar como sustrato de chaperonas, se pueden plegar correctamente.
a) En base a los resultados, ¿cuál es la función bioquímica de ese gen de ratón?
b) ¿Cree Ud. que el gen de esa glicosil-transferasa es esencial en levaduras? ¿Qué genotipo
(cromosómico) tienen las levaduras de la colonia roja inicial?
c) ¿Hubiera sido conveniente invertir el orden de las etapas del protocolo experimental, es decir
primero mutagenizar y después transformar con el plásmido?
Esta ingeniosa estrategia, basada en complementación funcional y llamada de los “letales sintéticos”
(Kranz y Holm [1990] PNAS 87: 6629), también sirve para identificar “interacciones génicas” en
levaduras, por ejemplo, genes distintos que puedan suplantarse mutuamente si uno de los dos falla,
pero que causen letalidad si ambos tienen una mutación deletérea simultáneamente. Teniendo clonado
uno de ellos, ¿se le ocurre cómo hacer para clonar el segundo?
Nota: actualmente se están detectando interacciones génicas en levaduras a escala genómica
(http://www.ncbi.nlm.nih.gov/pubmed/25213244)
20
4) basado en Shih & Weinberg (1982): “Isolation of a transforming sequence from a human bladder
carcinoma cell line”. Cell 29: 161-169.
El primer clonado de un oncogen humano fue realizado por Robert Weinberg en 1982 a partir de un
tumor de vejiga, mediante observaciones fenotípicas resultantes de protocolos de transfección y
aprovechando el conocimiento sobre la existencia de las secuencias Alu características del genoma
humano.
¿Cómo habrá hecho R. Weinberg para clonar el oncogen, teniendo en cuenta que en esa época ya se
contaba con:
i)
técnicas de cultivo de células de mamíferos
ii)
técnicas de purificación de DNA total
iii)
técnicas de transfección de células con DNA total purificado (fragmentado)
iv)
experiencia en identificación de colonias (“foci”) con fenotipo tumoral
v)
vectores de clonado que se replican en procariotas
vi)
técnicas de marcación de sondas para screening de genotecas
pero no se contaba con:
i)
vectores de clonado que se replican en eucariotas
ii)
la técnica de PCR
iii)
la secuencia del genoma humano
5) basado en Guo et al y Yusa et al, Nature (2004) 429:891-895 y 896-899.
El síndrome de Bloom en humanos resulta de mutaciones en un gen de DNA helicasa que
normalmente impide que ocurra recombinación entre cromosomas homólogos ya duplicados
durante mitosis (β cual causaría que un. Las células somáticas de pacientes con este síndrome (o
células de personas normales pero knockout homocigotas en este gen) se aprovechan para clonar
genes mediante complementación funcional.
¿Por qué no es útil generar mutaciones en células de personas normales para luego hacer
complementación funcional? ¿En qué reside la ventaja de las células de pacientes de Bloom?
------------------------------------------------------------------------------------------------------------------Para reflexionar: ¿En qué casos se puede hacer clonado por complementación génica y por qué?
¿Qué alternativas existen cuando ésta no es aplicable?
21
Transposon tagging
6) basado en Mintz (2004) Microbiology 150(Pt 8):2677-88.
Actinobacillus actinomycetemcomitans es una bacteria de gran interés odontológico porque es el
agente causal de enfermedades periodontales, entendiendo por éstas a un conjunto de procesos
inflamatorios que afectan los tejidos de soporte del diente -encía y hueso-, que si no se tratan a
tiempo pueden llevar a la pérdida de piezas dentales.
Este patógeno tiene particular predilección por la boca de los vertebrados mamíferos, no es un
parásito intracelular y coloniza el tejido conectivo vecino a la dentadura porque tiene la propiedad
de adherirse con mucha afinidad a colágeno y fibronectina. No se ha completado aún ningún
Proyecto Genoma (determinación de secuencia de genoma completo) para esta bacteria.
Los autores del trabajo citado utilizaron la estrategia de mutagénesis con transposones para
identificar los genes de patogenicidad de esta bacteria.
a) Dibuje un esquema de una posible construcción, útil para transformar a las bacterias y
mutagenizarlas por inserción de un transposón.
b) El autor obtuvo 2.000 diferentes mutantes insercionales ¿Considera Ud. que esta colección de
mutantes es lo suficientemente amplia como para encontrar la mayoría de los genes responsables de
la patogenicidad de Actinobacillus actinomycetemcomitans ?
c) Diseñe un procedimiento in vitro (sin ratones) y otro in vivo (con ratones) para intentar identificar
los clones bacterianos mutados en genes de patogenicidad (que evite tener que analizar uno por uno,
lo cual sería muy engorroso).
d) Una vez hallados los clones de interés, ¿qué estrategia metodológica elegiría Ud. para identificar
los genes del patógeno responsables de enfermedades periodontales? ¿De qué manera podría Ud.
llegar a tener información preliminar sobre la función bioquímica de esos genes?
e) ¿Cree Ud. que los autores pudieron haber clasificado a genes del metabolismo esenciales de la
bacteria como responsables de enfermedades periodontales?
Datos útiles:
Tamaño de genoma de Actinobacillus actinomycetemcomitans: 2.3 Mb
Tamaño promedio de un gen de Actinobacillus actinomycetemcomitans: 1.0 Kb
-----------------------------------------------------------------------------------------------------------------------7) basado en los trabajos de enhancer trapping del controvertido Walter Gehring (Halder et al. [1995] Science
267: 1788-1792).
Uno de los objetivos de Gehring era clonar un gen (o al menos su enhancer) del desarrollo que se
expresa en los “discos imaginales” de la larva y que determina la formación de las alas propias del
adulto. Estos son los experimentos que hizo para lograrlo:
Se generaron muchos individuos de Drosophila melanogaster transgénicos, mediante los elementos
transposonibles P, para construir una extensa colección (library) de moscas viables que tenían el
cDNA Gal4 (un factor de transcripción de levaduras) bajo un promotor mínimo (débil) de mosca.
Estas moscas fueron llamadas “Gal4”.
Por otro lado, se disponía de moscas transgénicas que tenían el cDNA “ey” de mosca (gen homeótico
22
que supuestamente determina la formación de los ojos) bajo las órdenes de un promotor débil de
mosca, todo río abajo del enhancer UAS de levaduras, al cual se le une Gal4. Estas moscas eran
fenotípicamente normales y fueron llamadas “ey”.
En un alarde de virtuosismo genético y molecular, Gehring cruzó cada una de las miles de moscas
Gal4 de fenotipo normal con una mosca diferente del grupo “ey”. Se centró la atención en una de las
moscas Gal4, llamada Gal4-63, la cual, cuando fue cruzada con una “ey”, generó una progenie en la
cual el 25% de los individuos presentaba un fenotipo monstruo: ojos en las alas!
a) ¿Cómo explica este resultado? ¿le parece que Gehring logró su objetivo inicial de identificar
regiones genómicas responsables del desarrollo de las alas?
b) Antes de este trabajo, este objetivo pudo haberse intentado mediante transposon tagging
convencional para detectar pérdida de función. En este caso, habría consistido en buscar individuos sin
alas en la library de moscas mutantes o en su progenie. ¿Qué ventajas presentó la estrategia de
Gehring respecto de la estrategia convencional?
c) ¿Podría haberse usado la secuencia codificante de un gen reporter convencional (p. ej. ß-gal o GFP)
en lugar del gen homeótico “ey”?
23
Clonado posicional
8) basado en Shapiro/Marks, Nature (2004) 428, 717-723
La pérdida de extremidades ha ocurrido en diversas líneas evolutivas de los vertebrados. En los
reptiles, por ejemplo, se sabe que las serpientes evolucionaron a partir de ancestros con cuatro patas.
Lo mismo ocurrió en los mamíferos, donde los cetáceos (ballenas, delfines y orcas) provienen de
ancestros cuadrúpedos. En los peces en general, los dos pares de aletas (anteriores y posteriores)
son los equivalentes de las patas de los otros vertebrados. En los espinosos marinos, el par de aletas
posteriores (llamadas también aletas pélvicas) se presenta como dos espinas punzantes. Sin
embargo, los espinosos de agua dulce carecen de las dos espinas pélvicas.
En este contexto, resulta interesante conocer el gen o los genes responsables de tales diferencias
anatómicas. Un modelo biológico muy valioso para estudiar esta cuestión lo constituyen los
“espinosos”, que son peces de la especie Gasterosteus aculeatus, de la cual hay dos poblaciones
bien estudiadas: los marinos y los de agua dulce, que se pueden cruzar entre sí.
a) Qué estrategia habrán usado los autores para identificar al gen responsable de la diferencia
anatómica? ¿De qué hábitats habrán pescado los animales que usaron? ¿Habrán usado solamente los
que pescaron (parentales) o también su descendencia F1 o F2? ¿Habrán necesitado marcadores
moleculares que detectan polimorfismos en el genoma? ¿Habrán necesitado secuenciar DNA o
tener datos previos de secuencia? ¿Habrán necesitado obtener datos de frecuencia de recombinación
entre el marcador y (el gen buscado responsable de) fenotipo relacionado con el desarrollo de las
espinas?
Los autores finalmente identificaron un gen candidato responsable. Se trata de Pitx1, que codifica
una proteína que tiene un dominio homeótico en el medio. Sus regiones codificantes resultaron
idénticas en ambas poblaciones parentales.
Pitx1 se expresa en la pelvis de las larvas de espinosos marinos pero no en los de agua dulce.
b) ¿En qué región del gen podría estar la/s sustitución/es nucleotídica/s en el gen Pitx1 que podría/n
haber causado la pérdida de espinas en los espinosos de agua dulce?
c) Si se comprobara que ninguna región del gen Pitx1 es diferente entre ambas poblaciones, ¿en qué
otro gen podría haber diferencias y así explicar la pérdida de espinas?
d) En cualquier caso, ¿la mutación en los peces de agua dulce será dominante o recesiva? Qué
fenotipo tendrán todos los individuos F1?
e) En ratones existe un ortólogo de Pitx1, que se expresa en la región pélvica del embrión. El
knockout homocigota de este gen produce reducción del tamaño de las patas posteriores. ¿Este dato
robustece o debilita la conclusión sobre la función de Pixt1 en peces?
f) La presencia de espinas pélvicas en los espinosos marinos parece ser una adaptación defensiva
contra peces predadores de estructuras bucales blandas (que no existen en agua dulce). Por otra
parte, la ausencia de espinas pélvicas en los de agua dulce parece ser una adaptación defensiva
contra invertebrados predadores en ese hábitat, capaces de atrapar más eficientemente a los
espinosos con espinas pélvicas, agarrándose de las mismas.
¿Las siguientes afirmaciones son verdaderas o falsas?:
g) El origen de la mutación que causó la desaparición de las espinas pélvicas fue un hecho
independiente de la presencia de invertebrados predadores en agua dulce.
h) La mutación que causó la desaparición de las espinas pélvicas tuvo valor adaptativo neutro en
ambientes marinos.
i) La mutación que causó la desaparición de las espinas pélvicas tuvo valor adaptativo positivo en
ambientes de agua dulce.
24
9) inspirado en el paper de Zhang et al., Nature (1994) 372:425.
La obesidad es un trastorno nutricional frecuente en los países occidentales. Si bien se
considera que está asociada a hábitos culturales muy recientes, hay registros de obesidad bastante
lejanos en el tiempo (basta mirar las pinturas que retratan a Enrique VIII, ese que mandó degollar a
varias de sus esposas). El peso corporal incrementado es un problema de salud importante porque
está relacionado a enfermedades tales como diabetes e hipertensión.
Los mecanismos moleculares que controlan el tamaño y distribución de los depósitos de
grasas son desconocidos. Con el objeto de llegar a conocerlos, se pretende clonar el gen de la
obesidad en humanos y en especial estudiar su alelo mutado, el cual se supone que es recesivo. Para
ello suponga que se analizaron tres familias que incluían algunos de sus integrantes obesos. A cada
individuo (todos adultos) se le determinó el genotipo relativo a tres marcadores moleculares no
codificantes 1/I, 2/II y 3/III, nomenclatura donde cada número arábigo o romano (que no tienen
nada que ver con dominancia o recesividad) representa un cierto “haplotipo”, es decir, una
combinación particular de varios RFLP. Se obtuvieron los siguientes resultados:
73
1/I
2/II
3/3
103
1/1
2/II
3/III
58
1/I
II/II
3/III
59
1/I
2/II
3/III
99
1/1
2/II
3/III
75
I/I
2/2
3/III
121
1/1
2/II
3/3
77
1/I
2/II
3/3
55
1/I
2/II
3/III
47
1/I
2/II
3/III
97
1/1
2/II
3/III
104
1/1
II/II
3/3
67
1/I
2/2
3/3
74
61
1/I
2/II
3/III
94
I/I
II/II
III/III
59
1/I
2/II
3/III
76
1/I
II/II
3/III
81
80
1/1 1/I
2/II 2/II
III/III 3/3
112
I/I
2/2
3/III
Los números indican el peso en kg de cada persona. Suponga que la altura es 1.75 m para los
varones y 1.65 m para las mujeres
a) ¿Qué marcador molecular usaría como punto de partida para un caminado cromosómico?
b) ¿Es necesario el uso de una genoteca para hacer el caminado cromosómico?
Habiendo usado el marcador respondido en a) para un caminado a lo largo de 200 kb, Ud. llega a
identificar dos regiones genómicas: I y II, que comparten un 80 % de identidad de secuencia y
ambas con un marco abierto de lectura (ORF) de 4.2 kb con potencial codificante para un proteína
con péptido señal de inserción a membranas. Usadas como sondas en zooblots de DNA, Ud.
obtiene:
25
Por otra parte, buscando homología con ESTs (expressed sequence tags) de distintos tejidos
humanos, disponibles en bases de datos, Ud. encuentra:
hígado
tejido adiposo
páncreas
testículo
corazón
intestino
región I
+
-
región II
-
c) ¿Cuál región en principio puede ser considerada candidata para contener el gen buscado? ¿La I o
la II?
d) ¿A qué puede corresponder el ORF no elegido por Ud.?
e) El análisis posterior reveló una mutación del tipo CT dentro del gen candidato en las personas
con sobrepeso analizadas. Ahora suponga que quiere extender estas conclusiones a nivel de toda la
población ¿Qué resultado entre los siguientes a debería hallarse indefectiblemente para asegurar que
esa mutación es en efecto responsable de un fenotipo obeso?
i) ningún individuo de peso normal en la población tiene esa mutación en ambos alelos.
ii) todos los individuos con sobrepeso en la población tienen esa mutación en ambos alelos.
26
10)
La hiperlipidemia familar es una enfermedad humana que se caracteriza por niveles aumentados de lípidos
(colesterol y triglicéridos [TG]) en sangre, que predisponen a eventos riesgosos de ateroesclerosis en arterias
coronarias. Como modelo de esta enfermedad se suelen usar ratones de la cepa mutante (espontánea) HcB19
cuyas características fenotípicas son una respiración más lenta y elevados niveles de TG en sangre.
Como se quiere identificar el gen involucrado pero no hay disponibilidad de familias humanas numerosas
afectadas para su análisis, se decidió cruzar estos ratones HcB19 con ratones CAST/Ei (normales en cuanto
a sus lípidos). Mediante PCR se analizaron microsatélites polimórficos como marcadores, que exhiben
diferencias entre las dos cepas parentales en el número de unidades repetidas. Como por experimentos con
células somáticas híbridas se sospechaba que el gen buscado reside en el cromosoma 3 de ratón, se acotó el
uso de marcadores a los de la serie D3, los cuales mapean en una zona del cromosoma 3.
La siguiente tabla muestra el análisis de los animales parentales:
Genotipo D3Mit1 (# repeats)
Genotipo D3Mit7 (# repeats)
Genotipo D3Mit12 (# repeats)
Genotipo D3Mit41 (# repeats)
Fenotipo TG (mg/ml)
HcB19
20
4
5
6
> 320
CAST/Ei
20
18
16
14
< 40
aclaración: mínimas variaciones de # repeats intra-cepa no se indican
De la cruza HcB19 x CAST/Ei, se generaron 2.700 ratones F2, mantenidos en un gran bioterio. La siguiente
tabla resume los resultados de las combinaciones de fenotipo y genotipo encontradas en los individuos F2
homocigotas (tanto para marcador polimórfico como para niveles de TG) solamente.
Microsat.
D3Mit7
D3Mit12
D3Mit41
# repeats
4
4
18
18
5
5
16
16
6
6
14
14
Niveles de TG
>320
<40
>320
<40
>320
<40
<40
>320
>320
<40
<40
>320
# ratones
167
173
170
162
660
18
662
16
679
1
677
2
a) Qué marcador elegiría para el caminado cromosómico?
b) (como “tarea para el hogar”) Aprovechando el marcador respondido en a) y las bases de datos
públicas de cromosomas y genes en Internet posibles gracias a la concreción de Proyectos Genoma
(www.ncbi.nlm.nih.gov), identifique un gen candidato cuyas mutaciones serían responsables de la
hiperlipidemia familiar en humanos. Ayuda: los ácidos grasos de los TG se metabolizan (oxidan)
requiriendo reacciones redox.
27
Expresión diferencial
11) ¿Qué estrategia (que no sea mediante la moderna secuenciación “high throughput” de RNA que
vamos a ver más adelante) seguiría para identificar genes en especies cuyo genoma no está
secuenciado que respondan a las siguientes situaciones?:
i)
inducidos por frío en plantas
ii)
cuya expresión oscila a lo largo del día en insectos
iii)
que se van encendiendo gradualmente durante el desarrollo del embrión temprano de un
mamífero
iv)
activados (directamente o indirectamente) por un factor de transcripción conocido en células de
mamífero en cultivo
a) Indique un procedimiento que involucre amplificación in vivo (en bacterias) y otro que involucre su
amplificación in vitro (PCR) de secuencias originadas a partir de transcriptos.
b) Si la extracción de RNA resultara metodológicamente muy complicada en algún caso, ¿qué otra
alternativa existe para cumplir el objetivo deseado?
28
Búsqueda de función de genes conocidos
(Knockout, Knockin)
29
Un grupo de investigadores suecos (Trifunovic et al, Nature 2004) interesados en la relación entre
mutaciones acumuladas en el genoma mitocondrial y el proceso de envejecimiento lograron un ratón knockin reemplazando el gen nuclear de la DNA Polimerasa mitocondrial por una versión mutada puntualmente en
el exón 3, que corresponde al dominio de su actividad proofreading (de manera de preservar intacto el
dominio con actividad polimerasa propiamente dicha). Ellos lo hicieron usando la tecnología tradicional
seleccionando stem cells en cultivo y manipulando embriones quimera, pero hoy seguramente lo hubieran
hecho mediante la estrategia llamada CRISPR esquematizada en el dibujo de abajo.
a) ¿Qué actividad tiene Cas9?
b) Señale en el dibujo la parte del RNA variable diseñada “a medida”.
c) ¿Qué DNA involucrado en el experimento falta en el dibujo? Agréguelo.
d) ¿Qué proceso enzimático endógeno debe ocurrir para garantizar el reemplazo génico y qué fue lo que lo
activó?
e) ¿Es absolutamente necesario, eligiendo CRISPR, pasar por animales quimera para lograr el knock-in
deseado? ¿Por qué?
f) ¿Es posible mediante esta estrategia generar ratones homocigotas para la mutación mencionada sin
necesidad de hacer cruzas? ¿Por qué?
30
Genómica
Análisis globales de los genomas
(genome-wide)
Proyectos Genoma
31
Análisis globales de los genomas. Genómica. Microarrays
1) A mediados de los 1980’s, Walter Gilbert (premio Nobel 1980) estimó el número de genes humanos
en 100.000 basándose en el tamaño de un gen típico (aprox. 3 x 104 bp) y el tamaño del genoma (3 x 109
bp). Quince años más tarde, análisis computacionales confiables que formaron parte del Proyecto
Genoma Humano fueron capaces de predecir la existencia de 16.000 “nuevos” genes con potencial
codificante de proteínas, los cuales sumados a los 15.000 ya conocidos, dio un total estimado de 31.000.
¿Cuál fue el error de Walter Gilbert en sus cálculos? ¿Estaba realmente tan errado?
Aclaración: actualmente se estima que el número de genes humanos es alrededor de 32.400, incluyendo noncoding RNA, y más de 14.000 pseudogenes (Pertea & Salzberg, Genome Biology 2010, 11:206).
2) Tanto como el 20% del genoma humano contiene elementos LINE cuyo tamaño es 6.0 kb, la mayoría de
los cuales son inactivos debido a mutaciones o silenciamiento. ¿Cuántas copias (aproximadamente) de
LINEs hay en el genoma humano?
3)
a) Usando el valor de reloj molecular para DNA nuclear en primates indicado en esta Guía (pág. 9),
estime el número máximo de posiciones nucleotídicas diferentes (SNPs) que puede haber entre los
genomas nucleares de dos personas cualesquiera (pero no emparentadas directamente).
Además, exprese el resultado en % de identidad entre ambos genomas (ej. 99.0% o 99.5% o 99.9% o
99.95%, etc.).
dato: el Homo sapiens “moderno” se originó (en Africa) hace 200.000 años.
b) ¿Existe actualmente alguna tecnología posible para comprobar en forma rápida su respuesta anterior
experimentalmente? ¿Cuál? (no se preocupe por el costo).
4) inspirado en Xue et al, Curr. Biol. (2009)
Los Licenciados en Biología (UBA) Juan Urquiza y Luis Urquiza, que han cursado exitosamente
Genética Molecular, sospechan que son primos lejanos descendientes directos por vía paterna del
General Justo José de Urquiza (1801-1870), primer presidente constitucional de los argentinos, que se
sabe dejó una numerosa descendencia….. Ambos recurrieron a una unidad de secuenciación profunda
en un instituto del Conicet y, seducidos por una tentadora “promo 2 x1”, sometieron muestras de sangre
con sus respectivos DNA a pirosecuenciación por quimioluminiscencia en un equipo 454 de Life
Sciences. Luego de obtener las lecturas, el experto en bioinformática del instituto analizó solamente la
secuencia de sus cromosomas “Y” (tamaño 30 Mb) para no complicarse con sucesivos aportes
genómicos maternos, asumiendo que la tasa de cambios en ese cromosoma es igual que en los demás.
El resultado arrojó 12 diferencias nucleotídicas entre ellos.
a) (10 ptos) ¿Qué propiedad tiene el moderno equipo que lo hace apto para lograr la necesaria
separación clonal de los fragmentos amplificados de la library a ser secuenciados?
b) (15 ptos) ¿Juan y Luis son parientes lejanos o no? Justifique su respuesta en base a los datos del
problema 1d de la Guía de Problemas (pág. 11) y al resultado que se hubiera esperado en el caso
contrario a su respuesta. Muestre los cálculos estimativos.
32
Análisis globales de los genomas. Genómica. Microarrays
Novedades técnicas en los últimos años (tomado de Wikipedia): Secuenciación de DNA de
última generación o high throughput:
Ion Semiconductor Sequencing is a method of DNA sequencing based on the detection of
hydrogen ions that are released during the polymerization of DNA. This is a method of "sequencing
by synthesis", during which a complementary strand is built based on the sequence of a template
stand.
A microwell containing a template DNA strand to be sequenced is flooded with a single species of
deoxyribonucleotide triphosphate (dNTP). If the introduced dNTP is complementary to the leading
template nucleotide, it is incorporated into the growing complementary strand. This causes the
release of a hydrogen ion that triggers an ISFET ion sensor, which indicates that a reaction has
occurred. If homopolymer repeats are present in the template sequence, multiple dNTP molecules
will be incorporated in a single cycle. This leads to a corresponding number of released hydrogens
and a proportionally higher electronic signal.
This technology differs from other sequencing technologies in that no modified nucleotides or
optics are used. Ion semiconductor sequencing may also be referred to as ion torrent sequencing,
pH-mediated sequencing, silicon sequencing, or semiconductor sequencing. The technology was
licensed from DNA Electronics Ltd, developed by Ion Torrent Systems Inc. and was released in
February 2010. Ion Torrent have marketed their machine as a rapid, compact and economical
sequencer that can be utilized in a large number of laboratories as a bench top machine. Roche's 454
Life Sciences is partnering with DNA Electronics on the development of a long-read, high-density
semiconductor sequencing platform using this technology.
Technology
The incorporation of deoxyribonucleotide Triphosphate into a growing DNA strand causes the
release of hydrogen and pyrophosphate.
The release of hydrogen ions indicate if zero, one or more nucleotides were incorporated.
Released hydrogens ions are detected by an ion sensor. Multiple incorporations lead to a
corresponding number of released hydrogens and intensity of signal.
Sequencing Chemistry
In nature, the incorporation of a deoxyribonucleotide triphophate (dNTP) into a growing DNA
strand involves the formation of a covalent bond and the release of pyrophosphate and a positively
charged hydrogen ion. A dNTP will only be incorporated if it is complementary to the leading
unpaired template nucleotide. Ion semiconductor sequencing exploits these facts by determining if a
hydrogen ion is released upon providing a single species of dNTP to the reaction.
Microwells on a semiconductor chip that each contain one single-stranded template DNA molecule
to be sequenced and one DNA polymerase are sequentially flooded with unmodified A, C, G or T
dNTP. If an introduced dNTP is complementary to the next unpaired nucleotide on the template
strand it is incorporated into the growing complementary strand by the DNA polymerase.[9] If the
introduced dNTP is not complementary there is no incorporation and no biochemical reaction. The
hydrogen ion that is released in the reaction changes the pH of the solution, which is detected by an
ISFET. The unattached dNTP molecules are washed out before the next cycle when a different
dNTP species is introduced.
Signal Detection
Beneath the layer of microwells is an ion sensitive layer, below which is an ISFET ion sensor. All
layers are contained within a CMOS semiconductor chip, similar to that used in the electronics
industry.
33
Análisis globales de los genomas. Genómica. Microarrays
Each chip contains an array of microwells with corresponding ISFET detectors. Each released
hydrogen ion then triggers the ISFET ion sensor. The series of electrical pulses transmitted from the
chip to a computer is translated into a DNA sequence, with no intermediate signal conversion
required —meaning, because nucleotide incorporation events are measured directly by electronics,
the use of labeled nucleotides and optical measurements are avoided. Signal processing and DNA
assembly can then be carried out in software.
Comparison to other sequencing methods:
Ion Torrent
454 Sequencing
Illumina
SOLiD
Sequencing
Chemistry
Ion semiconductor
sequencing
Pyrosequencing
Ligation-based
sequencing
Amplification
approach
Mb per run
Time per run
Read length
Cost per run
Cost per Mb
Cost per instrument
Emulsion PCR
Emulsion PCR
100
1.5 hours
200 bp
$ 350 USD
$ 5.00 USD
$ 50,000 USD
100
7 hours
400 bp
$ 8,438 USD
$ 84.39 USD
$ 500,000 USD
Polymerase-based
sequence-bysynthesis
Bridge
amplification
600,000
9 days
2x150 bp
$ 20,000 USD
$ 0.03 USD
$ 600,000 USD
Emulsion PCR
170,000
9 days
35x75 bp
$ 4,000 USD
$ 0.04 USD
$ 595,000 USD
Table 1. Comparing metrics and performance of next-generation DNA sequencers.
Pyrosequencing is a method of DNA sequencing (determining the order of nucleotides in DNA)
based on the "sequencing by synthesis" principle. It differs from Sanger sequencing, relying on the
detection of pyrophosphate release on nucleotide incorporation, rather than chain termination with
dideoxynucleotides.[1] The technique was developed by Pål Nyrén and his student Mostafa Ronaghi
at the Royal Institute of Technology in Stockholm in 1996.[2][3][4]
"Sequencing by synthesis" involves taking a single strand of the DNA to be sequenced and then
synthesizing its complementary strand enzymatically. The Pyrosequencing method is based on
detecting the activity of DNA polymerase (a DNA synthesizing enzyme) with another
chemiluminescent enzyme. Essentially, the method allows sequencing of a single strand of DNA by
synthesizing the complementary strand along it, one base pair at a time, and detecting which base
was actually added at each step. The template DNA is immobilized, and solutions of A, C, G, and T
nucleotides are added and removed after the reaction, sequentially. Light is produced only when the
nucleotide solution complements the first unpaired base of the template. The sequence of solutions
which produce chemiluminescent signals allows the determination of the sequence of the template.
ssDNA template is hybridized to a sequencing primer and incubated with the enzymes DNA
polymerase, ATP sulfurylase, luciferase and apyrase, and with the substrates adenosine 5´
phosphosulfate (APS) and luciferin.
1. The addition of one of the four deoxynucleotide triphosphates (dNTPs)(in the case of dATP we add
dATPαS which is not a substrate for a luciferase) initiates the second step. DNA polymerase
incorporates the correct, complementary dNTPs onto the template. This incorporation releases
pyrophosphate (PPi) stoichiometrically.
2. ATP sulfurylase quantitatively converts PPi to ATP in the presence of adenosine 5´ phosphosulfate.
This ATP acts as fuel to the luciferase-mediated conversion of luciferin to oxyluciferin that generates
visible light in amounts that are proportional to the amount of ATP. The light produced in the
luciferase-catalyzed reaction is detected by a camera and analyzed in a program.
3. Unincorporated nucleotides and ATP are degraded by the apyrase, and the reaction can restart with
another nucleotide.
34
Análisis globales de los genomas. Genómica. Microarrays
Currently, a limitation of the method is that the lengths of individual reads of DNA sequence are in
the neighborhood of 300-500 nucleotides, shorter than the 800-1000 obtainable with chain
termination methods (e.g. Sanger sequencing). This can make the process of genome assembly
more difficult, particularly for sequence containing a large amount of repetitive DNA. As of 2007,
pyrosequencing is most commonly used for resequencing or sequencing of genomes for which the
sequence of a close relative is already available.
The templates for pyrosequencing can be made both by solid phase template preparation
(Streptavidin coated magnetic beads) and enzymatic template preparation (Apyrase + Exonuclease).
El tipo de instrumental necesario: p. ej. el “454 GS FLX platform” fabricado por Life
Sciences (usado para Proyectos Genomas recientes: de especies vegetales con propiedades
medicinales, del oso Panda, del gusano de la seda y del hombre de Neanderthal)
The complete sequencing workflow of the GS FLX and GS Junior Systems comprise of four main
steps, leading from purified DNA to analyzed results. These basic steps include:
Generation of a single-stranded template DNA library
2) Emulsion-based clonal amplification of the library
3) Data generation via sequencing-by-synthesis
1)
Figure 1: Sequencing reaction of the Genome Sequencer System. Millions of copies of a single clonal
fragment are contained on each DNA Capture Bead.
35
Análisis globales de los genomas. Genómica. Microarrays
Equipamiento:
Image Processing
The Genome Sequencer System software tracks the location of DNA carrying beads on a XY axis.
Each bead corresponds to a XY-coordinate on a series of images. The signal intensity per nucleotide
flow is recorded for each bead over time and is plotted to generate a flowgram. Each 10-hour
sequencing run with the GS FLX Titanium series will typically produce over 1,000,000 flowgrams,
one flowgram per read, while each 10-hour sequencing run with the GS Junior Titanium series will
produce approximately 100,000 flowgrams (Figure 2).
Figure 2: Genome Sequencer System Image processing overview.
4) Data analysis using different bioinformatics tools
36
Análisis globales de los genomas. Genómica. Microarrays
Explicación de los sucesivos pasos más en detalle
Sample Input and Fragmentation
The GS FLX and GS Junior Systems support the sequencing of samples from a wide variety of starting
materials including genomic DNA, PCR products, BACs, and cDNA. Samples such as genomic DNA
and BACs are fractionated into small, 300- to 800-basepair fragments. For smaller samples, such as
small non-coding RNA or PCR amplicons, fragmentation is not required. Instead, short PCR products
amplified using Genome Sequencer fusion primers can be used for immobilization onto DNA capture
beads as shown below under "One Fragment = One Bead". The GS FLX and GS Junior Systems support
multiple sample prep options.
Library Preparation
Using a series of standard molecular biology techniques, short adaptors (A and B) - specific for both the
3' and 5' ends - are added to each fragment. The adaptors are used for purification, amplification, and
sequencing steps. Single-stranded fragments with A and B adaptors compose the sample library used for
subsequent workflow steps.
One Fragment = One Bead
The single-stranded DNA library is immobilized onto specifically designed DNA Capture Beads. Each
bead carries a unique single-stranded DNA library fragment. The bead-bound library is emulsified with
amplification reagents in a water-in-oil mixture resulting in microreactors containing just one bead with
one unique sample-library fragment.
emPCR (Emulsion PCR) Amplification
Each unique sample library fragment is amplified within its own microreactor, excluding competing or
contaminating sequences. Amplification of the entire fragment collection is done in parallel; for each
fragment, this results in a copy number of several million per bead. Subsequently, the emulsion PCR is
broken while the amplified fragments remain bound to their specific beads.
One Bead = One Read
The clonally amplified fragments are enriched manually or using the REM e System for liquid handling
workstations. The fragments are then ready for loading onto a PicoTiterPlate device for sequencing. The
diameter of the PicoTiterPlate wells allows for only one bead per well. After addition of sequencing
enzymes, the fluidics subsystem of the sequencing instrument flows individual nucleotides in a fixed
order across the hundreds of thousands of wells containing one bead each. Addition of one (or more)
nucleotide(s) complementary to the template strand results in a chemiluminescent signal recorded by the
CCD camera within the instrument. For a detailed explanation of this reaction see Sequencing
Chemistry.
Data Analysis
The combination of signal intensity and positional information generated across the PicoTiterPlate
device allows the software to determine the sequence of more than 1,000,000 individual reads with the
GS FLX System and 100,000 individual reads with the GS Junior System, per 10-hour instrument run.
For sequencing-data analysis, three different bioinformatics tools are available supporting the following
applications: de novo assembly up to 400 megabases; resequencing genomes of any size; and amplicon
variant detection by comparison with a known reference sequence.
37
Análisis globales de los genomas. Genómica. Microarrays
5) basado en los trabajos del grupo de Craig Venter (2010) Science 329(5987):52-6.
La Genómica “moderna” comenzó en la década de los 1990s, pródiga en Proyectos Genoma. Por ejemplo, la
secuencia del genoma de Mycoplasma genitalium fue determinada en 1997 por el equipo del mediático Craig
Venter, utilizando los clásicos BACs.
a) ¿Por qué se eligieron BACs y no el plásmido Bluescript como vectores para construir la genoteca?
b) Para este proyecto, se decidió no secuenciar los insertos de la genoteca por “caminado cromosómico”.
¿Cómo se hizo entonces? Compare ventajas y desventajas de ambos métodos.
Recientemente, la comunidad científica fue asombrada por la noticia –también proveniente de Venter- de
reemplazo de genoma (uno natural por otro semi-sintético) en bacterias del género Mycoplasma, elegido por
tres razones:
i) sus especies exhiben fenotipos muy diferentes entre sí (por ej., morfología de colonias).
ii) porque abarca a bacterias sin pared (y por lo tanto fácilmente transformables con DNA foráneo).
iii) porque tienen un genoma pequeño, que él compara a un software “liviano”, modificable a voluntad por el
investigador, y “ejecutable” por la célula a través de complejos macromoleculares que actuarían como
hardware.
Las bacterias “semi-sintéticas” fueron generadas ensamblando pequeños módulos de DNA sintético,
respetando la secuencia natural de Mycoplasma mycoides, y amplificando el nuevo genoma en levaduras
en forma de YAC, antes de introducirlo en Mycoplasma capricolum.
c) Para convencer a la comunidad científica de que ocurrió realmente un reemplazo de genomas la estrategia
preveía retener el genoma dador y al mismo tiempo deshacerse del genoma original de la bacteria receptora
y poder así lograr cambios fenotípicos bien evidentes. ¿Qué “truco” muy usual habrá diseñado Venter para
lograrlo? ¿Qué evento genético tuvo que haber descartardo Venter para asegurar que no quedó
absolutamente nada de genoma de Mycoplasma capricolum?
Aun con ese “truco”, los primeros intentos resultaron infructuosos a menos que las bacterias receptoras
fueran previamente transformadas con el siguiente plásmido, en presencia de neomicina.
E.R.
neoR
E.R.
ORI
sensib dr
Esquema de la construcción. Los tres genes indicados tienen su propio promotor. El gen E.R., en este caso
interrumpido, normalmente codifica a la enzima de restricción predominante en ambas especies de Mycoplasma.
neoR: gen de resistencia a neomicina. sensib dr: gen de sensibilidad a una droga. El plásmido carece de origen de
replicación (ORI) a propósito.
d) ¿En qué consiste la estrategia salvadora mostrada en la figura? ¿Qué habría ocurrido si Venter se hubiera
olvidado de agregar neomicina al cultivo? ¿Por qué habían fracasado los primeros intentos de reemplazo de
genoma?
e) ¿Cómo habrá hecho Venter para verificar el reemplazo genómico, es decir que el genoma dador
(mycoides) estaba presente y el de capricolum no?
38
Análisis globales de los genomas. Genómica. Microarrays
6) basado en Green et al (2010) Science 328:710-22.
Los Neanderthal comenzaron a habitar Europa y Asia occidental hace 230.000 años. Co-habitaron con
humanos “modernos” durante miles de años hasta que se extinguieron hace 29.000. Estudios de genómica
comparativa revelaron que sus genomas nucleares son 99.5% similares entre sí, dato consistente con un
ancestro común hace varios cientos de miles de años atrás. Las diferencias genéticas estimadas entre
Neanderthals y humanos (en promedio 0.5%) son más que las que hay entre dos humanos cualesquiera
entre sí (aprox. 0.1%).
Estudios de mtDNA (que evoluciona mucho más rápido que el DNA nuclear) de numerosos individuos
Neanderthal y humanos aportaron datos de secuencia de genomas mitocondriales completos relativamente
distantes, sugiriendo que no hubo cruza entre ellos, sino gradual reemplazo poblacional (teoría “out of
Africa”). Sin embargo, recientemente se publicó un interesante paper (Green et al., 2010) que reporta la
secuencia del genoma nuclear entero del hombre de Neanderthal, cuestionando la creencia anterior y
argumentando a favor de que los pre-modernos migraron desde Africa hacia Asia y Europa y
evolucionaron separadamente para dar lugar a variantes regionales de Homo sapiens (teoría “multiregional”).
Los autores de ese trabajo, (entre ellos, el grupo de Svante Pääbo en Leipzig) usaron tres huesos hallados
en una cueva de Croacia que datan de aprox. 38.000 años atrás y que no tenían mayor valor morfológico
para los paleontólogos. Metodológicamente, el DNA fue extraído de los huesos mediante un torno de
dentista en condiciones estériles, fragmentado, los fragmentos ligados a oligonucleótidos adaptadores
(generando una “library”), amplificados por PCR y secuenciados por pirosencuenciación.
Se compararon las secuencias de Neanderthal con humano moderno europeo, asiático y africano, y con
chimpancé. De entre aquellas secuencias no compartidas con chimpancé, se halló un mayor número de
posiciones nucleótidicas compartidas entre Neanderthal y humano moderno europeo y asiático, que entre
Neanderthal y humano africano.
Los autores interpretan estos datos como que hubo flujo génico mediante cruzas entre Neanderthal y
humano moderno, desafiando teorías previas vigentes, por lo cual tuvieron que convencer a los
antropólogos evolutivos que la metodología usada, pirosecuenciación “profunda”, es confiable. En este
contexto, algunas de las dificultades técnicas consistieron en:
i) la necesidad de eliminar el abundante DNA bacteriano (mayor a 95%!) que contaminaba a los huesos o
si esto no era posible, no considerarlo en el análisis.
ii) evitar la contaminación de DNA humano en la preparación de las muestras a secuenciar, por supuesto, y
sobre todo, identificar las muestras involuntariamente contaminadas, para descartarlas.
iii) tener en cuenta la desaminación espontánea de citosinas, que se sabe es significativa al cabo de miles
de años transcurridos, aun en células muertas, generando datos de aparentes sustituciones C → U o C →
T, que obviamente no corresponden a genuinas diferencias entre Neanderthal y humano.
a) ¿Cree Ud. relevante haber secuenciado el genoma del Neanderthal? ¿Sirve para algo más que para
demostrar que es posible secuenciar el de una especie extinta? ¿Se pueden sacar conclusiones
claras sobre la evolución de los humanos?
b) ¿Cómo cree Ud. que pudieron ser superadas las dificultades técnicas mencionadas?
Para reflexionar: ¿Le parece importante que existan Proyectos Genoma? En aquellas especies en
que ya se cuenta con un Proyecto Genoma, ¿tiene sentido seguir secuenciando genomas enteros de
individuos? por ej.: ¿servirían para estudiar asociación de polimorfismos con enfermedades
genéticas en distintas poblaciones humanas?
39
Análisis globales de los genomas. Genómica. Microarrays
Análisis globales de los genomas y transcriptomas
Genómica y
Transcritómica
mediante
microarrays
40
Análisis globales de los genomas. Genómica. Microarrays
Breve introducción teórica:
La disponibilidad de un elevado número de secuencias de ácidos nucleicos, posibles ya sea gracias a
la información provista por numerosos experimentos de clonado realizados independientemente, o
bien gracias a los recientes Proyectos Genoma, ha permitido la fabricación de “microarrays” o
“chips” de DNAs, que consisten en oligonucleótidos, clones de cDNA, clones genómicos o
productos de amplificación por PCR de regiones genómicas de una especie, ordenadamente
depositados en un soporte inerte. Los “microarrays” pueden ser hibridizados con:
1) DNA total de otras especies, para evaluar pronunciadas diferencias a nivel genómico (p. ej. genes
muy divergentes o ausentes), o bien DNA total de la misma especie en casos de sospecha de
alteraciones genómicas (como número de copia de algunos genes) en determinadas células, p. ej. en
cáncer. Esta estrategia se llama hibridización genómica comparativa (abreviada CGH en inglés).
2) cDNA total de determinadas células o tejidos de la misma especie bajo condiciones determinadas
(hormonas, transfección con genes exógenos, situaciones de stress, infección por patógenos, etc.).
En estos casos, se obtienen datos de transcripción de varios o muchos genes a la vez, llamados
“transcriptomas”. Estos, comparados con los obtenidos en condiciones normales o de referencia,
son muy útiles para evaluar “patrones de expresión” de una pequeña o gran (dependiendo del
número de genes depositados en el “microarray”) fracción del genoma. Esta estrategia se llama
genómica funcional.
Como la detección se basa en la propiedad de hibridización de los ácidos nucleicos, la tecnología de
microarrays tiene las bondades y limitaciones de aquélla. Recordemos que la hibridización permite
reconocer moléculas de ácidos nucleicos homólogas (con umbral variable a voluntad del operador)
y que depende de la cantidad y calidad (secuencia) de las mismas. En el caso de los microarrays, se
permite que la hibridización llegue al equilibrio, no se mide cinética.
Las nociones principales de la metodología involucrada en el uso de microarrays están
incorporadas en los problemas de ejercitación siguientes.
La combinación de esta metodología con la de “Inmunoprecipitación de Cromatina” (ChIP) se verá
más adelante en el capítulo de “Cromatina”.
41
Análisis globales de los genomas. Genómica. Microarrays
Problemas
1) basado en Cassat et al. J Bacteriol. (2005) 187: 576–592.
Con el fin de evaluar diferencias genómicas entre cepas virulentas y no virulentas de
Staphylococcus aureus, los autores del paper eligieron la estrategia CGH. Compraron un
microarray comercial preparado por la empresa Affimetrix que contiene 2.589 oligonucleótidos
diferentes, correspondientes a genes de copia única conocidos de una cepa no virulenta, tomada
como cepa de referencia.
Los oligonucleótidos fueron depositados (printed en inglés) por un robot (microarrayer) como dots
de 150 µm en un portaobjetos cubierto con polilisina.
Por otro lado, se marcó DNA genómico de una cepa virulenta con DNA polimerasa (enzima
“Klenow”) y dUTP acoplado a un colorante fluorescente rojo. La marcación del DNA genómico de
la cepa de referencia fue hecha con Klenow y dUTP acoplado a un colorante fluorescente verde.
Ambas muestras de DNA marcado se usaron simultáneamente para hibridizar el panel (previamente
tratado con anhídrido succínico para bloquear los grupos básicos de la polilisina libre) siguiendo el
protocolo indicado en www.microarrays.org., en condiciones de mediana rigurosidad.
Los portaobjetos fueron scanneados por medio de un scanner marca GenPix y las imágenes
obtenidas fueron analizadas con el software GenePix Pro 3.0. A continuación se muestra una
porción de la imagen obtenida (en el archivo original se ven los colores)
Análisis de los resultados:
% spots
78
15
7
Intensidad fluorescencia rojo/verde
1 ó muy cercano a 1
< 0.30
Entre 0.30 y 1
a) ¿Qué información suministra cada una de las tres filas de la tabla?
b) ¿En qué fila de la tabla se encuentran los genes que tienen una sola mutación puntual en
alguna de las cepas con respecto a la otra?
c) ¿Es esperable el resultado de la segunda fila de la tabla (15%) para cepas de la “misma
especie”?
d) El valor de 85 % es similar al % de genes reconocidos por BLAST como homólogos entre los
aprox. treinta genes de copia única secuenciados en ambas cepas. ¿Cree Ud. que fue conveniente
el umbral elegido, de 0.30? ¿De qué manera se hubiera modificado la tabla y cómo hubiera sido
la correspondencia con BLAST si se hubiera elegido un umbral de 0.25?
e) En base a los resultados, ¿es posible estimar el nivel de similitud global de los genomas entre
ambas especies?
42
Análisis globales de los genomas. Genómica. Microarrays
2) basado en el paper de los ¿hermanos? Zhang, Zhang y Zhang (2005) Plant Mol Biol, 58, 401-19.
Con el fin de identificar los genes que se expresan específicamente en el desarrollo floral en
Arabidopsis, se abordó la estrategia de genómica funcional, utilizando un microarray comercial
conteniendo 22.746 oligonucleótidos correspondientes a numerosos ORFs. La metodología fue muy
similar a la del problema anterior con la diferencia de que los DNAs fluorescentes para la
hibridización fueron preparados a partir de RNA total, transcriptasa reversa (en lugar de DNA
genómico y DNA Pol) y dNTPs. De esta manera se obtuvo cDNA correspondiente a cada tejido
(hoja, tallo, raíz, brotes florales y flores diferenciadas), marcado diferencialmente al haber agregado
a la mezcla de reacción UTP acoplado a sustancias fluorescentes de diferente color.
Resultados:
17.583 spots mostraron fluorescencia cuando se hibridizó con cDNA proveniente de al menos
menos 1 de los tejidos examinados.
12.245 spots mostraron fluorescencia cuando se hibridizó con cDNA proveniente de cualquiera de
los tejidos examinados.
104 spots mostraron fluorescencia solamente cuando se hibridizó con cDNA proveniente de brotes
florales tempranos.
a) ¿A qué corresponderán los spots que nunca mostraron señal fluorescente?
b) ¿Cuáles son los pasos a seguir para sacarles bien el jugo a los resultados obtenidos?
c) ¿Qué clase de genes esperaría para la mayoría del grupo de los 104 mencionados?
d) ¿Cómo evaluaría la performance de todo el proceso? ¿Validaría Ud. el resultado obtenido
para un gen en particular en forma individual mediante otra técnica?
e) Además de estos microarrays a escala genómica (genome-wide) ¿oyó hablar de alguna otra
técnica moderna para determinar patrones de expresión génica a nivel global?
43
Análisis globales de los genomas. Genómica. Microarrays
3)
Los resultados de los Proyectos Genoma de primates hominoides desarrollados en la década
pasada confirmaron que el genoma del humano (Homo sapiens) y el del chimpancé (Pan
troglodytes) son más similares entre sí (96%) que lo que son el de mono (Macacus rhesus) y el
humano entre sí (93%), o el de mono y el de chimpancé entre sí (93%). Sin embargo, análisis
preliminares de los transcriptomas de cerebro, obtenidos usando un microarray de secuencias
codificantes de DNA humano, revelan resultados sorprendentes: los de monos y chimpancés son
muy similares entre sí, y éstos son muy diferentes al del humano. En cambio, los transcriptomas de
linfocitos o hígado de cada una de las tres especies reflejan las diferencias globales de los
respectivos genomas.
Estos resultados de microarray y los descriptos más abajo en la Tabla 1 provienen del grupo de
Svante Pääbo (Enard et al. [2002] Science 296:340).
Abajo se presentan los resultados mencionados de microarrays en forma de “árboles”. La longitud
de las ramas se dibujó de manera que refleja el nivel de variación entre especies en los patrones
cuantitativos de hibridización.
a) en base a los genomas (GCH; microarray hibridado con DNA genómico marcado):
H. sapiens
M. rhesus
P. troglodytes
b) en base a los transcriptomas (microarray hibridado con cDNA total marcado):
Hígado
Linfocitos
H. sapiens
Cerebro
H. sapiens
M. rhesus
M. rhesus
P. troglodytes
H. sapiens
M. rhesus
P. troglodytes
P. troglodytes
a) ¿Qué opinión le merece la decisión de los autores de abordar genómica funcional hibridizando
ácidos nucleicos de distintas especies entre sí? (con respecto a esta cuestión, les recomendamos ver
Gilad et al., Genome Res [2005] 15: 674-80).
b) ¿Cree Ud. que estos nuevos resultados cuestionan el considerar al chimpancé como el primate
más cercano evolutivamente al Hombre?
c) Aceptando que las diferencias en patrones de transcripción de los mismos tejidos entre diferentes
especies son gobernadas por sus respectivos genomas, ¿qué tipo de genes debieron haber sido
realmente relevantes en la evolución del Hombre?
44
Análisis globales de los genomas. Genómica. Microarrays
A continuación se muestra un análisis comparativo de proteínas de cerebro de humano y
chimpancé mediante electroforesis en poliacrilamida en dos dimensiones:
d)
Son estos resultados compatibles con los transcriptomas mostrados? ¿Dan información
adicional?
chimpancé (Pan troglodytes)
Su rama evolutiva se separó de la de
homínidos hace aprox. 6.000.000 años
mono rhesus (Macacus rhesus)
Comparte con humanos y chimpancé
un ancestro común que existió aprox. 25.000.000 años
atrás.
el Prof. Svante Pääbo (representante de Homo sapiens)
en su oficina del Instituto Max Planck
de Antropología Evolutiva
Leipzig, Alemania
45
Análisis globales de los genomas. Genómica. Microarrays
Novedad técnica: los PCR arrays (sin hibridización)
En los últimos años ha aparecido una nueva generación de arrays de ácidos nucleicos, pero no
concebidos para una posterior hibridización sino para una posterior RT-PCR cuantitativa. Estos
“PCR arrays” consisten en placas microwell, en cada uno de cuyos pocillos se han colocado
distintos pares de primers específicos para medir las cantidades de transcriptos asociados a un
proceso biológico determinado (hay disponibles comercialmente arrays para varios procesos, a
elección del investigador).
Técnicamente, es sencillo: se mezcla la muestra de cDNA (obtenida como siempre a partir de RNA
total y Transcriptasa Reversa) con una master mix para PCR (Taq polimerasa, dNTPs), luego se
agregan iguales volúmenes a cada uno de los pocillos donde están los primers, y se corre un
programa apropiado para monitorear la amplificación que va ocurriendo en todos los pocillos
simultáneamente mediante Real Time PCR en el instrumento que se tenga (los hay de las empresas
ABI, Bio-Rad, Stratagene y Roche).
De esta manera, uno puede averiguar si los genes cuyos primers están en el array muestran
expresión inducida o reprimida en procesos normales o patológicos, como por ejemplo ciclo celular,
apoptosis, adhesión celular, diferenciación, inflamación, estrés oxidativo, cáncer, etc.
La empresa líder en la fabricación
(http://www.sabiosciences.com/home.php).
de
46
estos
PCR
arrays
es
SABiosciences
Cromatina
47
Cromatina
1) basado en Weintrab & Groudine (1976) Science 193: 848-856
Para entender la relación entre estructura de la cromatina y expresión génica, se estudiaron dos tipos
de células de pollo: reticulocitos (precursores de los glóbulos rojos), los cuales expresan grandes
cantidades de globina; y fibroblastos, que no expresan nada de globina. Se quería saber si las
secuencias de globina existen bajo las mismas o diferentes estructuras cromatínicas comparando
estos dos tipos celulares. Como “probes” de la estructura de la cromatina se usaron dos nucleasas:
la micrococal y la DNasa I pancreática.
En el experimento i) se trataron núcleos de cada una de estas células con estas nucleasas por
separado y después se extrajo el DNA total.
En el experimento ii) se purificaron monómeros de nucleosomas (a partir de cromatina de núcleos
tratados con nucleasa micrococal a alta concentración). A una alícuota se la trató con tripsina para
eliminar 20 a 30 aminoácidos del extremo amino de cada histona. Después, los nucleosomas
purificados fueron incubados con las nucleasas, y luego se extrajeron los DNA.
Todos estos DNA fueron sometidos a electroforesis en agarosa, transferidos a nitrocelulosa e
hibridizados con cDNA globina como sonda. Los resultados están dibujados en la siguiente figura:
i)
F: núcleos de
fibroblastos
R: núcleos de
reticulocitos
F
R
F
R
F
R
F
R
ii)
f: nucleosomas de
fibroblastos
r: nucleosomas de
reticulocitos
r-trip:
nucleosomas de
reticulocitos +
tripsina
f
r r-trip
f
r
48
Cromatina
En base a los resultados,
a) ¿Las histonas están presentes en la cromatina transcripcionalmente activa?
b) Explique qué consecuencias tiene la acción de la tripsina in vitro sobre la estructura de los
nucleosomas.
c) ¿Lo que distingue cromatina activa de inactiva es una propiedad relacionada solamente con el
empaquetamiento de estructuras de alto orden o es también una propiedad de los nucleosomas
individuales?
d) Bajo este diseño experimental en que no hubo extremo fijo marcado, ¿habrían variado los
resultados de los Southerns si los nucleosomas no hubieran estado bien “posicionados” in vivo (es
decir, si su posición relativa a determinados nucleótidos fuera variable en todas las células)?
----------------------------------------------------------------------------------------------------------------------------- ---------------
2) Prediga la utilidad de la siguiente estrategia experimental que consiste en las indicadas etapas
secuenciales:
1. Tratamiento de células vivas con formaldehído (que forma “bases de Schiff” reversibles con grupos
-NH2 de dos macromoléculas distintas, haciendo de “puente” covalente entre ellas)
2.
3.
4.
5.
6.
7.
8.
Aislamiento de núcleos
Sonicación (que significa tratamiento generador de ultrasonido)
Inmunoprecipitación con anticuerpo anti-factor de transcripción X
Incubación a 69ºC/proteinasa K
ligar oligonucleótidos adaptadores (de secuencia conocida) al DNA inmunoprecipitado
PCR con primers específicos para dichos adaptadores
secuenciar producto de amplificación
Protocolo alternativo:
1-5. Idem protocolo I
6. Ligar al plásmido Bluescript el DNA inmunoprecipitado (inserto)
7. Transformar E. coli con el plásmido recombinante y plaquear en medio con IPTG y X-gal
8. Elegir varias colonias blancas al azar y cultivar bacterias de cada colonia en medio líquido
9. Purificar plásmido de cada colonia
10. Secuenciar el inserto de cada colonia
¿Cuál protocolo eligiría Ud.?
49
Cromatina
3) basado en Weinmann et al. (2002) Genes and Develoment 16:235
Las estrategia mencionada en el problema anterior se llama “Inmunoprecipitación de
cromatina” (ChIP), que también se usa para detectar modificaciones covalentes en las histonas que
influyen en la expresión génica. En particular, combinada a microarrays (chips) genómicos, puede
ser de gran utilidad, como lo demuestran los autores del trabajo citado, para el factor de
transcripción E2F, que como veremos más adelante, está involucrado en el ciclo celular.
Realizando ChIP con anticuerpo anti-E2F e hibridizando el inmunoprecipitado contra un
microarray de clones de una library genómica humana enriquecidos en islas CpG, se obtuvo lo
siguiente:
Resultado de la hibridización del chip
Detalles experimentales:
Los clones (productos de PCR sin purificar) fueron depositados por un robot (microarrayer) como
dots de 150 µm en un portaobjetos cubierto con polilisina. Luego los DNA fueron desnaturalizados
antes de su uso.
Por otro lado, la marcación del DNA inmunoprecipitado fue hecha con dUTP acoplado al colorante
fluorescente rojo. La marcación del control sin anticuerpo fue hecha con dUTP acoplado al
colorante fluorescente verde. Ambas sondas se usaron simultáneamente para hibridizar el panel
(bloqueando previamente la polilisina libre) siguiendo el protocolo indicado en
www.microarrays.org.
Los portaobjetos fueron scanneados por medio de un scanner marca GenPix y las imágenes
obtenidas fueron analizadas con el software GenePix Pro 3.0. Las señales rojo/verde > 2 fueron
consideradas positivas.
a) ¿Qué información se puede extraer de este experimento?
b) ¿Cuáles serían los siguientes pasos a seguir para completar la información?
c) ¿Qué otra metodología post-ChIP confirmaría los resultados mostrados?
50
Cromatina
4) basado en los hallazgos comentados por Kornblihtt et al. (2009), Nature Structural & Molecular Biology
16(9):902-3.
Al digerir cromatina total de insectos o humana mediante nucleasa micrococal y someter los
fragmentos de DNA “protegidos” resultantes (de aprox. 150 pb) a secuenciación “profunda” (en
este caso por pyrosequencing), se observó con sorpresa que las secuencias obtenidas -para el caso
de genes activos- correspondían preferencialmente a exones y no a intrones!
La correlación fue aun mayor cuando los nucleosomas fueron purificados mediante
inmunoprecipitación con anticuerpo anti-H2A.Z (una clase de histona H2A) antes de la
pirosecuenciación.
Más aun, comparando secuencias que mostraban solapamiento, se vio que también éstas tenían
extremos idénticos.
¿Le llaman la atención estos resultados? ¿Habrá alguna relación entre el splicing y la organización
de la cromatina en genes activos? ¿Se anima a elaborar un modelo?
51
Epigenética
Imprinting
Inactivación del cromosoma X
52
Epigenética
1) basado en Kaneda et al. (2004) Nature 429(6994):900-3.
La DNMT3 eucariota (DNA [citosina-5] metil transferasa de novo) ha sido objeto de una
intensa investigación porque regula procesos biológicos clave en células germinales (aunque no es
indispensable para que ocurra la gametogénesis) y durante el desarrollo embrionario.
Aunque la enzima no ha sido cristalizada como otro tipo de metil transferasas (como p. ej. de
restricción en procariotas o de histonas en eucariotas), se la ha podido purificar y estudiado su
mecanismo de catálisis en detalle. Se sabe que su gen mapea en el brazo corto del cromosoma 2 en
humanos y que tiene 23 exones. Los exones 17-22 codifican al sitio catalítico de la enzima.
a) Si se quiere generar ratones KO para el dnmt3, ¿qué región del gen wt eligiría Ud. para eliminar y
reemplazar con el gen neo y así obtener una efectiva versión mutada in vitro, para luego transformar a
las ES cells?
b) Ratones knock-out homocigotas para dnmt3 resultaron letales embrionarios (Fig. 1). ¿Qué sugiere
este hecho? ¿Qué modificaciones esperaría en la cromatina que envuelve al grueso de las islas CpG en
los embriones abortados?
dnmt3a -/-
wt
Morfología de embriones knock-out para el gen dnmt3 (centro y derecha) y un control wild-type
(izquierda). Los embriones mutantes muestran defectos tales como un cerebro más pequeño y un tubo
neural abierto.
53
Epigenética
2)
En la literatura científica, hay unos pocos ejemplos de transgenes reporter silenciados naturalmente,
que se des-silencian debido a estrés por calor, ya sea en plantas adultas pre-floración (Lang-Mladek,
et al, Molecular Plant 2010) o en larvas de moscas (Seong et al, Cell 2011). Tal situación de descilenciamiento se transmite a la progenie, que expresa el reporter aunque no haya sido estresada.
a)
¿Qué macromoléculas (qué función bioquímica) son candidatas a ser consideradas como
sensoras del aumento de temperatura y así provocar cambios epigenéticos?
b)
¿Cree Ud. que los cambios epigenéticos responsables del des-silenciamiento deben ser
estables en meiosis y por lo tanto aparecer en las gametas del individuo estresado, para poder
explicar el fenómeno observado?
Además, sorprendentemente, en ambos modelos biológicos mencionados, la cruza sexual entre un
individuo adulto sin reporter que fue estresado y un individuo con reporter silenciado que no fue
estresado también origina una progenie que expresa el reporter aunque no haya sido estresada.
¿Cómo se explica dicho resultado?, es decir:
c) ¿Qué genes pudieron haberse activado en el individuo estresado cuyos productos pudieron haber
actuado sobre el complemento genético del cigoto resultante de la fecundación?
Problemas sobre Imprinting (3-7)
3)
a) Proponga una estrategia experimental para averiguar si un gen humano en particular está sujeto
a imprinting, aclarando:
¿Cuántos individuos por lo menos hacen falta? ¿Emparentados o no emparentados?
¿Analizaría DNA o RNA?
¿Es necesario tener información de polimorfismos?
¿Qué técnicas eligiría?
b) Proponga una estrategia experimental para identificar a todos los genes humanos sujetos a
imprinting, aclarando:
¿Cuántos individuos por lo menos hacen falta? ¿Emparentados o no emparentados?
¿Analizaría DNA o RNA?
¿Es necesario tener información de polimorfismos?
¿Qué técnicas eligiría?
4)
a) peg1 es un gen autosómico que se expresa normalmente solamente a partir del alelo de origen
paterno, el cual no se encuentra metilado. ¿Esperaría anomalías en la expresión de peg1 en ratones
wild-type “clonados” por transferencia nuclear (tipo oveja Dolly)?
b) Los autores del trabajo del problema 1), mediante cruzas y usando el sistema cre/lox, generaron
ratones KO homocigotas en dnmt3a condicionales, en los cuales la recombinasa cre estaba bajo las
órdenes del promotor/enhancer de un gen llamado TNAP (Tissue Non-Specific Alkaline Phosphatase),
que a pesar de su nombre se expresa activamente sobre todo en células germinales (desde muy
temprano, en el embrión) y gametas. Dichos ratones KO resultaron fértiles.
¿Qué resultados de expresión de peg1 esperaría Ud. en la descendencia obtenida de los siguientes
cruzamientos?:
i) un ratón knock-out condicional hembra x un ratón macho normal
ii) un ratón knock-out condicional macho x un ratón hembra normal
54
Epigenética
5) basado en Prawitt et al (2005) Proc Natl Acad Sci U S A. 102(11): 4085–4090. Bertaux et al (2005), J
Biol Chem Vol. 280, No. 33, 29625–29636, Cai & Cullen, 2007 RNA 13(3): 313-6.
El síndrome de Beckwith-Wiedemann (BWS) es una enfermedad hereditaria caracterizada
por alta estatura, macroglosia (lengua tan grande que no cabe en la boca), hepatomegalia (hígado
grande) y una predisposición a un tipo de cáncer de riñón llamado “tumor de Wilms”. La región
genómica alterada parece ser el cromosoma 11p15 donde hay dos genes clave: IGF2 (abreviatura de
insulin-like growth factor 2), situado río arriba; y H19, que codifica a un RNA no codificante,
situado río abajo y que no está asociado a los síntomas de la enfermedad.
Ambos genes son regulables positivamente por un mismo enhancer transcripcional con
localización atípica: río abajo de H19. Sin embargo, se sabe que normalmente ambos genes son de
expresión excluyente sobre el mismo cromosoma, es decir, si se expresa uno, no se expresa el otro.
Las causas de dicha exclusión mutua en cis se atribuyen al hecho siguiente: río arriba y a
pocas kb de H19, se halla una región llamada DMR (Región Metilada Diferencialmente), que afecta
(por los mecanismos clásicos de des/acetilación de histonas) la expresión de H19. A su vez, DMR,
cuando no está metilada, es reconocida por una proteína llamada CTCF, que actúa como “aislante”
transcripcional, impidiendo la acción a distancia del enhancer sobre IGF2, pero no afectando su
acción sobre H19 (ver figura 1).
Figura 1: esquema de la región 11p15.
telómero
enhancer
H19
DMR
IGF2
Bgl II
Bgl II
4 kb
Para entender el mecanismo genético del origen de BWS, se han hecho los siguientes experimentos
y observaciones:
Figura 2: árbol genealógico de una familia con los individuos afectados.
I.1
II.1
I.4
I.3
I.2
II.2 II.3 II.4 II.5
II.6 II.7
II.8
II.10
II.9
II.
4
III.8
III.1 III.2 III.3 III.4 III.5 III.6 III.7
IV.1
IV.2
IV.3
IV.5
IV.5
IV.5
III.9
IV.4
símbolos llenos: individuos con síntomas leves o severos de BWS
símbolos vacíos: individuos sanos
símbolos cruzados: fallecido
rombo: sexo no determinado
55
III.10
IV.5
Epigenética
Figura 3: Southern, usando DNA genómico de algunos individuos, cortado con la enzima BglII y
un clon de H19 como sonda
calle 1: DNA de cualquiera de los siguientes
individuos:
I.2, II.5, III.1, III.2, IV.2
calle 2: DNA de cualquiera de los siguientes
individuos:
I.1, I.3, I.4, II.2, II.6, III.3, III.6, IV.1
Figura 4: RT-PCR cuantitativa usando RNA de hepatocitos o linfocitos de algunos individuos y
primers específicos para IGF2 y para H19.
a) ¿Qué tipo de herencia sigue el BWS?
b) ¿Qué características estructurales a nivel nucleótidico tendrá la región DMR y cómo puede
influir sobre la expresión de H19?
c) Proponga un modelo que explique los resultados genotípicos, de expresión génica y fenotípicos
en:
i) personas normales
ii) los pacientes con BWS
indicando en ambos casos las modificaciones epigenéticas dentro de la DMR en las gametas
masculinas y femeninas (o en las células germinales precursoras).
d) ¿Es consistente el modelo que Ud. propuso en c) con la alta expresión de H19 en la abuela I.2?
e) Se sospecha que, además de IGF2 o H19, hay otros genes involucrados en tumores de Wilms,
que podrían mapear en el cromosoma 11 o bien en otro, y que podrían estar duplicados, o ausentes
por deleción. ¿Qué experimento podría hacerse para testar esta hipótesis?
56
Epigenética
6) basado en los experimentos de Jeannie Lee en Harvard Medical School.
¿Qué se espera con respecto a la viabilidad embrionaria de los ratones resultantes de los
siguientes cruzamientos?:
i) un ratón macho knock-out (quimera) para toda la región promotora/regulatoria del gen Tsix con
ratón hembra normal, es decir XΔY x XX.
ii) un ratón hembra de la F1 anterior con ratón macho normal, es decir XXΔ x XY
¿Qué mecanismos epigenéticos están implicados?
La renombrada Dra. Jeannie Lee, Profesora de Genética y Patología en la Harvard Medical School
y en el Massachusetts General Hospital, Boston
http://www.hhmi.org/research/investigators/lee_bio.html
57
Epigenética
7) basado en el trabajo publicado en Chromosome Research 15: 147-161 (2007) por el Center for Kangaroo
Genomics, Australia; y en el Proyecto Genoma Ornitorrinco, Nature 453: 175–183 (2008).
Los mamíferos metaterianos (marsupiales), ejemplificados por el popular canguro australiano (Fig.
1), divergieron de los mamíferos euterianos (placentarios) hace 180 millones de años.
Figura 1. Canguro australiano corriendo velozmente
Con el fin de investigar el patrón de inactivación del cromosoma X en marsupiales, se realizaron
cruzas entre canguros de las sub-especies australianas Macropus robustus robustus y Macropus
robustus erubescens. Aprovechando polimorfismos génicos entre ellas, a los individuos parentales y a
su descendecia (F1) se les analizó la enzima HPRT (hipoxantina-fosfo-ribosil-transferasa), codificada
por un gen localizado en el cromosoma X y expresada ubicuamente (Tabla I). Dicha proteína está muy
estudiada porque está ausente en humanos afectados con el síndrome neurológico de Lesch-Nyhan.
robustus
193
193
erubescens
180
180
F1(robustus
x erubescens
193
193
)
F1(erubescens
180
x robustus
)
180
Tabla I. Se indica el número de aminoácidos de la enzima HPRT en los linfocitos de cada grupo de
animales adultos. En ningún caso se observaron las dos isoformas simultáneamente en el mismo
individuo.
a) ¿Cuál es la identidad del cromosoma X inactivado en canguros adultos hembra? Compare con lo
que Ud. sabe que sucede en ratones en el estadío embrionario temprano, en la placenta y en el individuo
adulto.
b) i) ¿Qué debe pasar en la línea germinal femenina con respecto a las marcas epigenéticas del
cromosoma X heredado del padre?
ii) ¿Qué debe pasar en la línea germinal masculina con respecto a las marcas epigenéticas del
cromosoma X (heredado de la madre)?
c) ¿Qué marcas epigenéticas esperaría encontrar y cuáles no esperaría encontrar en el cromosoma X
inactivo en las células de los canguros hembra? ¿Cómo las detectaría en el laboratorio?
Mediante experimentos de Southern usando subclones BAC de ratón como sondas, o mediante
Hibridización Genómica Comparativa usando microarrays, se ha demostrado la ausencia de ortólogos
de genes Xist y Tsix tanto en marsupiales como en monotremos.
58
Epigenética
Los mamíferos monotremos, típicamente ejemplificados por el morfológicamente extraño
ornitorrinco (“platypus”, en inglés) australiano (Fig. 2), ponen huevos como las aves y secretan un
veneno como muchos reptiles. Su genoma, de tamaño similar al de los marsupiales y placentarios, y que
también aloja a genes de microRNAs, consta de algunos cromosomas muy pequeños y 10 cromosomas
sexuales, pareciéndose en este sentido más al genoma de reptiles y aves que al del resto de los
mamíferos, de los cuales divergieron hace 210 millones de años.
Figura 2. Ornitorrinco nadando plácidamente en aguas australianas
d) En función de lo que ahora sabe de marsupiales, monotremos y mamíferos ¿qué hipótesis
parsimoniosa puede conjeturar acerca de la evolución del sistema génico Xist/Tsix?
59
Epigenética
Otro ejemplo de array sin hibridización:
Methyl-Profiler™ DNA Methylation PCR Arrays
60
Silenciamiento génico
61
Silenciamiento génico
1) basado en Francis y Spiker (2005) Plant J. 41: 464-477.
Los Tn (transposones de DNA) y el T-DNA de Agrobacterium sp se usan para hacer tagging con el
propósito de identificar genes responsables de ciertos fenotipos en bacterias y plantas,
respectivamente. Este tipo de estrategia, ya muy difundida para Arabidopsis thaliana, requiere la
capacidad de reconocer los individuos mutantes que exhiben fenotipos causados por pérdida de
función génica, como en el paper del grupo de Jerzy Paszkowski de la Guía de Seminarios.
Fotografía de la parte aérea de una planta de Arabidopsis thaliana
Usualmente, dentro de los T-DNA se incorpora un gen de resistencia al antibiótico kanamicina bajo
las órdenes del promotor fuerte 35S, para seleccionar las plantas transformadas con el T-DNA. Sin
embargo, Francis y Spiker vieron que esa modalidad de selección no es del todo práctica porque,
independientemente del sitio de inserción, ocasiona que se descarten muchos individuos
transgénicos, que también serían útiles para el propósito de tagging.
a) Los individuos descartados que se mencionaron arriba corresponden a falsos negativos del
sistema de selección basado en resistencia a kanamicina. ¿Se le ocurre por qué se generan estos
falsos negativos? ¿Puede describir el mecanismo involucrado? (pista: participa una enzima
exclusiva del reino vegetal y unos pocos eucariotas unicelulares, pero ausente en animales).
b) ¿Qué modificaciones epigenéticas sobre el DNA esperaría encontrar en el gen de resistencia a
kanamicina en los falsos negativos? Indique cuáles son, formule un modelo posible para explicar su
aparición y cómo las detectaría en el laboratorio, indicando dos metodologías independientes.
c) ¿Sería posible encarar un T-DNA-tagging omitiendo el sistema de selección mencionado?
62
Silenciamiento génico
2)
Caenorhabditis elegans es un pequeño (~ 1 mm) nematodo modelo con un reducido número de células
(aprox. 1000). Es posible en el laboratorio conseguir animalitos transgénicos al microinyectar genes o clones
de una library en la gónada, donde se encuentran los óvulos (oocytes) de los progenitores hermafroditas
(técnica de C. Mello, premio Nobel 2006).
células musculares
Estos gusanitos exhiben un movimiento ondulatorio (similar al de las víboras de gran tamaño) gracias a
genes que se expresan en las 81 células musculares distribuidas en su pared corporal, p. ej. el gen unc, cuyo
transcripto mide 800 bases.
a) Con el propósito de clonar un gen (cualquiera) de silenciamiento post-transcripcional (PTGS), y
sabiendo que los RNAs cortos son capaces de pasar de célula a célula, se siguió el siguiente protocolo,
que consiste en etapas secuenciales:
1. Conseguir una población de gusanos Caenorhabditis elegans hemafroditas wild type
2. Proceder a una mutagénesis química masiva (con dosis moderada de mutágeno)
3. Esperar a tener individuos de la generación F2
4. Incubarlos en presencia de dsRNA unc en el medio de cultivo para que ingrese por la boca
5. Seleccionar los pocos individuos que se mueven
6. Microinyectarle a cada uno (en su línea germinal) un clon distinto de una library genómica wild type
(construida en YACs), es decir generar una colección de transgénicos para probar complementación
7. Seleccionar un individuo paralítico de la progenie (siempre en presencia de dsRNA unc)
8. Analizar el inserto del clon YAC que logró reversión de fenotipo por complementación
9. Buscar genes ortólogos a los del inserto mediante BLAST en bases de datos
¿Encuentra Ud. racionalidad en esta estrategia? ¿Le satisface este protocolo tal cual, lo modificaría
agregando o quitando alguna etapa o control, o lo rechazaría por completo?
b) ¿Qué resultado de Northern (RNA total de todo el gusano) revelado con cDNA unc esperaría Ud. para los
individuos indicados? Dibuje abajo las bandas esperadas (teniendo en cuenta que el dsRNA exógeno
gatillador no es detectable en este análisis).
long.(nt) 1
4
5
7
carril 1: gusanos del paso 1)
carril 4: la gran mayoría de los gusanos del paso 4)
carril 5: gusanos del paso 5)
carril 7: gusanos del paso 7)
800
25
c) Si el dsRNA se administrara radioactivo (en todos sus fosfatos) a gusanos wild type, y luego se les
extrajera y purificara el complejo “RISC”, ¿esperaría o no encontrar el RISC radioactivo? Ayúdese con un
dibujo de los pasos involucrados en el mecanismo.
63
Silenciamiento génico
3) ¿Cómo comprobaría experimentalmente, usando un gen reporter y células de mamífero en
cultivo, la interacción entre el mRNA de un gen en estudio y un miRNA endógeno predicha
bioinformáticamente?
4) basado en Hao et al (2008), Nature 454: 890-893
Drosophila melanogaster y Caenorhabditis elegans son especies en las que está bien puesto a punto el
screening funcional de genes a escala genómica, mediante RNAi, es decir, usando una library de
dsRNAs (fabricada por transcripción in vitro de ambas hebras de muchas regiones genómicas
codificantes, sin intrones, seguida por annealing de los RNAs complementarios (Foley et al. [2004]
PLoS Biol. 2(8):E203)
Los autores del trabajo citado, preocupados por el avance de pandemias de gripe en humanos en
distintos países y ante la incertidumbre sobre la eficacia de las vacunas, se propusieron identificar genes
celulares necesarios para el ciclo de vida del virus de la gripe A H1N1. Para eso, decidieron aprovechar
la existencia de una library de dsRNA de Drosophila ya fabricada y usada por otros autores, pero antes
obviamente tuvieron que modificar el virus de manera que pudiera infectar a células de Drosophila:
reemplazaron las proteínas virales HA (hemaglutinina) y NA (neuraminidasa), reconocidas por los
receptores celulares en mamíferos, por: 1) la proteína de envoltura del virus VSV, que es reconocida por
receptores ubicuos; 2) la reportera GFP, respectivamente.
El protocolo que siguieron consistió en depositar ordenadamente en placas multiwell cada uno de los
13.000 dsRNAs diferentes de la colección correspondientes a 13.000 genes de mosca (90% del
genoma), depositar las células de mosca en todos los pocillos (wells) y a las 48 hs. infectar las células
con el virus de la gripe modificado.
¿Cómo completaría Ud. el screening, teniendo en mente una futura posible terapia química anti-virus de
la gripe A H1N1? ¿Qué control es absolutamente necesario hacer para no terminar identificando un gen
celular esencial no relacionado con el ciclo de vida del virus?
64
Ciclo celular
Cáncer
Virus oncogénicos
65
Ciclo celular, cáncer, virus oncogénicos
1) Mediante el software del sitio http://www.invivogen.com/sirnawizard/design.php , diseñe el
mejor shRNA para down-regular la expresión del (potencial) oncogen CDK4 en células Hela
en cultivo. Escriba la secuencia completa: brazo sense, loop y brazo anti-sense.
----------------------------------------------------------------------------------------------------------------------------------2) basado en Maddison et al. (2004) Cancer Research 64: 6018.
Empleando la técnica convencional de knockout (KO), se generaron ratones heterocigotas
para el gen Rb modificado de tal manera que tuviera secuencias lox embebidas en sus intrones 19 y
20 (individuos RbloxP/+). A partir de óvulos fecundados de esos ratones, se hicieron transgénicos
para el gen de la recombinasa procariota cre bajo el promotor del gen PB, específico de próstata
adulta (individuos RbloxP/+ Cre+/-).
Machos y hembras se cruzaron para obtener individuos Cre+/RbloxP/loxP, es decir los
deseados Rb-/-, que fueron los seleccionados para el posterior análisis genotípico y fenotípico. Al
cabo de 18 semanas, se sacrificaron luego de que unas horas antes se les hubo inyectado
bromodeoxiuridina (BrdU) intraperitonealmente.
a) Para verificar el éxito del KO condicional ¿sirve hacer PCR para seleccionar los animales
buscados? En caso afirmativo, ¿con qué primers? ¿con qué células?
b) Si el KO resultó exitoso y 100% eficiente, ¿qué proporción de animales seleccionados se
espera con respecto al número de parentales?
c) ¿Por qué los autores no habrán hecho KO del gen Rb en forma convencional, es decir en
todas las células y a nivel embrionario?
d) Mediante histoquímica, los autores observaron que los animales KO adultos seleccionados
tenían epitelio prostático hiperplásico (mayor tamaño debido a un alto número de células).
Sabiendo que los mamíferos tenemos dos genes parálogos de Rb (p107 y p130), ¿Ud.
hubiera esperado un resultado semejante?
e) ¿Para qué habrán inyectado BrdU? ¿Qué información pudo brindar?
f) ¿Qué genes esperaría encontrar con expresión aumentada en la próstata de los animales
seleccionados? ¿E2F, por ejemplo?
--------------------------------------------------------------------------------------------------------------------3) Basado en Anticancer Agents Med Chem (2006) 6:377 y J Med Chem (2006) 49:4896
Grandes compañías farmacéuticas como Abbott están realizando screenings de compuestos
orgánicos sintéticos para identificar inhibidores químicos de la kinasa de checkpoint Chk1, como
por ejemplo, los que poseen la estructura básica 4-fenilpirrolo[3,4-c]carbazol-1,3(2H,6H)-diona.
Por cristalografía de Rayos X se observó que este tipo de sustancias compiten con el ATP por el
sitio catalítico activo de la enzima.
Estas drogas se administran contra tumores p53-/- junto con agentes terapéuticos químicos o
físicos que dañan el DNA. ¿Cuál es la racionalidad del diseño de estas drogas?
--------------------------------------------------------------------------------------------------------------------4) Basado en Ding et al (2006) J Med Chem. 49:3432
La proteína llamada MDM2 es una ligasa de ubiquitina, específica en las lisinas Cterminales de varias proteínas, incluyendo a p53. La ubiquitinación de p53 es una marca para su
exportación desde el núcleo y degradación en el proteasoma celular. Compañías famacéuticas (p. ej.
Merck y Hoffman-Roche) están estudiando la droga llamada “nutlin”, una pequeña molécula que
desestabiliza la unión p53-MDM2. ¿Por qué mecanismo ejercería esta droga su acción antitumoral? ¿Serviría esta droga como terapia en todos los casos de cáncer?
66
Ciclo celular, cáncer, virus oncogénicos
5) basado en Michalides et al (2004) Cancer Cell 5(6):597-605 y Zwart et al (2007) EMBO J 26(15):3534-44
Hay algunos tumores de glándula mamaria que conservan el receptor de estrógenos (ER+) y
que por lo tanto son dependientes de los estrógenos circulantes, lo cual justifica la implementación de
terapias anti-estrógenos; mientras que hay otros tumores sin receptor de estrógenos (ER-), por lo tanto
independientes de estrógenos, y que son más difíciles de combatir.
Ejemplos de drogas anti-estrógenos que se usan en clínica médica son:
a) inhibidores de aromatasa (enzima tipo citocromo P-450), responsable de biosíntesis de estrógenos.
b) el tamoxifeno, estructuralmente similar al estradiol.
El mecanismo de acción del tamoxifeno reside en el hecho de que compite con los estrógenos,
porque se une al receptor de estrógenos, induciéndole un cambio de conformación más desplegada que
impide que éste se una correctamente a proteínas co-activadoras de la transcripción. La incapacidad de
responder a estrógenos finalmente lleva a apoptosis, debido a falta de expresión de genes target de
estrógenos y sobre-expresión de genes de caspasas (proteasas pro-apóptóticas).
Lamentablemente, a veces aparecen tumores ER+ resistentes a tamoxifeno, seguramente
como consecuencia de adicionales mutaciones somáticas. A partir de cultivos primarios de ellos, se
obtuvieron líneas celulares tumorales ER+, como la llamada CF-7 usada a menudo en investigación.
Una metodología para detectar en el laboratorio el cambio de conformación de ER es FRET
(Förster o Fluorescence Resonance Energy Transfer) en células vivas, que consiste en la transferencia de
energía entre determinados fluoróforos, por ejemplo los polipéptidos fluorescentes GFP, YFP y CFP. Se
basa en que la energía emitida por un fluoróforo puede ser absorbida por otro cuando ambos se sitúan en
la misma molécula o en distintas pero cercanas (10 – 100 A de distancia), como se muestra en la figura:
CFP
Los autores citados han hecho los siguientes experimentos pero no con CF-7 (ER+) sino con
células HeLa (ER-):




Células HeLa transfectadas con la construcción YFP-ER-CFP (es decir, ER fusionado a CFP en una
punta y a YFP en la otra punta) exhiben efecto FRET.
Dicho efecto FRET se anula en presencia de tamoxifeno.
La anulación del efecto FRET por el tamoxifeno no ocurre cuando las células se incuban con
cAMP, que disocia a la kinasa pKA, activándola. En estas condiciones, a ER se lo ha detectado
fosforilado en su Serina 305
La anulación del efecto del efecto FRET por el tamoxifeno sigue ocurriendo cuando las células en
presencia de cAMP son transfectadas con una versión YFP-ER-CFP mutante tal que una Alanina
reemplace a la Serina 305 del ER.
Preguntas:
a) ¿Qué se puede concluir acerca de un mecanismo probable de resistencia de algunos tumores de mama
a tamoxifeno y qué experimento adicional sugeriría hacer?
b) ¿Qué opina de la elección de la línea celular Hela para hacer los experimentos mencionados?
67
Ciclo celular, cáncer, virus oncogénicos
Virus oncogénicos
1) Ejemplo de DNA virus
basado en Bais et al (1998) Nature 391:86
El virus herpes (HV) humano tipo 8 se ha encontrado asociado a Sarcoma de Kaposi (KS),
siendo reconocido como responsable de la patología, y por lo tanto ahora se lo llama KSHV. El
análisis de su secuencia nucleotídica reveló varios ORFs, uno de los cuales resultó corresponder a
un gen de la familia de los “G-protein coupled receptors” (GPCR), conocidos previamente como
integrantes de una cascada de señalización -vía proteínas G triméricas y kinasas- activada por
citoquinas durante procesos inflamatorios.
Se sospecha que el gen GPCR de KSHV es responsable del fenotipo tumoral en KS.
a) Diseñe un experimento usando células en cultivo y otro con animales para investigar si GPCR es
realmente un oncogen.
b) En caso de afirmarse la hipótesis anterior, ¿qué experimento haría para determinar cuál vía de
kinasas –entre las mediadoras de la señalización entre receptores de membrana y el núcleo- está
involucrada en la patogenia de KS?
c) ¿Esperaría encontrar niveles altos de VEGF en KS?
---------------------------------------------------------------------------------------------------------------------
2) Ejemplo de RNA virus
basado en Cato et al (1987) EMBO J. 6:363
El Virus de los Tumores Mamarios Murinos (MMTV) es un retrovirus oncogénico y suele
causar tumores exclusivamente en las glándulas mamarias de ratones hembra. A diferencia de otros
retrovirus oncogénicos como el legendario Rous Sarcoma Virus (RSV) descubierto en 1911, el
MMTV no posee ningún oncogen. Lo que sí posee es un elemento de respuesta a hormonas (HRE),
localizado en los LTR, que actúa como enhancer transcripcional en respuesta a hormonas
esteroideas (se le une el receptor de esteroides, que migra desde el citoplasma al núcleo).
Dé una explicación de cómo MMTV produce sus efectos oncogénicos y proponga un enfoque
experimental para testear su hipótesis.
Para reflexionar: ¿Valdrá la pena investigar para desarrollar estrategias anti-tumorales
universales, es decir para combatir todo tipo de tumores, o tendría más probabilidad de éxito la
investigación sobre terapias específicas para tumores particulares?
68
Telómeros y telomerasas
69
Telómeros y telomerasas
1)
María Blasco y Carol Greider (Cell (1997) 91(1):25-34) analizaron el fenotipo de ratones
knock-out (KO) homocigotas para el componente RNA de la telomerasa (clonado por Elizabeth
Blackburn y Carol Greider [premios Nobel 2009] en 1989). Ellas observaron que estos animales y
la descendencia resultante de la cruza entre ellos eran aparentemente normales, pero que en cada
generación iban muriendo cada vez más jóvenes. El análisis fenotípico llegó hasta los animales de
la generación 6, ya que éstos resultaron infértiles.
Por otra parte, análisis citogenéticos (por FISH) revelaron claras diferencias cromosómicas: los
telómeros de fibroblastos embrionarios de ratones (MEFs) de la generación 6 medían en promedio
15 kb, contrastando con los de MEFs de ratones wt, que medían en promedio 45 kb.
a) Teniendo en cuenta que la tasa de pérdida de longitud de los telómeros en células murinas
somáticas es 50-200 pb/división celular (dato obtenido de experimentos con células en cultivo), ¿a
Ud. le sorprendió que hayan podido nacer ratones sin telomerasa? Para convencerse, estime el
número aproximado de divisiones celulares que ocurren desde un cigoto hasta una gameta madura
de un ratón adulto derivado de ese cigoto. Compare su respuesta con la respuesta a la similar
pregunta d) del Problema 1 de la página 12.
b) ¿Se podría haber hecho la estimación anterior analizando solamente el tamaño de los telómeros
de animales wild type? ¿Por qué?
c) Intente dar una explicación molecular del fenotipo de los ratones KO en cuanto a longevidad y
fertilidad.
d) ¿Es posible predecir si los ratones KO serán más propensos o menos propensos a contraer
tumores naturales o provocados?
70
Telómeros y telomerasas
2) basado en Fitgerald et al. (1999) PNAS 96: 14813 y Shakirov & Shippen (2004) Plant Cell 16: 1959-1967
Se ha demostrado que los cromosomas de las plantas también tienen telómeros -aunque
mucho más cortos que en el reino animal- que consisten en repeticiones en tándem del heptámero
TTTAGGG, en un número que depende del “ecotipo” (que significa variedad con genotipo
característico). Para ver si su síntesis y función es como en protozoarios ciliados y mamíferos, se
han realizado estudios en Arabidopsis thaliana (ecotipo Columbia), produciendo plantas
transgénicas que llevan el cDNA de la subunidad catalítica de la telomerasa (AtTRT) de 3372 bp
bajo un promotor constitutivo (no muy fuerte para evitar silenciamiento). Extractos proteicos
nativos de hojas transgénicas fueron sometidos al protocolo TRAP (telomerase repeat
amplification protocol) (resultado en Fig. 1). Como controles, también se usaron callos (embriones
somáticos), o de meristema apical (células en el extremo del tallo por donde crece la planta) o bien
de hojas totalmente diferenciadas.
a) ¿Era esperable la ausencia de actividad de telomerasa en hojas diferenciadas?
b) ¿En cuantos nucleótidos de longitud difieren entre sí los productos de amplificación
visualizados como un “escalera” (ladder en inglés) en el gel post-PCR?
Por otro lado, se obtuvieron transgénicas vía Agrobacterium tumefaciens que llevan un T-DNA
conteniendo un gen marcador de selección. Sobre 10.000 individuos, se realizó un screening masivo
por PCR usando un primer para uno de los bordes del T-DNA y otro primer para una secuencia del
gen AtTRT. De esta manera, se encontró un solo individuo que dio producto de amplificación, el
cual fue autopolinizado para obtener individuos KO homocigotas (llamados T1) y éstos dieron lugar
a plantas de la siguiente generación (T2). Más tarde se obtuvo la tercera generación (T3), pero estos
individuos resultaron estériles. Southern blots de algunas de estas plantas, usando sondas
teloméricas, se muestran en la Fig. 2.
71
Telómeros y telomerasas
WT
T1
T2
T3
kb
54.5 4-
.
Fig. 2. Southern blot de DNA de hojas clivado con la enzima Sma I (reconoce a 5’ CCCGGG 3’) y
usando la sonda (TTTAGGG)4
c) ¿Cuál fue el fundamento del screening por PCR en la segunda serie de experimentos?
d) Estudios citogenéticos de hojas de las plantas T3 revelaron la existencia de fusiones
cromosómicas en algunas células. ¿Cuál puede ser la causa?
e) Relacionando con el paper sobre telómeros visto en Seminarios, ¿cuál puede ser la razón
molecular por la que no se lograron individuos T4?
f) Estime el largo promedio aproximado de los telómeros en hojas de Arabidopsis wild type.
-------------------------------------------------------------------------------------------------------------------3)
En la actualidad, si se quiere conocer el efecto de la anulación de un gen determinado
(knock-out) sobre el fenotipo en Arabidopsis, se pueden utilizar las múltiples líneas transgénicas,
mutadas por inserción al azar de T-DNA, generadas por el Instituto Salk (La Jolla, California,
USA), disponibles gratuitamente: http://signal.salk.edu/cgi-bin/tdnaexpress, y cuyas inserciones
ya fueron mapeadas
Accediendo a este sitio y sus links a “ncbi y “TAIR” (The Arabidosis Information Resource),
averigüe:
a) ¿Qué línea knock-out en el gen de telomerasa pediría al instituto Salk? (busque el # código)
b) ¿en cuál cromosoma de Arabidopsis se encuentra el gen del componente proteico de la
telomerasa? ¿Cuáles son sus genes vecinos?
c) ¿Cuál es el código de este gen en GenBank?
d) ¿Cómo realizaría el pedido a Salk de la línea de interés?
------------------------------------------------------------------------------------------------------------------------
72
Telómeros y telomerasas
4)
Un ratón adulto hembra (llamado “1”) amamantando a su cría fue usado para un
experimento de clonado por transferencia nuclear: un núcleo de una de sus células de glándula
mamaria fue aislado e introducido a un óvulo desprovisto de su propio núcleo, posibilitando más
tarde el nacimiento de un ratón clonado (llamado “2”), al cual se lo ha estudiado desde su
concepción. El ratón “2”, cuando llegó a adulto, fue usado para un nuevo y similar procedimiento
de clonado, tomando un núcleo de su glándula mamaria, para generar otro ratón clonado (llamado
“3”). Este nuevo ratón “3” murió muy joven y evidenciaba fusiones cromosómicas en sus células
somáticas.
Prediga el resultado del siguiente Southern usando DNA total obtenido a partir de gametas, de
glándula mamaria en crecimiento o de embriones de estadíos tempranos (blastocistos, preimplantación uterina) de los tres animales. Los DNAs fueron clivados por la enzima ApaI y se usó
el oligonucleótido (TTAGGG)10 como sonda. Justifique.
Gametas 1
Gland. mam. 1
Embrión 2
gland. mam. 2
73
Embrión 3
gland. mam. 3
Genética Humana
74
Genética Humana
1) basado en Schwahn et al. (1998) Nat Genet 19:327, y otros en Hum Mol Genet
La Retinitis Pigmentosa (RP) es una progresiva degeneración de células fotorreceptoras de la retina
y una de las más frecuentes causas hereditarias de pérdida parcial de visión y hasta ceguera en humanos
y perros siberianos. Hay distintas causas genéticas de esta enfermedad, por ejemplo mutaciones en
genes de distintos fotorreceptores -que residen en los cromosomas 8 y X humanos- y por lo tanto se
observan diferentes formas de herencia. Para identificar qué gen está mutado en dos familias en
particular que consultan a un centro oftalmológico, se las ha analizado en cuanto a su fenotipo (Fig. 1) y
genotipo en linfocitos sanguíneos (Tabla I), usando marcadores de RFLP que mapean en el cromosoma
X y en el cromosoma 8.
El trabajo intensivo con esos marcadores en el laboratorio permitió la deducción de los mapas físicos de
las regiones genómicas que abarcan a estos marcadores y la obtención de clones YAC y BAC que
corresponden a dichas regiones (Fig. 2).
FAMILIA 1
FAMILIA 2
Fig. 1. Arboles genealógicos de dos familias estudiadas indicando las personas enfermas
Tabla I. Marcadores moleculares usados en los análisis de ligamiento. Se indica el número de
individuos recombinantes hallados en las familias estudiadas
Marcador Nº recomb en familia #1
Nº recomb en familia #2
DXS7
7
10
NDP
6
8
DXS1707
4
5
503LE2
3
4
PH117
0
0
159RE1
0
0
OATL1
1
2
D8S2607
12
13
D8S2610
10
11
YACs y BACs
cromosoma X
Fig. 2. Mapas físicos de los intervalos genómicos humanos estudiados
75
Genética Humana
a) ¿Cuáles de los marcadores RFLP elegiría para el clonado posicional del locus involucrado?
Ubique a dicho locus en alguno de los mapas de la Fig. 2.
b) Una vez elegidos los marcadores, ¿qué procedimiento seguiría para identificar un gen candidato
involucrado en la enfermedad en las familias analizadas?
Una vez identificado el gen, se lo llamó RP3. A cada lado de este gen se encontró una secuencia de
300 pb sin ningún ORF. Cada una de estas secuencias de 300 pb contiene una región promotora
para la RNA polimerasa III y repeticiones directas de 7 pb en sus extremos.
Basándose en la secuencia de RP3, se diseñaron primers para hacer PCR (Fig. 3) y RT-PCR (Fig. 4)
del paciente 2967.
Fig. 3. PCR de 2967 con primers
para amplificar exones 1-2.
Fig. 4. RT-PCR de 2967 para amplificar los exones
1-5 y 3-5. Se usó RNA total de retina.
“-“significa control sin RT
HPRT es un gen control
A raíz de estos resultados, luego se determinó la secuencia completa de RP3 en el paciente 2967,
que reveló una inserción de 6.0 kb en el extremo 3’ del intrón 1, compatible con una unidad
transcripcional bicistrónica con dos ORFs, el segundo correspondiente a una transcriptasa reversa.
c) ¿A qué corresponde la inserción encontrada en el intrón 1? ¿Es una rareza estructural?
d) ¿A qué corresponden las secuencias flanqueantes? ¿Son una rareza estructural? ¿Pueden
constituir la causa de la enfermedad del paciente 2967 ?
e) ¿Cuál es la probable causa a nivel molecular de las alteraciones visuales en la familia 2 ?
f) Por otro lado, al paciente 3102 y a su padre se les hizo SSCP del exón 2 (Fig. 5). ¿Qué
información arroja ese resultado? ¿Cuál sería el paso a seguir para investigar las causas genéticas de
las alteraciones visuales en la familia 1?
Fig. 5. SSCP del exón 2 del paciente 3102 y de su padre
g) El gen RP3 y sus adyacencias contienen islas CpG metilables. Al hacer Southern blots usando
altas concentraciones de enzimas de restricción sensibles a metilación, se observó que éstas son
capaces de cortar el 50% de los fragmentos de DNA que contienen el alelo mutado provenientes
de retinas de las madres 3101 y 2966 ¿Con qué fenómeno es consistente este resultado?
76
Genética Humana
2) basado en Cecilia Lai et al, (2001) Nature 413(6855):519-23 y Enard et al (2002) [grupo de Svante
Pääbo], Nature 418(6900):869-72.
Existe una enfermedad genética hereditaria en humanos llamada Dispraxia Verbal del Desarrollo
(DVD) caracterizada por incapacidad de realizar movimientos faciales finos, lo cual dificulta
severamente el habla y el lenguaje desde una edad muy temprana. Con el propósito de clonar el gen
responsable, se han estudiado los individuos de tres generaciones de varias familias afectadas, de las
cuales se muestra el pedigree (árbol genealógico) de una de ellas (Fig. 1).
I
II
III
Figura 1. Pedigree de una familia mostrando los individuos afectados (símbolos llenos)
a) ¿Qué tipo de herencia aparentemente sigue la enfermedad?
Usando varias sondas que hibridizan a regiones de DNA polimórficas, se ha podido identificar a
una de ellas, llamada NH0563, como ligada al gen buscado.
b) ¿Cómo procedería de aquí en adelante, para lograr el objetivo deseado?:
i)
usaría una genoteca humana construida en BACs
ii)
usaría una library de cDNA de cerebro humano
iii)
otra opción (diga cuál)
Finalmente, por la estrategia contestada en b), se llegó a dos genes candidatos en la región 7q31q32: uno expresado normalmente en estructuras del sistema nervioso durante la embriogénesis, el
cual codifica al factor de transcripción “FOXP2” (llamado así porque contiene el dominio FOX o
forkhead, de unión a DNA, similar al de genes homeóticos de Drosophila); y otro, expresado
solamente en sistema nervioso adulto, que codifica a una kinasa.
c) ¿Qué estudios sencillos haría Ud. con el DNA de personas de esta familia para tener más
elementos a favor de uno u otro gen candidato? ¿Incluiría también a personas de familias no
afectadas? Indique la metodología.
La secuencia de FOXP2 (el gen candidato favorito) en los individuos I-2, II-6, III5 y III-17 mostró,
en uno de los dos alelos, una mutación puntual que genera una sustitución de arginina por
histidina en la posición 553 de la proteína (se abrevia “R553H”, según la notación usual para
sustituciones), que se halla en el dominio de unión a DNA y cerca del extremo carboxiterminal (ver
figura en página siguiente).
77
Genética Humana
Esquema de estructura primaria de la proteína FOXP2, mostrando sus dominios estructurales y
funcionales:
Q-rich
WT
DNA-binding
(adicional)
L-rich
(dimeriz.)
FOX
NH2
acidic
COOH
RH
mutación
missense
553
RX (STOP)
mutación
Nuevo
nonsense
328
¿Es posible deducir si la mutación R553H es dominante por “haplo-insuficiencia” del alelo normal
o es dominante negativa?
¿Ayudaría para responder la pregunta tener en cuenta el hecho de que FOXP2 es un homodímero y
que es muy probable que la mutación R553H en 1 subunidad anule la capacidad de unión a DNA de
todo el dímero?
¿Serviría para responder la pregunta tener en cuenta el hecho de que se ha encontrado otra familia
afectada con la mutación nonsense R328X (ver figura) en heterocigocis?
¿Serviría para responder la pregunta tener en cuenta el hecho de que se ha encontrado una niña
enferma, de otra familia, que tiene una deleción de toda la región 7q31-q32 en heterocigocis?
d) A pesar de los numerosos trabajos sobre FOXP2 publicados, aún no se ha logrado identificar el
gen target que está normalmente regulado directamente por FOXP2. ¿Qué estrategia se podría
intentar para lograrlo? Indique la metodología.
Por otro lado, se hizo un estudio de evolución molecular, para lo cual se secuenció el gen FOXP2 de
varios primates. Al alinear las secuencias de los genes ortólogos con el programa CLUSTALW y
calcular, por medio del programa PAML (Yang et al [1998] Mol. Biol Evol. 15, 568), el número de
cambios sinónimos y no sinónimos que fueron ocurriendo en los distintos linajes a partir de un
hipotético gen ancestral común, se obtuvieron los resultados mostrados en la Figura 2.
Figura 2. Sustituciones nucleotídicas de reemplazo (números antes de las barras) y silenciosas
78
Genética Humana
(números después de las barras) en FOXP2, mapeadas sobre una filogenia de primates (y ratón
como “outgroup”). Los rectángulos indican cambios aminoacídicos en la proteína.
f) En base a estas evidencias, los autores apoyan un modelo en el cual la selección positiva del gen
gen FOXP2 contribuyó favorablemente a la aparición de un eficiente lenguaje oral y por lo tanto a
la expansión de la especie humana, con respecto a otros primates ¿Usted está de acuerdo con los
autores?
-----------------------------------------------------------------------------------------------------------------------Comentarios sobre la bibliografía de aspectos fisiológicos de FOXP2 (que ayudan a entender la
genética de la DVD):
El grupo de Svante Pääbo (fotografía en el capítulo de microarrays) en Leipzig, Alemania (Enard et
al, Cell [2009] 137:961-971) mostró que en el modelo ratón, el reemplazo del gen FOXP2 por el
alelo humano normal (logrado mediante “knock-in” en células embrionarias stem de ratón) provoca
en los ratones adultos un aumento de la conectividad sináptica en los ganglios basales. Estos
ganglios son núcleos neuronales del cerebro anterior donde reside el control del lenguaje, la
cognición y la actividad motora. Por el contrario, el alelo humano mutado que se encuentra en
pacientes con DVD provoca efectos opuestos en ratones knock-in.
Por otro lado, un grupo alemán de Berlín (Haesler et al, PLoS Biol [2007] 5: e321) usó un modelo de
ave (pinzón cebra, figura de abajo) para contribuir a la comprensión de la enfermedad genética DVD,
convencido de que el habla de los humanos y el canto de los pájaros comparten patrones neuronales y
conductuales. Estos investigadores mostraron: a) la expresión de FOXP2 aumenta en los ganglios
basales durante el aprendizaje del canto, que se manifiesta en pájaros macho muy jóvenes; b) el
silenciamiento de FOXP2 en los ganglios basales durante el período de aprendizaje (logrado
mediante RNA doble hebra administrado localmente vía un vector lentiviral) provocó inexacta e
incompleta imitación del canto de los machos adultos.
foto del pinzón cebra, zebra finch en inglés (Taeniopygia guttata), típico de Australia
(http://avibase.bsc-eoc.org/checklist.jsp?lang=ES&region=auwa&list=howardmoore)
Finalmente, un tercer grupo alemán (Kurt et al (2009) Brain Research, 1289:30-6), teniendo en
79
Genética Humana
cuenta la obvia relación entre audición y lenguaje y rescatando datos de expresión de FOXP2 en
cóclea y centros auditivos del cerebro, acaba de demostrar que ratones knock-in con la mutación
R553H muestran déficit de audición.
Comentario sobre la bibliografía de aspectos estructurales finos de la proteína FOXP2 (que ayudan a
entender la genética de la DVD):
Un grupo en USA con la colaboración de Svante Pääbo (Stroud al [2006] Structure 14: 159-166)
reporta la estructura del cristal del dominio forkhead purificado unido a un oligonucleótido, a una
resolución de 1.9 A, pudiendo visualizar la formación del dímero.
Comentario sobre la bibliografía de aspectos de biología celular de la proteína FOXP2 (que ayudan a
entender la genética de la DVD):
Es interesante destacar que un grupo japonés aborda por primera vez la biología celular de las
proteínas FOXP2 mutadas (Biochem Biophys Res Commun [2007] 353: 869-874). Demuestran que
tanto la que lleva la sustitución R553H como la truncada que carece del dominio de unión a DNA son
incapaces de llegar al núcleo, formando agregados citoplasmáticos. En vista de estos resultados, por
un lado no tiene mayor sentido evaluar in vitro su capacidad de unión a DNA y por el otro, lleva a
pensar que podrían actuar como poderosas dominantes negativas en los pacientes heterocigotas.
Comentario sobre la bibliografía en cuanto a diferencias funcionales a nivel bioquímico entre las
proteínas ortólogas FOXP2 de chimpancé y humano que difieren en solamente dos aminoácidos
Konopka et al (Nature 2009, 462:213-217): RNA total de neuronas humanas KO en FOXP2 pero
transfectadas con una u otra versión de FOXP2 fue usado para transcriptómica usando un microarray
de secuencias humanas. Resultado: aparecieron diferentes genes regulados (directa o indirectamente)
entre cada una de las situaciones, por lo cual se podría concluir:
1) el dominio donde mapean ambas sustituciones también es un DNA-binding domain, dándole
especificidad al factor de transcripción hacia determinados enhancers targets.
2) las sustituciones aminoacídicas que ocurrieron en el linaje humano determinaron pathways
específicos con consecuencias en el desarrollo cerebral
80
Genética Humana
2) adaptado de DeJesus-Hernandez y col Neuron, 2011 por el Dr. Ezequiel Surace
La Demencia Fronto-temporal (DFT) es una enfermedad neurodegenerativa que afecta a los
lóbulos cerebrales frontales y temporales. A nivel histológico, se observan depósitos proteicos
anómalos intraneuronales en las regiones afectadas. Clínicamente, la DFT se caracteriza por
alteraciones en el comportamiento (desinhibición, conducta socialmente inapropiada) y en el
lenguaje (afasia). Los síntomas se manifiestan en la edad adulta, generalmente a partir de los 50
años. Se sabe que entre el 20 y el 50% de los casos de DFT son hereditarios y se han identificado
hasta el momento varios genes afectados. Por trabajos previos, se sabía que existen marcadores en
el cromosoma 9 que segregaban con la DFT en un grupo importante de familias (incluida la
familia que veremos a continuación). En particular, un grupo de investigadores se centró en una
repetición hexanucleótidica (GGGGCC) localizada en un gen hasta el momento desconocido: el
gen C9ORF72 (altamente conservado entre especies), cuya estructura predicha se muestra en la
Figura 1.
Ya se conocen varias enfermedades neurodegenerativas causadas por expansión de repeticiones. En
este caso en particular, con el objetivo de estudiar la posible asociación entre la repetición
mencionada y DFT, los investigadores analizaron el genotipo y fenotipo de los miembros de la
familia DFT9 (Figura 2).
a) Observando el árbol genealógico, ¿qué tipo de herencia parecería seguir esta DFT?
81
Genética Humana
Los investigadores comenzaron por realizar la genotipificación de la repetición GGGGCC en esta
familia mediante PCR, utilizando “primers” cuya posición de anclado se muestra en la Figura 1.
b) Observando los resultados obtenidos para la PCR en la Figura 2, asigne el origen parental
de cada alelo en los individuos de la generación III. ¿Qué particularidad observa entre los
individuos afectados III1, III2 y sus hermanos III3 y III4 en cuanto al genotipo en GGGGCC?
Para continuar con el estudio de esta repetición hexanucleotídica, los investigadores deciden
realizar un Southern blot a partir de ADN genómico de los integrantes de la familia. Luego de la
digestión del ADN con la enzima BamHI, corrida electroforética, transferencia y posterior
hibridación con la Sonda A (Figura 1) obtienen el siguiente resultado:
c) Con los datos obtenidos en la PCR y en el Southern, re-evalúe el genotipo para cada
individuo de la familia, indicando el número de repeticiones GGGGCC (en caso de no poder
obtener un número exacto, haga una estimación). Comparando los genotipos deducidos aquí,
¿cómo explica ahora el resultado obtenido en la PCR de la Figura 2?
Por otro lado, un grupo de investigadores de otra universidad que analizó un grupo de familias
similares a la que se muestra en este problema afirma que la DFT asociada a C9ORF72 presenta
una herencia con penetrancia incompleta.
d) Analizando los resultados obtenidos para la familia DFT9, ¿puede Ud dar datos que
apoyen o refuten esa afirmación?
Con el objetivo adicional de indagar sobre los posibles mecanismos patogénicos desencadenados
por la expansión de GGGGCC en C9ORF72, los investigadores desarrollaron un anticuerpo que
reconocía a un epitope codificado por el exón 4. De esta manera, querían investigar si las
inclusiones proteicas intraneuronales (supuestamente tóxicas) observadas en cerebros de individuos
afectados, se debía a un depósito anómalo de esta proteína hasta ahora desconocida. Para su
sorpresa, la tinción con este anticuerpo de cortes post-mortem de cerebros de individuos con
expansión de GGGGCC demostró una leve tinción citoplasmática sin presencia de gránulos
intraneuronales.
Paralelamente a este trabajo, un grupo que se encontraba estudiando otras enfermedades asociadas a
expansión nucleótidica reportó la existencia de un mecanismo traduccional nuevo: la traducción
proteica llamada “RAN” (del inglés “repeat-associated non-ATG translation”). Estos autores
describieron que repeticiones nucleotídicas expandidas son capaces de formar RNA con estructuras
del tipo horquilla (“hairpin”) y permitir la traducción proteica en cualquier marco de lectura aun a
partir de sitios que no poseen AUG. Se postula que estructuras de horquilla estables son permisivas
para un inicio de la traducción en sitios no-AUG. Con este dato en mente, nuestros investigadores
realizaron una predicción bioinformática de la estructura secundaria del RNA con contenido
82
Genética Humana
GGGGCC y observaron que poseía una estructura tipo horquilla que se hacía más estable cuanto
mayor era el número de repeticiones.
Para estudiar la posibilidad de que in vivo ocurriera traducción tipo RAN en C9ORF72 expandido,
decidieron producir tres anticuerpos monoclonales que reconocieran, por separado, a repeticiones
de los dipéptidos Glicina-Alanina, Glicina-Prolina ó Glicina-Arginina.
e) ¿Cómo fue que llegaron a la conclusión que éstos debían ser los epitopes para generar los
anticuerpos y así evaluar posible traducción RAN?
Al realizar tinciones de cortes de cerebro de individuos con expansión en C9ORF72 usando
cualquiera de los tres anticuerpos monoclonales, observaron una tinción granular en el
citoplasma neuronal.
f) ¿Qué controles debieron haber hecho para confirmar la especificidad de la tinción
observada en cerebros con expansión en C9ORF72?
Finalmente, para ahondar en el posible rol patogénico de la traducción tipo RAN en C9ORF72
y un posible efecto tóxico de los agregados proteicos observados, los investigadores realizaron
estudios en neuronas corticales de rata en cultivo. Primero, clonaron, en vectores de expresión
carentes de ATG, repeticiones variables de GGGGCC. Luego, los usaron por separado para
transfectar neuronas; y realizaron: 1) un Western blot utilizando el anticuerpo anti-Glicina-Alanina
y 2) un experimento de medición de la velocidad de transporte axonal de una molecula “cargo”
(“cargamento” en español) marcada fluorescentemente (mediante microscopía con registro de
imágenes en tiempo real). Los resultados se muestran en la Figura 4.
g) Analizando el Western blot, ¿qué conclusiones obtiene sobre la posibilidad de traducción RAN y
el número de repeticiones de GGGGCC? (recuerde la predicción de estructura secundaria del
RNA).
h) Tomando en consideración todos los resultados de la Figura 4, y teniendo en cuenta el siguiente
dato: “Análisis de familias con expansión en C9ORF72 demostró que un número de repeticiones
mayores a 30 está ligada a DFT”, proponga un posible mecanismo por el cual la expansión del
hexanucleótido estudiado ejerce su acción patógenica.
83
Genética Humana
Terapia génica
84
Terapia génica
basado en Jin et al (2008) Cancer Res 68: 3601; y Deharvengt et al (2010) Cancer Gene Ther.17: 325-333.
p57 es un gen del cromosoma 7 que codifica a una proteína inhibidora del complejo CDK2-ciclina
D1, que actúa promoviendo la transición G1-S del ciclo celular.
Suponga que Ud. trabaja en un laboratorio que tiene como objetivo intentar terapia génica anticáncer de páncreas (telomerasa-positivo) in situ en un modelo animal mamífero usando un vector
basado en retrovirus. ¿Qué combinación de construcciones (formando parte de plásmidos) entre las
siguientes usaría Ud. para co-transfectar a las células auxiliares empaquetadoras y así conseguir
partículas infectivas en el medio de cultivo? Elija entre los cassettes de cada tipo:
1) de empaquetamiento, 2) de envoltura y 3) de genes terapéuticos
Fundamente en función de las construcciones no elegidas
1)
1a
)I
LTR
gag
pol
LTR
Ψ
1b
Pcmv
1c
Pcmv
gag
X
Ψ
X
pol
LTR: long terminal repeat
Ψ: señal de encapsidación
ΔΨ: señal de encapsidación mutada
PCMV: Promotor del virus CMV
X: deleción de 1 kb
Ψ
1d
gag
Pcmv
pol
Ψ
2)
2a
2b
Pcmv
env de HIV
Pcmv
env de VSV
85
Terapia génica
3)
Pcmv p57
3a
3b
Ψ
Ptel p57
LTR
LTR
Ψ
Ptel p57 hairpin
LTR
3c
3d
LTR
Ψ
LTR
Ptel p57
RPRd
LTR
Ψ
3e
LTR
Ptel p57
LTR
Pcmv RT
Ψ
3f
LTR
LTR
Pcmv ciclina D1 hairpin
Ψ
Ptel: Promotor de gen telomerasa (componente proteico)
RPRd: RNA polimerasa RNA-dependiente
RT: Transcriptasa Reversa
86
Problemas integratorios
(tipo examen)
87
Problemas integratorios
1) basado en Trifunovic et al., Nature. (2004) 429(6990):417-23. y Stewart et al., PLoS Biol. (2008) Jan;6(1):e10
El genoma mitocondrial (mtDNA) de mamíferos es muy pequeño (16 kb): contiene una corta región
no génica y solamente 13 genes que codifican a polipéptidos, todos involucrados en el ciclo de Krebs y
cadena respiratoria, procesos cuya alta eficiencia es clave en una célula eucariota saludable; todos los
demás polipéptidos mitocondriales están codificados en el núcleo.
La perpetuación del genoma mitocondrial está garantizada por la DNA Polimerasa mitocondrial
(llamada Pol γ), que es esencial. Su fidelidad es alta y similar a la de la DNA Pol III de E. coli y su
equivalente nuclear en eucariotas, a juzgar por su idéntica frecuencia de incorporación de nucleótidos
erróneos in vitro = 1 x 10-6. Sin embargo, el valor de reloj molecular de la región no génica del genoma
mitocondrial en mamíferos es 1%/MY versus 0.1%/MY para regiones intergénicas e intrones del
genoma nuclear de mamíferos (MY = millón de años).
a) ¿A qué se podría atribuir esa diferencia de 1 orden de magnitud?
Con la intención de investigar sobre la estabilidad del mtDNA en mamíferos (la cual se sabe se va
perdiendo con la edad en individuos normales), se empezó por poner a punto un cultivo de células de
blastocisto (stem embrionarias) de ratón XX (sexo femenino) pre-implantación.
b) ¿esperaría encontrar el cromosoma X inactivado al azar o por imprinting en esas células en cultivo?
En cualquier caso, ¿qué RNA no codificante esperaría encontrar asociado al cromosoma inactivado?
c) ¿esperaría que los extremos cromosómicos de esas células reclutaran y activaran señales de daño
genómico?
d) en base al fenotipo de proliferación celular, ¿esperaría que la proteína p53 estuviera fosforilada
todo el tiempo en esas células cultivadas?
A continuación se transfectaron esas células en cultivo con el siguiente plásmido suicida:
neoR: gen de resistencia a G418 con su propio promotor.
E1, E2, E3 y E4: exones de Pol γ
gancS: gen de sensibilidad a ganciclovir
I1, I2 e I3: intrones de Pol γ
E3 corresponde al dominio proteico donde reside la actividad 3´→ 5´ exonucleasa (proofreading), pero
contiene un codón para Alanina en lugar del wild type para Aspártico, el cual es esencial para dicha
actividad
88
Problemas integratorios
A la semana se agregó G418 y a las 2 semanas, ganciclovir; a las 3 semanas, se cosecharon las
células.
Luego, el núcleo de una de esas células fue transplantado a un óvulo de ratón desprovisto de su propio
núcleo; el pequeño embrión resultante desarrollado in vitro fue implantado en el útero de un ratón
hembra que actuó como madre adoptiva. El experimento fue repetido varias veces hasta tener éxito y
lograr una cría (ratoncito llamado F0).
e) ¿Tendrá F0 telómeros anormalmente cortos, tal como le pasó a la oveja Dolly?
f) Indique en la Figura, mediante flechas apuntando a la izquierda y a la derecha, posibles regiones
para anclar primers de PCR, forward y reverse, para confirmar que F0 es el mutante esperado
¿Esperaría la mutación en todas las células de su cuerpo? ¿en homocigosis o en heterocigosis?
Analizando por pirosecuencación el genoma mitocondrial de F0 recién nacido, se encontró que
contenía muchas sustituciones nucleotídicas, comparando con el genoma mitocondrial murino
publicado, en todos los tejidos somáticos analizados.
Luego, se cruzó al F0 adulto con otro wild type macho para obtener animales F1 y por cruzas múltiples
entre ellos se generaron F2, algunos de los cuales nacieron con aun más sustituciones nuevas (no
heredadas) en su mtDNA que las que habían incorporado F0 y F1. Esos F2, aun siendo jóvenes,
mostraron síntomas de vejez.
g) Siendo el mtDNA heredado solamente por vía materna, ¿tienen sentido las cruzas realizadas?
h) ¿A qué se deberán la inestabilidad genómica mitocondrial hallada y los signos de vejez prematura?
89
Problemas integratorios
2) basado en los últimos trabajos de Shinya Yamanaka, pionero mundial en células madre, premio Nobel 2012
MEFs (de ratón hembra) fueron incubados junto con tres (simultáneamente) tipos de partículas
retrovirales deficientes en su replicación, previamente aisladas del medio donde se cultivaron las
células empaquetadoras. Cada tipo de partícula llevaba, entre los dos LTR, una única y diferente
secuencia de RNA codificante, además de la secuencia Ψ. Todas poseían la proteína de membrana
env “G” del virus VSV.
Después de unos días, las células fueron sembradas en cajas de Petri especiales, formando, después
de un par de semanas, colonias con distintas morfologías. Estas colonias fueron propagadas de
manera clonal. Se eligió una colonia, cuyas células, bautizadas “CCCC” (Células Creadas Casi
Casualmente), fueron sometidas a los siguientes experimentos:
i) Tratamiento de núcleos con gran cantidad de DNAsa I y posterior PCR específica para el exón 4
(160 pb) del gen Fbx15.
Resultado: ausencia de amplificación, contrastando con los MEFs de partida, que dieron fragmento
amplificado de 160 pb.
ii) DNA genómico total con bisulfito, seguido de PCR para gen Fbx15.
Resultado: muchas más C convertidas a T, comparando con MEFs
iii) ChIP con anticuerpo anti-MeH3K9 seguido de Real-Time PCR para Fbx15 (Fig. 1).
iv) ChiP con anticuerpo anti-HP1 (Heterochromatin Protein 1) seguido de Real-Time PCR para
Fbx15 (Fig 2).
MEFs
MEFs
CCCC
CCCC
Figura 1. Análisis de Real-Time PCR para Fbx15.
sobre DNA obtenido mediante ChIP con
anticuerpo anti-MeH3K9.
Figura 2. Análisis de Real-Time PCR para Fbx15.
sobre DNA obtenido mediante ChIP con
anticuerpo anti-HP1.
v) inyección en blastocisto femenino e inmediata transferencia a útero de ratón de otra cepa.
Resultado: nacimiento de ratones quimera!
90
Problemas integratorios
Preguntas:
a) ¿Se habrán integrado los cDNAs de origen retroviral en el algún sitio del genoma de las células
manipuladas? ¿Qué secuencia actuó como promotor? ¿Para qué sirvió, y en qué células, el elemento
Ψ? ¿Existe riesgo que esas células produzcan virus?
b) ¿Qué sobresaliente propiedad es exhibida por las CCCC a diferencia de los MEFs originales?
c) Uno de los cDNA transferidos fue Oct3/4 ¿Su acción pudo haber provocado el resultado de i)? En
caso afirmativo, ¿qué complejos endógenos con actividad enzimática pudieron haber mediado para
explicar la causalidad?
d) ¿Cómo se compatibilizan los resultados de iii) y iv) con los de ii) y lo que Ud. sabe de
interacciones moleculares involucradas en epigenética? Si lo desea, explique ayudándose con un
dibujo de posible modelo que muestre los eventos sugeridos en forma secuencial.
e) ¿Qué patrón de inactivación de los cromosomas X habrán tenido los MEFs originales? ¿Al azar o
de acuerdo a su origen parental? ¿Y cómo será en KEFs (“kangaroo embryonic fibroblasts”)?
91
Problemas integratorios
3) basado en Yuan et al. (2003) Cancer Research 63: 4174-4180.
Para identificar múltiples genes diferencialmente expresados en tumores de mama, se realizó
una hibridización de cDNA total de células epiteliales de glándula mamaria tumorales de una
paciente, marcado con dUTP rojo, vs. cDNA de células epiteliales de mama normales de la misma
paciente, marcado con dUTP verde, sobre un microarray que contiene 30.000 genes humanos
diferentes.
Entre los varios casilleros del microarray que mostraron fluorescencia verde/rojo >3, se centró la
atención en uno que correspondía a un gen catalogado por el Proyecto Genoma Humano con el
nombre “ARHI”. Este gen no pertenece a ninguna familia génica, mapea en el cromosoma 1p31 y
contiene una isla CpG en su enhancer.
Para asegurarse de que el gen en el tumor no contiene mutaciones somáticas (y así convalidar los
resultados como una verdadera expresión diferencial), se comenzó por determinar la secuencia de la
isla en la paciente. Para ello, se la amplificó por PCR usando DNA genómico total como molde y
primers específicos, el producto se ligó a un plásmido para transformar bacterias, luego se purificó
el plásmido de 10 clones y finalmente se determinó la secuencia del inserto de cada uno de esos
clones.
Esta metodología también se siguió usando DNA genómico de la hija de esta paciente.
En experimentos paralelos, los DNA genómicos fueron tratados con bisulfito antes de hacer las
PCR.
Los resultados fueron:
Origen del DNA
Nº clones con
cada tipo de sec.
Secuencias según protocolo standard
Glándula mamaria
normal de paciente
5
5
Tumor de paciente
6
AAGCCGCGGCAGTCTCTCCGAGCAGCGCATT
GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT
AAGCCGCGGCAGTCTCTCCGAGCAGCGCATT
GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT
GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT
AGGCCGCGGCAGTCTCTCCGAGCAGCGCATT
4
Glándula mamaria
(normal) de la hija
4
6
Origen del DNA
Nº clones con
cada tipo de sec.
Secuencias según protocolo con bisulfito
Glándula mamaria
Normal de paciente
5
AAGTCGCGGTAGTTTTTTCGAGTAGCGTATT
GGGTTGTGGTAGTTTTTTTGAGTAGTGTATT
AAGTCGCGGTAGTTTTTTCGAGTAGCGTATT
GGGTCGCGGTAGTTTTTTCGAGTAGCGTATT
GGGTCGCGGTAGTTTTTTCGAGTAGCGTATT
AGGTTGTGGTAGTTTTTTTGAGTAGTGTATT
Tumor de
Paciente
Glándula mamaria
(normal) de la hija
5
7
3
4
6
en negrita se indican los dinucleótidos CpG de la isla
92
Problemas integratorios
a)
¿A qué corresponden los dos tipos de secuencias diferentes hallados para cada muestra de
DNA?
b)
¿Qué indican los datos de secuencia post-bisulfito acerca de la región regulatoria del gen en
células normales?
c)
¿Qué resultados hubieran arrojado las secuencias post-bisulfito si el tratamiento con bisulfito
se hubiera hecho sobre el producto de PCR, en lugar de hacerlo sobre DNA genómico?
¿Qué resultados hubieran arrojado las secuencias post-bisulfito derivadas del tumor si el tratamiento
con bisulfito se hubiera realizado sobre un clon BAC -que contuviera al gen ARHI- proveniente de
una genoteca del tumor, en lugar de hacerlo sobre DNA genómico?
d)
¿Qué sugieren los resultados acerca de la modalidad de expresión de ARHI en células
normales? Basándose en las secuencias de la hija ¿qué concluye con respecto a la herencia del alelo
expresado?
e)
Los resultados post-bisulfito ¿apoyan los resultados de transcriptómica (microarray) en el
tumor? ¿Qué diferencias en la estructura de la cromatina esperaría hallar entre la región regulatoria
del gen en células tumorales vs. la presente en células normales?
En base a los resultados, proponga una función para ARH1 y un evento posible que explique la
génesis del tumor, indicando una enzima participante como iniciadora.
f)
Qué marcas epigenéticas en lisinas de histonas esperaría encontrar en el enhancer estudiado
en el tumor? Dibuje un posible modelo que explique el cross-talk entre dichas marcas y las
analizadas en este problema.
g)
Luego de cultivar las células tumorales de la paciente durante varios “pasajes” ¿esperaría
encontrar en esas células una activación de proteínas del pathway de respuesta a daño tales como
ATM, ATR, CHK1, CHK2 y -H2AX?
93
Problemas integratorios
4)
Hace algunos años, se sospechaba que en mamíferos, la proteína p53 tiene muchos genes target.
a) Explique la metodología que se habrá elegido para identificar a los múltiples genes target de p53.
¿Qué gen/es se habrá elegido en primer lugar, como control positivo de tal metodología?
b) Basándose en los datos del paper de Esnault et al (en la guía de seminarios: “Dinamismo de los
genomas; transposones”), estime el orden de magnitud de la probabilidad de que, en una célula
humana, un LINE endógeno se movilice hacia el gen p53, lo interrumpa y predisponga a un cáncer.
Datos eventualmente útiles:






tamaño del gen p53: 10 Kb
número de copias del gen p53 en el genoma: 1 (en el cromosoma 17)
número de exones de p53: 11
tamaño promedio de un LINE: 7 Kb
número de copias de LINEs en el genoma humano: aprox. 100.000
tamaño del genoma humano haploide: 3 x 109 pb
94
Problemas integratorios
5) basado en Chong et al, Nature Genetics (2007) 39: 614–622; Zhu et al, Hum Genet 2007; Xie et al, Hum
Mol Genet 2006
La fibromatosis gingival hereditaria (HGF) es una rara enfermedad de la boca que consiste en un
desarrollo anormal pero benigno de tejidos gingivales (encías). El locus responsable no se conoce
pero se sabe que se encuentra en el cromosoma 11p15 y muy ligado al marcador D11S4046 (LOD
score = 8.70).
Estudiando una familia de la India afectada de HGF se observó un patrón de herencia esperable de
acuerdo a lo que se sabe (similar al de la enfermedad de Angelman), como se muestra en la Fig. 1,
pero curiosamente también se observó una rama de la familia donde se ve el patrón opuesto.
Todos los individuos enfermos y todos los transmisores sanos tenían una misma variante
polimórfica del marcador D11S4046, ausente en los sanos no transmisores.
Fig. 1. Arbol genealógico (simulado) de una familia afectada de HGF. Los símbolos llenos señalan a los
individuos con síntomas de HGF. El asterisco (*) señala a los únicos individuos vivos heterocigotas para una
mutación (heredada) en el gen DNMT3L (ver texto más abajo), que se expresa solamente en la línea
germinal masculina diploide (antes de la meiosis) pero no en el cigoto ni embrión ni células somáticas
adultas. Todos los demás individuos vivos son wild type homocigotas para el gen DNMT3L.
En un intento de descubrir las causas moleculares de la excepción observada, se analizó el genotipo
de todos con respecto al gen DNMT3L, localizado en el cromosoma 21q22.3 y que codifica a la
DNA (citosina) Metil Transferasa 3L, activa solamente en la espermatogénesis pre-meiosis. El
análisis reveló que el individuo varón II.6 y dos de sus hijas son heterocigotas para una mutación
treonina → lisina, que afecta la estabilidad de la enzima. Esa mutación es dominante debido a que
el alelo wild type no alcanza para lograr su función bioquímica de manera apropiada (en Genética,
se dice que en estos casos, el alelo sano es “haploinsuficiente”).
La mutación recién descripta explica el patrón de herencia atípico de la enfermedad, hallazgo
interesante porque indica un caso de “efecto paterno”, reportado en invertebrados pero no en
vertebrados. Sin embargo, el individuo enfermo III.17, no heredó la mutación en DNMT3L de su
padre, es decir es wild type en los dos alelos de ese gen.
Estudiando más en profundidad al padre II.6, se le analizó el patrón de metilación de una isla CpG
en el locus D11S4046 de células somáticas por la técnica del bisulfito. En la Fig. 2 se muestra el
resultado.
95
Problemas integratorios
Fig. 2. Resultado de la reacción del bisulfito para ese locus en células somáticas. Cada línea horizontal
representa una reacción de secuenciación post-subclonado (un epialelo). Los círculos llenos indican citosinas
metiladas. Los círculos blancos, citosinas no metiladas. Como control se incluyó al niño III.20
Preguntas:
a) Proponga un mecanismo molecular capaz de explicar la atípica transmisión de HGF del padre
(individuo II.6) a la hija III.17. ¿Por qué el genotipo DNTM3L fue irrelevante en el desarrollo o no
de la enfermedad en sus cuatro hijos?
b) ¿Es esperable encontrar alguna anomalía en cuanto al imprinting en general en los cuatro hijos de
II.6? ¿Habrá fallado la inactivación de uno de los dos cromosomas X (pre-implantación
embrionaria) en sus tres hijas?
c) ¿La mutación en el alelo HGF que causa enfermedad se comporta como dominante? ¿Analizando
qué individuo/s tiene sentido la pregunta? En caso afirmativo, ¿es posible deducir si dicho alelo
produce una proteína dominante negativa o por el contrario es un alelo nulo, es decir que no
produce ninguna proteína funcional?
d) ¿Es necesario indefectiblemente contar con una genoteca construida en BACs para llegar a
identificar el gen cuya versión mutada es responsable de la HGF? ¿A partir de qué locus
comenzaría el caminado cromosómico para llegar a un gen candidato?
96
Problemas integratorios
6) basado en los resultados de Callegari et al (Hepatology 2012); y Moshiri et al (Gastroenterol
Hepatol Bed Bench 2014)
Los niveles del microRNA-221 (miR-221) están aumentados en hepatocarcinoma y por lo tanto se
sospechaba que constituyen una de las causas de la progresión de tumores hepáticos. Para confirmar su
hipótesis, y para contar con un nuevo modelo útil en una eventual terapia química y génica contra esta
enfermedad, los autores generaron ratones transgénicos con alta expresión de miR-221 en hepatocitos. A
nivel fenotípico, estos ratones mostraron resultados esperados: lesiones hepáticas espontáneas y una
inusual aceleración del desarrollo tumoral inducido por mutágenos como la dietilnitrosamina.
a) Comparando hepatocitos del ratón normal y del transgénico, ¿esperaría que los telómeros tengan igual
o diferente largo promedio? ¿Qué técnica sencilla elegiría para confirmarlo? Dibuje el resultado esperado.
b) Si se realizara ChIP sobre núcleos de hepatocitos del tumor, y se usara anticuerpo contra Histona
H2AX fosforilada (γ-H2AX), ¿esperaría Ud. que inmunoprecipite DNA correspondiente a genes cercanos
a los telómeros?
c) Teniendo en cuenta que el target específico de miR-221 es el mRNA de la proteína p27, la cual es
inhibidora de una CDK (kinasa dependiente de ciclinas) que fosforila a Rb, ¿Ud. le encuentra sentido que
dicho miRNA tenga efecto tumorigénico?
d) ¿El miR-221 tiene una función sobre el ciclo celular similar u opuesta a la del miR-34 visto en el paper
de Gregory Hannon (pág 62 de la Guía de Seminarios)?
Con la intención de “secuestrar” al miR-221 montado en RISC, estos investigadores diseñaron además un
RNA de unos 100 nt que contiene repetida cuatro veces (1, 2, 3, 4 en la Figura de la página siguiente,
panel A) la secuencia complementaria al componente antisentido de miR-221. A ese RNA artificial lo
llamaron “esponja”, aludiendo a la función deseada.
Los autores probaron la eficiencia de esa “esponja” molecular, en el contexto de un vector adenovirusasociado (AAV), en una línea celular (que expresa miR-221 endógeno) co-transfectada con el gen
reportero luciferasa fusionado a la porción 3’UTR del mRNA de p27 (Figura, panel A).
e)
¿En base a los resultados de la Figura (paneles B y C), ¿le parece en principio promisoria la “esponja”
molecular diseñada, para probarla sobre los ratones transgénicos modelo?
¿Cuál habrá sido la idea de medir niveles de la proteína actina (panel C)?
97
Problemas integratorios
98