Download genes-que-regulan-la-floracion-en-maiz-y-sorgo-perspectivas

Document related concepts
no text concepts found
Transcript
GENES QUE REGULAN LA FLORACIÓN EN MAÍZ Y SORGO: PERSPECTIVAS PARA
LA SELECCIÓN ASISTIDA POR MARCADORES
Olmos, S.
INTA Pergamino. Ruta
[email protected]
32
Km.
4.5.
CP
2700.
Pergamino.
Buenos
Aires.
Argentina.
Email:
Most of the maize and sorghum grown in temperate climates are photoperiod insensitive, while
those grown in the tropics delay flowering in long days. A temperate breeding program finds it
useful to introduce genetic variability from tropicals, but the joint introgression of photoperiod
sensitivity would delay the reproductive switch under long-day conditions. Thus, marker-assisted
selection could solve this problem, with the aid of collinearity between the maize and sorghum
genomes. Reports found homologous candidate genes and QTLs between maize chromosomes 9
and 10 and sorghum chromosome 6. These species share homology between the sorghum genes:
Ma1, Ma3, Ma6, CO and FT. Some of these would be present in maize but with a posttranscriptional
regulation that modify its function. In the present work, the database Gramene was used to predict
the presence of active and null allelic variants of candidate genes in sorghum and maize public
lines. These lines can be used to convert photoperiod sensitive into insensitive germplasm or vice
versa. As for instance, three hundred sorghum accessions were characterized with the K162N
mutation present in weak and null alleles of the Ma1 sorghum gene that confers sensitivity to
photoperiod. When Gramene does not hold the genotyping of certain functional sorghum variants,
the reference sequence of BTx623 would allow designing markers to predict the performance of
lines under conversion. Such will be the case of the deletion (G/-), a null allele of Ma1 present in
sorghum accessions SM100 and BTx406. In hybrid sorghum, these genes were shown to be
dominant and additive implying this technology will produce a major impact on the efficient
conversion of lines and the floral synchronization of inbred lines for hybrid production.
Palabras claves: fotoperiodo floración marcadores sorgo maíz
Key words: photoperiod flowering markers sorghum maize
Introducción
A los programas de mejoramiento genético de clima templado les resulta útil la
introducción de variabilidad genética de sorgo y maíces tropicales, pero la introgresión
conjunta de sensibilidad al fotoperiodo atrasaría mucho el ciclo productivo de los
materiales templados, la selección asistida por marcadores podría resolver este
problema. Un mecanismo genético de regulación de la floración que está bien estudiado
es la sensibilidad al fotoperiodo. Debido a la colinearidad entre los genomas de maíz y
sorgo, y la extensa caracterización de las bases genéticas de la sensibilidad al
fotoperiodo en plantas, es posible extrapolar información y utilizarla para la selección
asistida por marcadores. Se pudo establecer entre maíz y sorgo varios QTLs y genes
candidatos homólogos, en particular localizados en los cromosomas 9 y 10 de maíz y 6
de sorgo (Ducrocq et al., 2009). Estas especies comparten homología de genes en las
rutas metabólicas de genes de sorgo ya conocidos: Ma1, Ma3, Ma6, FT y CO (Murphy et
al., 2011). La base de datos pública de Gramene contiene las secuencias genómicas de
referencia de las líneas B73 de maíz y BTx623 de sorgo. Además se cuenta con el
genotipado de alta densidad en regiones codificantes de SNPs (polimorfismos de
nucléotidos simples) e INDELs (inserciones-deleciones) en sets de líneas diversas de
maíz y sorgo. Esta información puede ser utilizada para predecir el comportamiento a la
sensibilidad al fotoperiodo de líneas de sorgo en base a la presencia o ausencia de
variantes alélicas que caracterizan a alelos funcionales y nulos de genes conocidos e
involucrados en la sensibilidad al fotoperiodo. En el caso de no contar en Gramene con el
genotipado de variantes importantes, las secuencias genómicas permitirán el diseño de
marcadores moleculares para verificar al presencia de estas variantes en líneas públicas
así como en líneas locales de interés. En este trabajo se caracterizaron en un set de
accesiones de sorgo las variantes alélicas funcionales y nulas de los genes mayores Ma1
(Murphy et al., 2011) y Ma6 (Murphy et al., 2014) descriptas en las bases de datos y se
analizó la correspondencia de la variante con la sensibilidad al fotoperiodo conocida de
algunas de estas líneas. En líneas públicas de maíz, se buscaron y caracterizaron las
variantes presentes en el gen candidato ZmCCT, homólogo a Ma6 de sorgo (Hung et al.,
2012).
1
Materiales y Métodos
Se utilizaron bases de datos públicas de diferentes proyectos de genotipificación y
secuenciamiento de maíz y sorgo a fin de condensar la información y unificar identidades
de accesiones y de marcadores que generalmente son dispares entre bases de datos y
versiones. En segundo lugar, esta información sirvió para predecir en líneas públicas la
presencia de variantes alélicas activas o nulas de estos genes.
Para sorgo se utilizaron las herramientas de búsqueda de genomas
(http://ensembl.gramene.org/Sorghum_bicolor/Info/Index) y Biomart con las opciones
Plant Variation Mart 41 y Sorghum bicolor Variations Sorbi1 (2007-12-JGI). La
correspondencia de las identidades de las accesiones de sorgo de Biomart se buscaron en
el GRIN (Germplasm Resources Information Network) de USDA (U.S. Department of
Agriculture),
Accession
Area
Queries
de
http://www.arsgrin.gov/npgs/acc/acc_queries.html y se verificaron con la información del panel de
asociación de sorgo de Morris et al., (2013). Los resultados se verificaron con lo descripto
en Murphy et al., (2011) y Murphy et al., (2014) para Ma1 y Ma6, respectivamente.
Para maíz se utilizaron las herramientas de búsqueda de genomas
(http://ensembl.gramene.org/Zea_mays/Info/Index) y Biomart con las opciones Plant
Variation
Mart
41
y
Zea
Mays
Variations
AGPv3
5b
de
Gramene
(http://ensembl.gramene.org/biomart/martview) para obtener la lista de genotipos de
variantes alélicas del proyecto HapMapv2. Se utilizó además el proyecto PANZEA
(http://www.panzea.org) con las opciones Genotypes Search, HapMapv2 a fin de obtener
ora fuente de los genotipos de variantes alélicas SNPs e INDELs HapMapv2 de líneas
públicas de maíz en genes de interés. Por último, se utilizó la herramienta de búsqueda
de BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi) con las opciones Blastn suite y la base
de datos Sequence Read Archive Nucleotide BLAST de los secuenciamientos Whole
genome sequencing of Z. mays ssp. mays de líneas públicas, con el fin de verificar en
otra base de datos la posición y naturaleza de las variantes alélicas de interés. Los
resultados se verificaron con lo informado por Hung et al., (2012) para el gen candidato
ZmCCT.
Resultados y Discusión
Sorgo:
El gen candidato de Ma1 (Sb06g014570, SbPRR37), descripto en Murphy et al., (2011)
presenta cuatro variantes alélicas: El alelo funcional dominante SbPRR37 es originario de
la accesión 100M, Sbprr37-1 alelo recesivo nulo de SM100, Sbprr37-2 alelo activo débil
de Blackhull Kafir y Sbprr37-3 alelo nulo de ATx623 (línea androestéril de BTx623).
La secuencia del gen candidato de Ma1 (Sb06g014570, SbPRR37) se buscó Gramene. El
gen se encontró en el cromosoma 6: 40.280.414-40.290.602 cadena positiva de la
accesión BTx623, versión Sorbi1, Dec 2007, 75.14. La opción "Variation Table" permitió
obtener la lista de 5 variantes SNPs en la región, dos de ellos ubicados en regiones
codificantes, S6_40286718 y S6_40286721, siendo el primero sinónimo y el segundo no
sinónimo (G/T), responsable de la substitución N/K (Asparagina/Lisina, denominada
K162N), se utilizó como fuente la base de datos Morris, 2013. El alelo T produce el
codón AAT que se traduce en N mientras que el alelo G resulta en el codón AAG que se
traduce en K. La substitución N/K es la única de este set de variaciones que está
descripta en Murphy et al., (2011) y que está presente en los alelos débiles y nulos
Sbprr37-2 y Sbprr37-3. La importancia de esta información es utilizar las bases de datos
públicas para predecir el comportamiento fotoperiodico de distintas accesiones sin
necesidad de secuenciar este gen. Si bien el SNP que produce la substitución N/K no es
totalmente informativa de la funcionalidad del gen Ma1 brindaría una primera herramienta
para la clasificación de la población de líneas de sorgo. Posteriormente, se buscó en
Biomart los genotipos para la substitución N/K con las opciones General Variation Filter,
Variation source, Morris 2013. Se obtuvieron para cada variante un total de 303
genotipos de accesiones codificadas con números PI. La búsqueda de los códigos PI en
GRIN y en Morris et al., (2013) permitió establecer la identidad de 290 de las 303
accesiones de sorgo de Biomart.
2
En la Tabla 1 (adaptada de la Tabla 1 de Murphy et al., 2014) se presenta la
predicción del alelo G/T de la substitución N/K para 6 accesiones del programa de
mejoramiento de sorgo de U.S genotipadas por Morris et al., (2013). Según los datos de
secuenciamiento del gen de Murphy et al., (2011) las variantes del SNP en cada gen
deberían ser las siguientes: SbPRR37: G, Sbprr37-1: G o T, Sbprr37-2: T y Sbprr37-3: T.
Se obtuvo el alelo esperado del SNP excepto en la accesión 100M, lo cual resulta
contraproducente porque es una línea de referencia para este tipo de estudio. Una
explicación de esta discrepancia podría ser la alteración de la fidelidad genética de la
accesión de Morris et al., (2013) por deriva genética o bien un error en la identificación.
Este estudio se debería de complementar con un ensayo de genotipificación de líneas
importantes para la deleción G/- que define al alelo nulo Sbprr37-1 y para la substitución
C/T que provoca un stop de la codificación, privativa del alelo nulo Sbprr37-3.
La secuencia del gen candidato Ma6 (Sb06g000570, Ghd7) descripto en Murhpy et
al., (2014) se buscó en Gramene. Este gen presenta 6 alelos dominantes: Ghd7-1 a
Ghd7-6, y dos recesivos: ghd7-1 y ghd7-2.El gen fue posicionado en las coordenadas
Cromosoma 6: 670.721-673.363 cadena positiva. La tabla de variaciones presentó 7
SNPs en la región, solo uno de ellos produjo el SNP C/T (S6_673104), en el tercer exón
en la coordenada 6:673104, que causa una substitución no sinónima A/V. Biomart
mostró que solo 5 de 303 accesiones presentaron el alelo T en este SNP. La predicción de
la proteína del gen Sb06g000570 de Gramene difiere de lo publicado en Murphy et al.,
(2014), el primero presenta tres exones mientras que en el segundo se presentan dos
exones. La variación de Biomart S6_673104 no está considerada en Supplemental Table
2. Genetic Variation in Ghd7, de Murphy et al., (2014), como característica de algunas de
las 8 variantes alélicas del gen, por lo cual los genotipos de las accesiones de Morris et
al., (2013) no fueron caracterizadas. En este caso sería apropiado diseñar marcadores o
secuenciar la subregión que contiene un INDEL y un STOP privativas de los dos alelos
recesivos.
Maíz:
Se estudió el gen candidato de maíz ZmCCT, homólogo de Ghd7 de sorgo, utilizando
como referencia el trabajo de Hung et al., (2012). Las secuencias de los primers de
ZmCCT (Table S7) se utilizaron con BLAST para posicionar al gen en la secuencia de
referencia de B73 AGPVv3. Como resultado se encontró homología en el gen
GRMZM2G381691, Cromosoma 10: 94.262.291-94.264,845, codificado en la cadena
reversa. Se buscó en la tabla de variaciones la lista de SNP e INDELs de la región,
incluidos 2.000 pb río arriba y río abajo del gen debido a que Hung et al., (2012)
establecieron una alta asociación con la respuesta fotoperiódica de maíz con dos SNPs
(SNP1411 y SNP1520) localizados río arriba del gen, lo que correspondería a las
posiciones 10:94.266.257 y 10:94.266.365, respectivamente. Se buscó en PANZEA,
Genotype Search, los genotipos de la región para la población de mapeo de asociación de
104 líneas de maíz que incluye a las 27 líneas fundadoras de las poblaciones NAM
[poblaciones de mapeo de RIL (Líneas recombinantes endocriadas) anidadas en B73]. Se
buscaron principalmente los genotipos de 4 líneas sensibles al fotoperiodo: CML277,
CML288, Ki11 (tropicales) y Ky21 (templada) así como de B73 que es considerada
insensible al fotoperiodo. En la Tabla 2 se muestran los genotipos de algunas variantes
presentes en regiones codificantes así como los alelos presentes en los SNP1411 y
SNP1520. En el trabajo de Hung et al., (2012) se informa que estos SNPs se encuentran
ligados y que presentan alelos similares en las líneas sensibles y distintos a B73 y están
estadísticamente asociados a la respuesta al fotoperiodo. La base de datos de PANZEA
reveló que esos SNPs presentaban alelos distintos a los esperados. La verificación de
estos SNPs en la base de datos Sequence Read Archive Nucleotide, utilizando a las
regiones flanqueantes como secuencias de búsqueda con BLAST, pudo resolver las bases
ambiguas solo para el caso de SNP1411. Para el SNP1520 no se encontraron similitudes.
Los resultados obtenidos de esta forma coinciden en parte con los alelos A esperados en
el SNP1411. Este estudio habría que complementarlo con el diseño de marcadores que
permitan verificar en laboratorio con mayor precisión estas dos variaciones en líneas de
maíz de interés.
3
Tabla 1. Correspondencia de alelos de la substitución N/K con lo informado en accesiones del
programa de mejoramiento de sorgo de U.S cultivadas en condiciones de días largos.
K:G;
Días a
Características
N:T
floración
Genotipos históricos
Hegari
ghd7-2
PRR37
G
140
granífero (1908; ma4)
Caprock (Tx7000)
ghd7-1 prr37-2
T
58
Sorgo granífero (1941)
Combine 7078
ghd7-1 prr37-1
G
57
Sorgo granífero (1944)
CK60 (BTx3197)
ghd7-1 prr37-3
T
64
Sorgo granífero (1950)
Rio
ghd7-2 prr37-2
T
85
Sorgo dulce(1972)
Genotipos representativos de los grupos de madurez
100M
ghd7-1
PRR37
T
143
Ma1Ma2Ma3Ma4Ma5ma6
Genotipos
Ma6
Ma1
Tabla 2. Genotipos del ZmCCT, homólogo de Ghd7 de sorgo, en la línea insensible al fotoperiodo
b73 y las líneas sensibles al cultivarlas en días largos: CML228, CML277, KI11 y Ky21. Entre
paréntesis se indica el alelo verificado en las bases de datos de Sequence Read Archive Nucleotide
para el caso de datos ambiguos (N).
INDEL
alelo
s
-/+
94248711
-
-
-
-
-
SNP
C/T
94251163
C
C
T
N
T
SNP
G/A
94251172
G
G
G
G
G
3
PZE109408598
4
SNP
G/C
94251212
G
G
G
G
N
INDEL
-/+
94251213
-
-
-
-
-
SNP1411
SNP
G/A
94252676
G
N(g)
N (a)
N(a)
SNP1520
SNP
G/A
94252784
G
G
N
G
(g)
N
ID del marcador
PZE109408348
2
PZE109408593
4
PZE109408594
3
PZE109408598
clase
Bp. v2
B73
CML228
CML277
KI11
KY21
----------N
Conclusión
En el caso de sorgo híbrido se ha demostrado que los genes responsable de la respuesta
al fotoperiodo son dominantes y tienen efecto mayormente aditivo por lo cual se prevé
que está tecnología producirá un gran impacto en la conversión eficiente de líneas de
sorgo y maíz y en la sincronización floral de líneas para la producción de híbridos.
Bibliografía
Ducrocq, S., Giauffret, C., Madur, D., Combes, V., Dumas, F., Jouanne, S., Coubriche, D., Jamin,
P., Moreau, L., Charcosset, A. Fine mapping and haplotype structure analysis of a major
flowering time quantitative trait locus on maize chromosome 10(2009) Genetics, 183 (4),
pp. 1555-1563.
Hung, H.-Y., Shannon, L.M., Tian, F., Bradbury, P.J., Chen, C., Flint-Garcia, S.A., McMullen, M.D.,
Ware, D., Buckler, E.S., Doebley, J.F., Holland, J.B.ZmCCT and the genetic basis of daylength adaptation underlying the postdomestication spread of maize (2012) Proceedings of
the National Academy of Sciences of the United States of America, 109 (28), pp. E1913E1921.
Morris, G.P., Ramu, P., Deshpande, S.P., Hash, C.T., Shah, T., Upadhyaya, H.D., Riera-Lizarazu,
O., Brown, P.J., Acharya, C.B., Mitchell, S.E., Harriman, J., Glaubitz, J.C., Buckler, E.S.,
Kresovich, S.Population genomic and genome-wide association studies of agroclimatic traits
in sorghum (2013) Proceedings of the National Academy of Sciences of the United States of
America, 110 (2), pp. 453-458.
Murphy, R.L., Klein, R.R., Morishige, D.T., Brady, J.A., Rooney, W.L., Miller, F.R., Dugas, D.V.,
Klein, P.E., Mullet, J.E.Coincident light and clock regulation of pseudoresponse regulator
protein 37 (PRR37) controls photoperiodic flowering in sorghum(2011) Proceedings of the
National Academy of Sciences of the United States of America, 108 (39), pp. 16469-16474.
Murphy, R.L., Morishige, D.T., Brady, J.A., Rooney, W.L., Yang, S., Klein, P.E., Mullet, J.E. Ghd7
(Ma6) represses sorghum flowering in long days: Ghd7 alleles enhance biomass
accumulation and grain production (2014) Plant Genome, 7 (2).
4