Download genes-que-regulan-la-floracion-en-maiz-y-sorgo-perspectivas
Document related concepts
no text concepts found
Transcript
GENES QUE REGULAN LA FLORACIÓN EN MAÍZ Y SORGO: PERSPECTIVAS PARA LA SELECCIÓN ASISTIDA POR MARCADORES Olmos, S. INTA Pergamino. Ruta [email protected] 32 Km. 4.5. CP 2700. Pergamino. Buenos Aires. Argentina. Email: Most of the maize and sorghum grown in temperate climates are photoperiod insensitive, while those grown in the tropics delay flowering in long days. A temperate breeding program finds it useful to introduce genetic variability from tropicals, but the joint introgression of photoperiod sensitivity would delay the reproductive switch under long-day conditions. Thus, marker-assisted selection could solve this problem, with the aid of collinearity between the maize and sorghum genomes. Reports found homologous candidate genes and QTLs between maize chromosomes 9 and 10 and sorghum chromosome 6. These species share homology between the sorghum genes: Ma1, Ma3, Ma6, CO and FT. Some of these would be present in maize but with a posttranscriptional regulation that modify its function. In the present work, the database Gramene was used to predict the presence of active and null allelic variants of candidate genes in sorghum and maize public lines. These lines can be used to convert photoperiod sensitive into insensitive germplasm or vice versa. As for instance, three hundred sorghum accessions were characterized with the K162N mutation present in weak and null alleles of the Ma1 sorghum gene that confers sensitivity to photoperiod. When Gramene does not hold the genotyping of certain functional sorghum variants, the reference sequence of BTx623 would allow designing markers to predict the performance of lines under conversion. Such will be the case of the deletion (G/-), a null allele of Ma1 present in sorghum accessions SM100 and BTx406. In hybrid sorghum, these genes were shown to be dominant and additive implying this technology will produce a major impact on the efficient conversion of lines and the floral synchronization of inbred lines for hybrid production. Palabras claves: fotoperiodo floración marcadores sorgo maíz Key words: photoperiod flowering markers sorghum maize Introducción A los programas de mejoramiento genético de clima templado les resulta útil la introducción de variabilidad genética de sorgo y maíces tropicales, pero la introgresión conjunta de sensibilidad al fotoperiodo atrasaría mucho el ciclo productivo de los materiales templados, la selección asistida por marcadores podría resolver este problema. Un mecanismo genético de regulación de la floración que está bien estudiado es la sensibilidad al fotoperiodo. Debido a la colinearidad entre los genomas de maíz y sorgo, y la extensa caracterización de las bases genéticas de la sensibilidad al fotoperiodo en plantas, es posible extrapolar información y utilizarla para la selección asistida por marcadores. Se pudo establecer entre maíz y sorgo varios QTLs y genes candidatos homólogos, en particular localizados en los cromosomas 9 y 10 de maíz y 6 de sorgo (Ducrocq et al., 2009). Estas especies comparten homología de genes en las rutas metabólicas de genes de sorgo ya conocidos: Ma1, Ma3, Ma6, FT y CO (Murphy et al., 2011). La base de datos pública de Gramene contiene las secuencias genómicas de referencia de las líneas B73 de maíz y BTx623 de sorgo. Además se cuenta con el genotipado de alta densidad en regiones codificantes de SNPs (polimorfismos de nucléotidos simples) e INDELs (inserciones-deleciones) en sets de líneas diversas de maíz y sorgo. Esta información puede ser utilizada para predecir el comportamiento a la sensibilidad al fotoperiodo de líneas de sorgo en base a la presencia o ausencia de variantes alélicas que caracterizan a alelos funcionales y nulos de genes conocidos e involucrados en la sensibilidad al fotoperiodo. En el caso de no contar en Gramene con el genotipado de variantes importantes, las secuencias genómicas permitirán el diseño de marcadores moleculares para verificar al presencia de estas variantes en líneas públicas así como en líneas locales de interés. En este trabajo se caracterizaron en un set de accesiones de sorgo las variantes alélicas funcionales y nulas de los genes mayores Ma1 (Murphy et al., 2011) y Ma6 (Murphy et al., 2014) descriptas en las bases de datos y se analizó la correspondencia de la variante con la sensibilidad al fotoperiodo conocida de algunas de estas líneas. En líneas públicas de maíz, se buscaron y caracterizaron las variantes presentes en el gen candidato ZmCCT, homólogo a Ma6 de sorgo (Hung et al., 2012). 1 Materiales y Métodos Se utilizaron bases de datos públicas de diferentes proyectos de genotipificación y secuenciamiento de maíz y sorgo a fin de condensar la información y unificar identidades de accesiones y de marcadores que generalmente son dispares entre bases de datos y versiones. En segundo lugar, esta información sirvió para predecir en líneas públicas la presencia de variantes alélicas activas o nulas de estos genes. Para sorgo se utilizaron las herramientas de búsqueda de genomas (http://ensembl.gramene.org/Sorghum_bicolor/Info/Index) y Biomart con las opciones Plant Variation Mart 41 y Sorghum bicolor Variations Sorbi1 (2007-12-JGI). La correspondencia de las identidades de las accesiones de sorgo de Biomart se buscaron en el GRIN (Germplasm Resources Information Network) de USDA (U.S. Department of Agriculture), Accession Area Queries de http://www.arsgrin.gov/npgs/acc/acc_queries.html y se verificaron con la información del panel de asociación de sorgo de Morris et al., (2013). Los resultados se verificaron con lo descripto en Murphy et al., (2011) y Murphy et al., (2014) para Ma1 y Ma6, respectivamente. Para maíz se utilizaron las herramientas de búsqueda de genomas (http://ensembl.gramene.org/Zea_mays/Info/Index) y Biomart con las opciones Plant Variation Mart 41 y Zea Mays Variations AGPv3 5b de Gramene (http://ensembl.gramene.org/biomart/martview) para obtener la lista de genotipos de variantes alélicas del proyecto HapMapv2. Se utilizó además el proyecto PANZEA (http://www.panzea.org) con las opciones Genotypes Search, HapMapv2 a fin de obtener ora fuente de los genotipos de variantes alélicas SNPs e INDELs HapMapv2 de líneas públicas de maíz en genes de interés. Por último, se utilizó la herramienta de búsqueda de BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi) con las opciones Blastn suite y la base de datos Sequence Read Archive Nucleotide BLAST de los secuenciamientos Whole genome sequencing of Z. mays ssp. mays de líneas públicas, con el fin de verificar en otra base de datos la posición y naturaleza de las variantes alélicas de interés. Los resultados se verificaron con lo informado por Hung et al., (2012) para el gen candidato ZmCCT. Resultados y Discusión Sorgo: El gen candidato de Ma1 (Sb06g014570, SbPRR37), descripto en Murphy et al., (2011) presenta cuatro variantes alélicas: El alelo funcional dominante SbPRR37 es originario de la accesión 100M, Sbprr37-1 alelo recesivo nulo de SM100, Sbprr37-2 alelo activo débil de Blackhull Kafir y Sbprr37-3 alelo nulo de ATx623 (línea androestéril de BTx623). La secuencia del gen candidato de Ma1 (Sb06g014570, SbPRR37) se buscó Gramene. El gen se encontró en el cromosoma 6: 40.280.414-40.290.602 cadena positiva de la accesión BTx623, versión Sorbi1, Dec 2007, 75.14. La opción "Variation Table" permitió obtener la lista de 5 variantes SNPs en la región, dos de ellos ubicados en regiones codificantes, S6_40286718 y S6_40286721, siendo el primero sinónimo y el segundo no sinónimo (G/T), responsable de la substitución N/K (Asparagina/Lisina, denominada K162N), se utilizó como fuente la base de datos Morris, 2013. El alelo T produce el codón AAT que se traduce en N mientras que el alelo G resulta en el codón AAG que se traduce en K. La substitución N/K es la única de este set de variaciones que está descripta en Murphy et al., (2011) y que está presente en los alelos débiles y nulos Sbprr37-2 y Sbprr37-3. La importancia de esta información es utilizar las bases de datos públicas para predecir el comportamiento fotoperiodico de distintas accesiones sin necesidad de secuenciar este gen. Si bien el SNP que produce la substitución N/K no es totalmente informativa de la funcionalidad del gen Ma1 brindaría una primera herramienta para la clasificación de la población de líneas de sorgo. Posteriormente, se buscó en Biomart los genotipos para la substitución N/K con las opciones General Variation Filter, Variation source, Morris 2013. Se obtuvieron para cada variante un total de 303 genotipos de accesiones codificadas con números PI. La búsqueda de los códigos PI en GRIN y en Morris et al., (2013) permitió establecer la identidad de 290 de las 303 accesiones de sorgo de Biomart. 2 En la Tabla 1 (adaptada de la Tabla 1 de Murphy et al., 2014) se presenta la predicción del alelo G/T de la substitución N/K para 6 accesiones del programa de mejoramiento de sorgo de U.S genotipadas por Morris et al., (2013). Según los datos de secuenciamiento del gen de Murphy et al., (2011) las variantes del SNP en cada gen deberían ser las siguientes: SbPRR37: G, Sbprr37-1: G o T, Sbprr37-2: T y Sbprr37-3: T. Se obtuvo el alelo esperado del SNP excepto en la accesión 100M, lo cual resulta contraproducente porque es una línea de referencia para este tipo de estudio. Una explicación de esta discrepancia podría ser la alteración de la fidelidad genética de la accesión de Morris et al., (2013) por deriva genética o bien un error en la identificación. Este estudio se debería de complementar con un ensayo de genotipificación de líneas importantes para la deleción G/- que define al alelo nulo Sbprr37-1 y para la substitución C/T que provoca un stop de la codificación, privativa del alelo nulo Sbprr37-3. La secuencia del gen candidato Ma6 (Sb06g000570, Ghd7) descripto en Murhpy et al., (2014) se buscó en Gramene. Este gen presenta 6 alelos dominantes: Ghd7-1 a Ghd7-6, y dos recesivos: ghd7-1 y ghd7-2.El gen fue posicionado en las coordenadas Cromosoma 6: 670.721-673.363 cadena positiva. La tabla de variaciones presentó 7 SNPs en la región, solo uno de ellos produjo el SNP C/T (S6_673104), en el tercer exón en la coordenada 6:673104, que causa una substitución no sinónima A/V. Biomart mostró que solo 5 de 303 accesiones presentaron el alelo T en este SNP. La predicción de la proteína del gen Sb06g000570 de Gramene difiere de lo publicado en Murphy et al., (2014), el primero presenta tres exones mientras que en el segundo se presentan dos exones. La variación de Biomart S6_673104 no está considerada en Supplemental Table 2. Genetic Variation in Ghd7, de Murphy et al., (2014), como característica de algunas de las 8 variantes alélicas del gen, por lo cual los genotipos de las accesiones de Morris et al., (2013) no fueron caracterizadas. En este caso sería apropiado diseñar marcadores o secuenciar la subregión que contiene un INDEL y un STOP privativas de los dos alelos recesivos. Maíz: Se estudió el gen candidato de maíz ZmCCT, homólogo de Ghd7 de sorgo, utilizando como referencia el trabajo de Hung et al., (2012). Las secuencias de los primers de ZmCCT (Table S7) se utilizaron con BLAST para posicionar al gen en la secuencia de referencia de B73 AGPVv3. Como resultado se encontró homología en el gen GRMZM2G381691, Cromosoma 10: 94.262.291-94.264,845, codificado en la cadena reversa. Se buscó en la tabla de variaciones la lista de SNP e INDELs de la región, incluidos 2.000 pb río arriba y río abajo del gen debido a que Hung et al., (2012) establecieron una alta asociación con la respuesta fotoperiódica de maíz con dos SNPs (SNP1411 y SNP1520) localizados río arriba del gen, lo que correspondería a las posiciones 10:94.266.257 y 10:94.266.365, respectivamente. Se buscó en PANZEA, Genotype Search, los genotipos de la región para la población de mapeo de asociación de 104 líneas de maíz que incluye a las 27 líneas fundadoras de las poblaciones NAM [poblaciones de mapeo de RIL (Líneas recombinantes endocriadas) anidadas en B73]. Se buscaron principalmente los genotipos de 4 líneas sensibles al fotoperiodo: CML277, CML288, Ki11 (tropicales) y Ky21 (templada) así como de B73 que es considerada insensible al fotoperiodo. En la Tabla 2 se muestran los genotipos de algunas variantes presentes en regiones codificantes así como los alelos presentes en los SNP1411 y SNP1520. En el trabajo de Hung et al., (2012) se informa que estos SNPs se encuentran ligados y que presentan alelos similares en las líneas sensibles y distintos a B73 y están estadísticamente asociados a la respuesta al fotoperiodo. La base de datos de PANZEA reveló que esos SNPs presentaban alelos distintos a los esperados. La verificación de estos SNPs en la base de datos Sequence Read Archive Nucleotide, utilizando a las regiones flanqueantes como secuencias de búsqueda con BLAST, pudo resolver las bases ambiguas solo para el caso de SNP1411. Para el SNP1520 no se encontraron similitudes. Los resultados obtenidos de esta forma coinciden en parte con los alelos A esperados en el SNP1411. Este estudio habría que complementarlo con el diseño de marcadores que permitan verificar en laboratorio con mayor precisión estas dos variaciones en líneas de maíz de interés. 3 Tabla 1. Correspondencia de alelos de la substitución N/K con lo informado en accesiones del programa de mejoramiento de sorgo de U.S cultivadas en condiciones de días largos. K:G; Días a Características N:T floración Genotipos históricos Hegari ghd7-2 PRR37 G 140 granífero (1908; ma4) Caprock (Tx7000) ghd7-1 prr37-2 T 58 Sorgo granífero (1941) Combine 7078 ghd7-1 prr37-1 G 57 Sorgo granífero (1944) CK60 (BTx3197) ghd7-1 prr37-3 T 64 Sorgo granífero (1950) Rio ghd7-2 prr37-2 T 85 Sorgo dulce(1972) Genotipos representativos de los grupos de madurez 100M ghd7-1 PRR37 T 143 Ma1Ma2Ma3Ma4Ma5ma6 Genotipos Ma6 Ma1 Tabla 2. Genotipos del ZmCCT, homólogo de Ghd7 de sorgo, en la línea insensible al fotoperiodo b73 y las líneas sensibles al cultivarlas en días largos: CML228, CML277, KI11 y Ky21. Entre paréntesis se indica el alelo verificado en las bases de datos de Sequence Read Archive Nucleotide para el caso de datos ambiguos (N). INDEL alelo s -/+ 94248711 - - - - - SNP C/T 94251163 C C T N T SNP G/A 94251172 G G G G G 3 PZE109408598 4 SNP G/C 94251212 G G G G N INDEL -/+ 94251213 - - - - - SNP1411 SNP G/A 94252676 G N(g) N (a) N(a) SNP1520 SNP G/A 94252784 G G N G (g) N ID del marcador PZE109408348 2 PZE109408593 4 PZE109408594 3 PZE109408598 clase Bp. v2 B73 CML228 CML277 KI11 KY21 ----------N Conclusión En el caso de sorgo híbrido se ha demostrado que los genes responsable de la respuesta al fotoperiodo son dominantes y tienen efecto mayormente aditivo por lo cual se prevé que está tecnología producirá un gran impacto en la conversión eficiente de líneas de sorgo y maíz y en la sincronización floral de líneas para la producción de híbridos. Bibliografía Ducrocq, S., Giauffret, C., Madur, D., Combes, V., Dumas, F., Jouanne, S., Coubriche, D., Jamin, P., Moreau, L., Charcosset, A. Fine mapping and haplotype structure analysis of a major flowering time quantitative trait locus on maize chromosome 10(2009) Genetics, 183 (4), pp. 1555-1563. Hung, H.-Y., Shannon, L.M., Tian, F., Bradbury, P.J., Chen, C., Flint-Garcia, S.A., McMullen, M.D., Ware, D., Buckler, E.S., Doebley, J.F., Holland, J.B.ZmCCT and the genetic basis of daylength adaptation underlying the postdomestication spread of maize (2012) Proceedings of the National Academy of Sciences of the United States of America, 109 (28), pp. E1913E1921. Morris, G.P., Ramu, P., Deshpande, S.P., Hash, C.T., Shah, T., Upadhyaya, H.D., Riera-Lizarazu, O., Brown, P.J., Acharya, C.B., Mitchell, S.E., Harriman, J., Glaubitz, J.C., Buckler, E.S., Kresovich, S.Population genomic and genome-wide association studies of agroclimatic traits in sorghum (2013) Proceedings of the National Academy of Sciences of the United States of America, 110 (2), pp. 453-458. Murphy, R.L., Klein, R.R., Morishige, D.T., Brady, J.A., Rooney, W.L., Miller, F.R., Dugas, D.V., Klein, P.E., Mullet, J.E.Coincident light and clock regulation of pseudoresponse regulator protein 37 (PRR37) controls photoperiodic flowering in sorghum(2011) Proceedings of the National Academy of Sciences of the United States of America, 108 (39), pp. 16469-16474. Murphy, R.L., Morishige, D.T., Brady, J.A., Rooney, W.L., Yang, S., Klein, P.E., Mullet, J.E. Ghd7 (Ma6) represses sorghum flowering in long days: Ghd7 alleles enhance biomass accumulation and grain production (2014) Plant Genome, 7 (2). 4