Download a. Genes idénticos en sentido funcional
Document related concepts
Transcript
GENOMA HUMANO Prof. CRUZ BRICEÑO MARIA DPTO DE MORFOLOGIA HUMANA GENOMA Es el conjunto completo de información almacenada en el ADN de un organismo, en particular en cada una de sus células FUNCIONES: Incluye: Proteínas involucradas en el transporte de proteínas Proteínas involucradas en los procesos bioquímicos Plegamiento de Proteínas Proteínas inmunológicas Proteínas estructural 30 ,000 GENOMA NUCLEAR Pares de base : 3x109 pares de bases Genes : Cromosomas : 22 - X - Y ( 50 – 263Mb) Cromosoma Cantidad de DNA (Mb) Cromosoma Cantidad de DNA (Mb) 1 279 13 118 2 251 14 107 3 221 15 100 4 197 16 104 5 198 17 88 6 176 18 86 7 163 19 72 8 148 20 66 9 140 21 45 10 143 22 48 11 1448 X 163 12 142 Y 51 30000 FILOGENIA 1982 DIFRENCIAS ENTRE LAS ESPECIES 1. Inversiones pericentricas: cromosomas 1 y 18 2. Inversiones paracentricas: 4,5,9,12,15 y 16 del hombre y el chimpancés 3. Inversiones peri y paracentricas: cromosoma 16 del hombre y del gorila 4. Heterocromatina constitutiva a. Variaciones en la cantidad centromérica en la cuatro especies, cromosomas 1,9,16,13,15,21,22 b. Diferencias en el tamaño del Y c. Presencia de otras bandas 5. Presencia banda telómericas terminales en cromosoma X 6. Localización de los organizadores nucleolares a. Humano: 13,14,15,21,22 b. Chimpancés: 13,14,18,21,22 c. Gorila: 13, 21,22 d. Orangután: 2p, 3p, 7q, 13,14,15 y 22 De mono al hombre Fusión del cromosoma 2p y 2q reduce de 24 a 23 pares de Cromosomas C1 Inv. pericentrica C2 Fusión C18 Inv. pericentrica CX Bandas telómericas CY Tamaño del cromosoma Y Cromosomas Comparación con el cariotipo humano Chimpancé Gorila orangután 1 Ausencia de constricción Ausencia de constricción Ausencia de constricción 2 Fusión telomérica Fusión telomérica Fusión telomérica 3 Similar Similar Inversión pericentrica 4 Inversión pericentrica Inversión pericentrica Inversión pericentrica 5 Inversión pericentrica Inversión pericentrica Similar 6 Similar Similar Similar 7 Similar Similar Rearreglo 8 Similar Inversión pericentrica Rearreglo 9 Ausencia de Constricción Rearreglo Rearreglo 10 Similar Inversión pericentrica Rearreglo 11 Similar Similar Similar 12 Inversión pericentrica Inversión pericentrica Similar 13 Similar Similar Similar 14 Similar Similar Similar 15 Similar Similar Similar 16 Ausencia de constricción Rearreglo Rearreglo 17 Inversión pericentrica Inversión pericentrica Inversión pericentrica 18 Rearreglo Rearreglo Rearreglo 19 Similar Similar Similar 20 Similar Similar Similar 21 Similar Similar Similar 22 Similar Similar Similar X Similar Similar Similar Y Ausencia del segmento distal Similar Similar SECUENCIAS DE GENOMA NUCLEAR •SEGÚN SU FUNCION TIPOS DENOMINACION CODIFICANTE Elementos Propios Elementos accesorios NO Función estructural CODIFICANTE Función reguladora Función desconocida CARACTERISTICAS ARNr, ARNt, ARNm Retroposones Transposones ADNsat centromerico ADN Telomerico Promotores Intensificadores Silenciadores ADN intergénico I. SECUENCIAS CODIFICANTES 1. SECUENCIAS CODIFICANTES GENES RNA • Existen 700-800 genes • • • • • RIBOSOMICOS TRANSFERENCIA NUCLEAR PEQUEÑO NUCLEOLAR PEQUEÑO OTROS: MICRO-RNA rRNA tRNA snRNA snoRNA miRNA rRNA: Unidad transcripcional de 45 S (28, 5.8 y 18 S) Con 30 – 40 repeticiones Localizado en: 13, 14,15,21, 22 Unidad 5S: 200 – 300 genes1p41-42 miRNA (≈ 22nt) 300 genes miRNA (>dentro de intrones), 7 en C13 se transcriben por ARNpol II pri-miRNA --RN-asa III (DROSHA)---- pre miRNA --- RN-asa(DICER)--- miRNA (núcleo) FUNCION Reguladores antisentido de otros genes Se enlazan al 3’ UTR del ARMm Inhiben la traducción • Reprimen la síntesis de proteínas del gen blanco Degrada el mRNA (Bicatenario) 70 nt (citoplasma) 22nt RNAsn SnRNA U3 RNA espliceosómico - 44 genes snRNA U6 - 16 genessnRNA U1 locus RNU1 en 1p36.1 (6 - mas de 30repeticiones) - Genes snRNA U2 locus de 6.1kb RNU2 17q21-22 GENES ARNt 497 GENES -- 49 familias según anticodon 61 codones son reconocidos por 40 tRNA Loci: todos cromosomas (excepto 22 y Y) -6 (4Mb) residen 286 - 1 residen genes tRNA Asn y Glu - 7 18 /30 tRNA Cys GENES ARN 2: GENES CODIFICANTES DE POLIPEPTIDOS GENES QUE CODIFICAN POLIPEPTIDOS 1. Tamaño del gen es Variable 2. Tamaño del exón (<200pb) es independiente del tamaño del gen 3. Tamaño del intrón es proporcional al tamaño del gen La fracción del DNA codificante es inversa al tamaño del gen Correlación entre tamaño de gen – tamaño del producto, con excepciones* 4563 aa * 3685 aa * 2. Diversidad de organización intron -exon 3. Tipo de genes: a. Genes idénticos en sentido funcional Genes de Histonas: http://research.nhgri.nih.gov/histones/web/chrmap.shtml 86 sec. En 10 Cromosoma diferentes (1,2,4,5,6,11,12,15,21,22) 2 grupos grandes en cromosoma 6p 21.3 Genes Ubiquitinas ○ Localización en varios cromosomas ○ En serie de repeticiones (cotranscripción / policistrónicos) ○ En unidades monómeras pero unidos a otros genes –Unidades de transcripción biscitrónica b. Genes similares en sentido funcional Genes muy relacionados pero no son idénticos en su secuencia Agrupados / Consecuencia de duplicaciones Cromosomas diferentes Genes HOX Familia génica: grupo de 10 genes en cuatro cromosomas dif. Cromosoma: 13q13-14 Xq13-22 4q11-12 5q31-33 c. Genes relacionados en sentido funcional • Secuencia sin relación física pero con relación funcional • Sus productos pueden ser: – Subunidades de la misma proteína • globina α 11p Globina β 16p • Ferritina cad. Pesada 11q Cadena liviana 22q – Subunidades de la misma estructura macromolecular – Componentes de la misma vía metabólica o de desarrollo • (hidroxilasas) – Proteínas ligando – receptor • Insulina 11p • Interferon β 9p Receptor 19p Receptor 21q d. Genes bidireccionales / superpuestos / dentro de genes/ policistronicos No son comunes Son muy cercanos d.1. Organización génica bidireccional. Se transcriben de cadenas opuestas: ○ Genes de reparación de DNA d.2. Genes superpuestos de forma parcial Ejm. Genes HLA d.3. Genes dentro de genes Localizados dentro de otros genes snoRNA en genes de proteínas ribosomales / proteína nucleolares Incluidos en intrones de genes grandes Ejm. Gen del factor VIII de la coagulación Gen RB1 Gen NF1 OGMP: glucoproteina de mielina del oligodendrocito d.4. Unidades policistrónicas • Grupos > de los Genes rRNA • Genes UBA52 UBA80 Ubiquitinas Proteína ribosómica S27 / L40 e. Familia génicas comunes i. Familias génicas comunes: – Muestran gran homología de secuencia codificante Ejm. – Genes de histonas – Genes de globinas • αyβ ii. Familia de genes que codifican proteínas con dominios grandes y muy conservados • Homología notable en regiones conservadas • Homología baja en regiones no conservadas Ejm. Familia de factores de Transcripción del desarrollo sec conservada codifica un dominio de unión al DNA iii. Familia de genes que codifican productos con secuencias conservadas cortas •Familia génica de Caja DEAD = asp – Glu – Ala – Asp Ejm. Proteína que participan en el splicing • Familia génica de Caja WD: Triptofano - aspartato (4-16 repeticiones tanden) (44-66 aa) Ejm. Proteínas reguladoras: División celular, Transcripción y Modificaciones de mRNA Señalamiento transmembranoso Gli - His Trp - Asp iv. Superfamilias -Codifican productos relacionados desde el punto de vista funcional en sentido general y muestran débil homología de secuencia. Ejm. - Ig, RCT, HLA - Globinas: globinas α y β, Mioglobia, neuroglobina - Receptores acoplados a proteínas G (7 hélice α tm) v. Familias génicas agrupadas: v.a. Familias génicas organizadas en un grupo único Organización génica tánden: ○ Genes relacionados en secuencia y función ○ Ejm: Genes RNA: (rRNA, U2, snRNA. ○ Genes polipeptídicos: Poli-ubiquitina Grupo cerrado: no en tánden, pueden estar ○ Agrupados de manera estrecha y regulados por región de control de locus único (globinas) ○ Individuales e idénticos en secuencia y función Grupo compuesto: relación física, pero no en secuencia, ni en función Ejm. Complejo HLA en 6p21.3 HLA I y II - Fact. Complemento sérico - Hidrolasas esteroides v.b. Familia de genes organizadas en múltiples grupos génicos • Relacionados muy de cerca o distribuidos en (uno), dos o mas sitios cromosómicos • Similitud alta o baja entre genes de diferentes grupos Ejm – Receptores olfatorios (900 unid) : 25 grupos – HOX (38 copias) 2p,7, 12, 17 – Histonas (61 copias) 10 cromosomas vi. Familia de génicas dispersas Dispersos y difieren en secuencia (salvo dup) Los miembros de la familia se origina por: ○ Genomas diferentes: ○ isoformas de proteínas mitocondriales y nucleares ○ Duplicaciones del gen/genoma Presentan homología secuencial en dominios Familia PAX ○ Retrotranscripción En los genes funcionales pueden tener intro y copia procesada funcional cDNA natural Características de las Familias multigénicas Poseen genes de copias defectuosas: pseudogenes • Pseudogenes no procesado en un grupo génico Pueden originarse por: – Duplicaciones: alteran regiones codificantes o reguladores No funcional – Inserciones de secuencia de ADN complementario Transcripto (sin sec. Promotoras) transcriptasa inversa ADNc – Inserciones de codones terminales Ejemplo: - globinas • Genes truncados y fragmento de genes internos en un grupo génico Contiene : pseudogenes no procesados Copias de genes truncados Copias de fragmentos génicos Origen: Duplicaciones / entrecruzamiento desigual Ejm. HLA I mRNA HLA I Genes de Cadena pesada HLA I 6p21.3 - 6 genes - 4 seudogenes - Copias génicas parciales 6p21.3 • Pseudogenes no procesados en una familia génica dispersa – Duplicación segmentaria. Ej. NF1 (pericentromérico C 1 7q11.2) PKD (enf poliquística del riñón) (subtelomerico C 16p) Duplicaciones segmentarias La duplicaciones segmentarias: 2 o mas segmentos cromosomicos >1 Kb con >90 % de identidad de secuencia Tipos: D. Intracromosomicas: 100Kb D. Intercromosomicas: 10-50Kb Pseudogenes procesados: Son mas frecuentes Caracteriza por : Extremo 3` con poli A (≈ARNm) No tiene intrones Carecen de promotor (no se expresa) Truncados 5`(falla transcriptasa) Ejemplos: genes B tubulina, Inmunoglobulina Mecanismo de origen: II. SECUENCIAS DE NO CODIFICANTES 1. DE REPETICIÓN EN TANDEN Tipos DNA: Satelite, minisatelite y microsatelites a. DNA SATÉLITE: • Repeticiones: simple(1-10 nt) / Complejas (>10 nt) • 10 al 15% de secuencias repetidas del genoma. • Secuencias cientos Kb repetidas en tanden • Mayormente se localiza en la región pericentromérica en los cromosomas, tiene función estructural, carece de orígenes de replicación • La menor parte de DNA Sat. está disperso por todo el genoma, tiene función amortiguadora de las mutaciones. . DNA Sat. alfoide: : centrómeros •Unidades de 5-171 pb longitud mll de pb •Motivo: CTTCGTTGGAAACGGGA • Fija proteínas centroméricas CENP-B: •Es específico para cada cromosoma : . DNA : 68 pb Cromosomas: 13-15, 21,22,9,1, Y ADN Sat-1: 42 pb pericentromérico ADN Sat-3: 5 pb (>cromosomas) conservado b. ADN MINISATÉLITE : 102 - 103 VNRT : repetición en tánden de número variables Muy polimórficos, i. DNA minisatelite hipervariable: - Presente en proximidades del telómero (otros lugares) -Secuencias cortas de 9-64pb repetidas en tánden - Secuencia común GGGCAGGAXG, que constituye una secuencia señal para la recombinación general → identificación de individuos (“fingerprint”) - No transcriben, excepto MUC1 en 1p -- codifica proteína polimórfica ii. DNA minisatélite telomérico 104 - Porción terminal de telómeros:10-15 Kb - Secuencia repetida: 5’ TTAGGG 3’ dispuesta de 2000 a 10000 veces seguidas Su longitud varía con la edad de la célula Espermatozoide tiene 15 Kb Célula somática 1,2 Kb Linfocitos en cultivo: normales 47 7.7 pb menos por año S. Down 133 5.5 pb menos por año c. DNA MICROSATELITE: 104 •Muy polimorfico. Localizados por todo el genoma (60Mb) •Unidades repetitivas: de 2,3 ó 4 (<10) nt • Comunes: (CA)n/(TG)n una x 36kb) AT/TA (una x 50kb) AG/CT (una x 125kb) • Raras : CG/GC (una x 10Mb) •Origen: deslizamiento de replicación •Raro aparecen en secuencias codificantes excepto trinucleotidos en ciertas alteraciones hereditarias CTG exon 1 del FMR1 implicado en S. X frágil CTG extremo 3’ del gen de la distrofia miotónica CAG en el gen de Huntingtina del S. Corea de Huntington (informa una sec. poliglutamina) Ejemplo: SNP (polimorfismo de un solo nucleótido) Ejemplos – Una repeticion de 2 pb : GTGTGTGTGT Una repeticion de 3 pb : CAGCAGCAGCAGCAG . ...TCCAGACAAGGTGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTCTCCAGTGAGATTTA… 2. DNA NO CODIFICANTE REPETIDO DISPERSO Retroposones y transposones A. RETROPOSONES o SECUENCIAS INTERCALARES: 10 - 102 a. LINES: Long interspersed nuclear elements : 1- a 5-kb • L1 o L1H 6.4 Kb • Localizados en bandas G , 20,000 a 40,000 Copias • Origen: ARN transcriptasa inversa ADN integra al genoma 6.1kb • Existen 3 familias: LINE-1, LINE-2, LINE-3 • Implicado en mutaciones, proveer sitios de recombinación anormales tanto intra como intercromosómicos • L1 cromosoma 22 transloca X gen Factor VIII Coagulación Hemofilia B. SINES: Short interspersed nuclear elements • Alu 150 Mb (5% del genoma humano) •Sitio de restricción 5’AGCT 3’ para enzima Alu I (Artrhrobacter lacteus) •Existen 500000 copias de secuencias de 300 pb •Localizados en las banda R •Estas secuencias se originaron por retrotranscripción •ARN 7SL ---Transcriptasa inversaADN que se integra al genoma ARN: partícula señal ( participa en la síntesis de proteínas) c. Elementos parecidos a retrovirus con repeticiones terminales largas (RTL): Transposones RTL Pueden ser autónomos o no autónomos con RTL Autónomos: secuencias retrovirales endogenas(SRE) Contiene genes gap y pol proteasa, transcriptasa inversa, RNAasa, integrasa Tipos: SER H (SER humana) 4.6% del genoma , > defectuosos SER H-K conserva genes retrovirales intactos SERH-K10 sufre de transposición No autónomos: MaLR 3.8% del genoma Carecen de gen pol y a veces del gap Elementos repetitivos encontrados en Gen de la enzima del hígado, la oxidasa homogentistica HGO (alcaptonuria) Modificó de B. Granadino, D. Beltrán-Valero de Bernabé, J. M. Fernández-Cañón, M. A. Peñalva, y S. Rodríguez de Córdoba, B. TRANSPOSONES: 10 – 102 Móviles, representan 3% del genomas Codifican una transposasa Sec. como retrovirus. Tienen repeticiones terminales invertidas Ejm. THE humano MER1 MER2 GENOMA MITOCONDRIAL •Bicatenario circular, 16569 pb (0,5% del genoma) •Presenta dos cadenas con secuencias de bases diferentes: Cadena pesada H: rica en G Cadena ligera L: rica en C •N° ADN: cientos o miles de copias por mitocondria •Posee poco ADN repetitivo, no intrones •Expuesto a radicales libres (liberados por Fosforilación oxidativa) Mutaciones de mayor frecuencia •Los sistemas de reparación son menos eficientes que los del ADN nuclear Código genético diferente al del núcleo Es transmitido por herencia materna GENES MITOCONDRIALES: 37 genes: 28 en la cadena pesada 9 en la cadena ligera 24 codifican ARN: 2 ARNr, 22 ARNt 8x 4 14 x 2 60 codones 13 polipeptidos: 7 subunidades del complejo I: ND1- NAD6 1 subunidad del citocromo b 3 subbunidades citocromo oxidasa COI-COIII 2 subunidades de ATPasa: 6 y 8 Genes parcialmente solapados 37 Genes H : 28 L: 9 22 : ARNt 2 : ARNr 13 : polipeptidos GENETICA MITOCONDRIAL A. Responde a un modelo de Herencia Materna B. Presenta segregación mitótica C. Muestra una elevada tasa de mutación Son 10 veces más rápidas que el ADN nuclear