Download ES 2 251 077 T3 - Patentes
Transcript
19 OFICINA ESPAÑOLA DE PATENTES Y MARCAS 11 Número de publicación: 2 251 077 51 Int. Cl. : C12N 15/57, C12N 9/64 7 A61K 31/70, A61K 38/48 C12Q 1/37, A61K 48/00 C07K 16/40, C12N 15/00 A01K 67/027, C12Q 1/68 ESPAÑA 12 TRADUCCIÓN DE PATENTE EUROPEA T3 86 Número de solicitud europea: 98913981 .1 86 Fecha de presentación : 24.04.1998 87 Número de publicación de la solicitud: 0977871 87 Fecha de publicación de la solicitud: 09.02.2000 54 Título: Neurotripsina. 30 Prioridad: 26.04.1997 CH 96697 73 Titular/es: Peter Sonderegger Biochemisches Institut Universitat Zurich Winterthurerstrasse 190 8057 Zürich, CH 45 Fecha de publicación de la mención BOPI: 72 Inventor/es: Sonderegger, Peter 16.04.2006 45 Fecha de la publicación del folleto de la patente: 74 Agente: Roeb Díaz-Álvarez, María ES 2 251 077 T3 16.04.2006 Aviso: En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín europeo de patentes, de la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 del Convenio sobre concesión de Patentes Europeas). Venta de fascículos: Oficina Española de Patentes y Marcas. Pº de la Castellana, 75 – 28071 Madrid ES 2 251 077 T3 DESCRIPCIÓN Neurotripsina. 5 Campo técnico La presente invención se dirige a las neurotripsinas y a una composición farmacéutica que contiene estas sustancias o tiene influencia sobre estas sustancias. 10 Descripción de la invención La neurotripsina es una serina proteasa descrita recientemente, que se expresa predominantemente en el cerebro y en los pulmones; la expresión en el cerebro tiene lugar casi exclusivamente en las neuronas. 15 La neurotripsina tiene una composición de dominios aún no encontrada previamente: además del dominio proteasa, se han encontrado 3 ó 4 dominios SRCR (receptor con dominios ricos en cisteína tipo basurero) y un dominio Kringle. Hay que señalar que aún no se había encontrado en proteínas la combinación de dominios Kringle y SRCR. En el extremo amino terminal de la proteína neurotripsina hay un segmento de más de 60 aminoácidos que tiene una proporción extremadamente alta de prolina y de aminoácidos básicos (arginina e histidina). 20 La invención se caracteriza por las características de las reivindicaciones independientes. Las realizaciones preferidas se definen en las reivindicaciones dependientes. Las neurotripsinas recién encontradas 25 - neurotripsina de humanos (compuesto de la fórmula I), - neurotripsina de ratón (compuesto de la fórmula II) 30 difieren mucho estructuralmente de las serina proteasas conocidas hasta ahora. Las serina proteasas cuyos dominios proteasa están más relacionados estructuralmente con el dominio proteasa de los nuevos compuestos, concretamente la plasmina (de humanos), tiene sólo un 44% de identidad de secuencia de aminoácidos. 35 El segmento básico rico en prolina del extremo amino terminal tiene una cierta semejanza con los segmentos básicos de las netrinas y las semaforinas/colapsinas. Debido a este segmento, es probable que puedan enriquecerse las muestras de la neurotripsina mediante cromatografía de afinidad con heparina. 40 La neurotripsina de humanos (compuesto de la fórmula I) y la de ratón (compuesto de la fórmula II) muestran una similitud estructural muy alta entre ellas. La identidad de las secuencias de aminoácidos de las proteínas nativas de los compuestos de las fórmulas I o II, asciende al 81%. 45 50 55 60 La neurotripsina de humanos (compuesto de la fórmula I) tiene una secuencia codificadora de 2625 nucleótidos. El péptido codificado de la fórmula I tiene una longitud de 875 aminoácidos y contiene un péptido señal de 20 aminoácidos. La neurotripsina de ratón (compuesto de la fórmula II) tiene una secuencia codificadora de 2283 nucleótidos. La proteína codificada del compuesto de la fórmula II tiene una longitud de 761 aminoácidos y contiene un péptido señal de 21 aminoácidos. La razón de la mayor longitud de la neurotripsina de humanos consiste en que la neurotripsina de humanos tiene 4 dominios SRCR, mientras que la de ratón tiene sólo 3 dominios SRCR. Los dominios que están presente en ambos compuestos (compuesto de la fórmula I y compuesto de la fórmula II) tienen un alto grado de similitud de secuencia. Los dominios SRCR correspondientes de las fórmulas I y II tienen una identidad de secuencia de aminoácidos del 81% al 91%. Los dominios Kringle correspondientes tienen una identidad de secuencia de aminoácidos del 75%. También comprende un alto grado de similitud (90% de identidad de secuencia de aminoácidos) en el dominio enzimáticamente activo (es decir, proteolítico). Los dominios proteasa de las neurotripsinas de humanos (compuesto de la fórmula I) y de ratón (compuesto de la fórmula II) se alinean en la siguiente sección, para ilustrar el alto grado de identidad de secuencia. 65 2 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 De las 258 posiciones de la secuencia de aminoácidos incluidas en la comparación, hay 233 aminoácidos que son idénticos en ambos compuestos (secuencia superior: compuesto de la fórmula I; secuencia inferior: compuesto de la fórmula II: los aminoácidos idénticos se indican con líneas verticales). Las neurotripsinas de la invención son únicas cuando se comparan con las serina proteasas conocidas que se expresan según las observaciones actuales disponibles en un grado diferente en neuronas. Otros órganos con una fuerte expresión de neurotripsina son los pulmones (véase Gschwend y col., Mol. Cell. Neurosci. 9, páginas 207-219, 1997). Las proteínas que son más similares desde el punto de vista estructural con los compuestos de las fórmulas I o II son las serina proteasas, tales como el activador del plasminógeno de tipo tisular (tPA), activador del plasminógeno de tipo uroquinasa (uPA), plasmina, tripsina, apolipoproteína (a), factor de coagulación XI, neuropsina y acrosina. En el cerebro adulto, los compuestos de la invención se expresan predominantemente en la corteza cerebral, el hipocampo y la amígdala. 55 En el tronco cerebral y en la médula espinal de adulto, los compuestos de la invención se expresan predominantemente en las neuronas motoras. Se encuentra una expresión ligeramente más débil en las neuronas de las capas superficiales del asa lateral de la médula espinal. 60 En el sistema nervioso periférico adulto, los compuestos de la invención se expresan en subpoblaciones de las neuronas de los ganglios sensoriales. Los compuestos de la invención se encontraron en conexión con un estudio que tenía como objetivo la descripción de serina proteínas similares a tripsina en el sistema nervioso. 65 El primer compuesto que se encontró y caracterizó fue el compuesto de la fórmula II (Gschwend y col., Mol. Cell. Neurosci. 9, páginas 207-219, 1997). 3 ES 2 251 077 T3 Mediante un alineamiento de los dominios proteasa de 7 serina proteasas conocidas (activador de plasminógeno de tipo tisular, activador del plasminógeno de tipo uroquinasa, trombina, plasmina, tripsina, quimotripsina y elastasa pancreática) en la proximidad de la histidina y la serina de la triada catalítica del sitio activo, se determinaron las secuencias de los denominados oligonucleótidos cebadores para la reacción de la polimerasa en cadena. 5 Los oligonucleótidos cebadores se usaron en una reacción en cadena de la polimerasa (PCR) junto con el ADNc-cs del ARN total de los cerebros de ratones de 10 días de edad y dieron lugar a la ampliación de un fragmento de ADNc de una longitud aproximada de 500 pares de bases. 10 15 Se usó con éxito este fragmento de ADNc para el aislamiento de fragmentos de ADNc adicionales por análisis de bibliotecas de ADNc disponibles en el mercado. Conjuntamente, los fragmentos de ADNc aislados cubrían la longitud completa de la porción codificadora del compuesto de la fórmula II. La secuencia completa de nucleótidos se obtuvo por secuenciación convencional y la secuencia de aminoácidos se obtuvo a partir de ésta. El compuesto de la fórmula I se clonó en base a su pronunciada similitud con el compuesto de la fórmula II. Los oligonucleótidos cebadores usados se sintetizaron según la secuencia conocida del compuesto de la fórmula 20 II. La clonación del compuesto de la fórmula I se realizó mediante dos bibliotecas de ADNc a partir de cerebro humano fetal disponible en el mercado. 25 30 35 Este procedimiento de clonación también puede usarse para el aislamiento de los compuestos homólogos en otras especies, tales como rata, conejo, cobaya, vaca, oveja, cerdo, primates, pájaros, pez cebra (Brachydanio rerio), Drosophila melanogaster, Caenorhabditis elegans, etc. Pueden usarse las secuencias de nucleótidos codificadoras para producir proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II. Un procedimiento desarrollado en nuestro laboratorio permite la producción de proteínas recombinantes en células de mieloma como proteínas de fusión con un dominio de inmunoglobulina (dominio constante de la cadena ligera kappa). El principio de la construcción se explica en detalle en Rader y col. (Rader y col., Eur. J. Biochem. 215, páginas 133-141, 1993). La proteína de fusión producida por las células de mieloma se aisló por cromatografía de inmunoafinidad usando un anticuerpo monoclonal contra el dominio de Ig de la cadena ligera kappa. Con el mismo procedimiento de expresión, también puede producirse la proteína nativa de un compuesto, empezando por la secuencia codificadora. 40 Pueden usarse las secuencias codificadoras de los compuestos de las fórmulas I o II como compuestos de inicio para la descripción y el aislamiento de alelos de los compuestos de las fórmulas I o II. Pueden usarse para este fin tanto la reacción en cadena de la polimerasa como la hibridación de ácido nucleico. 45 Las secuencias codificadoras de los compuestos de las fórmulas I o II pueden usarse como compuestos de inicio para la denominada “mutagénesis dirigida a sitio”, para generar secuencias de nucleótidos que codifican las proteínas codificadas definidas por los compuestos de las fórmulas I o II, o partes de éstas, pero cuya secuencia de nucleótidos se genera con respecto a los compuestos de las fórmulas I o II debido al uso de codones alternativos. Pueden usarse las secuencias codificadas de los compuestos de las fórmulas I o II como compuestos de inicio para la producción de variantes de secuencia mediante la denominada mutagénesis dirigida a sitio. 50 Mejores maneras para realizar la invención (Ejemplos) Clonación del ADNc del compuesto de la fórmula II (neurotripsina del ratón) 55 60 Se aisló el ARN total de los cerebros de ratones de 10 días de edad (ICR-ZUR) según el procedimiento de Chomczynski y Sacchi (1987). La producción de ADNc de cadena sencilla se realizó usando un cebador oligo(dT) y una ADN polimerasa dependiente de ARN (SuperScript RNase H-Reverse Transcriptase; Gibco BRL, Galthersburg, MD) según las instrucciones del proveedor. Para la realización de la reacción en cadena de la polimerasa se sintetizó un cebador sentido en base a la secuencia de aminoácidos de la región de la histidina conservada de la triada catalítica y un cebador en dirección antisentido basado en la secuencia de aminoácidos de la región de la serina conservada de la triada catalítica de las serina proteasas. Las secuencias de aminoácidos usadas para la determinación de los cebadores oligonucleotídicos se tomaron de las siete serina proteasas conocidas y se presentan a continuación. 65 4 ES 2 251 077 T3 5 10 15 20 Se alinearon las regiones de la histidina y la serina conservadas de la triada catalítica del sitio activo de los dominios proteasa de las 7 serina proteasas conocidas (activador del plasminógeno de tipo tisular, activador del plasminógeno de tipo uroquinasa, trombina, plasmina, tripsina, quimotripsina y elastasa pancreática). Se tomaron como base los aminoácidos conservados de éstas regiones para la determinación de los cebadores degenerados. Las secuencias de los cebadores se dieron según la recomendación de nomenclatura de la IUB (Comité de Nomenclatura, 1985). Los cebadores usados en la PCR contenían sitios de restricción para EcoRI y BamHI en sus extremos 5’ para facilitar una clonación posterior. Se usaron los siguientes cebadores: En la dirección de lectura (cebadores sentido): 25 5’-GGGGAATTCTGGGTI(C/G)(T/C)I(T/A)(G/C)IGCIGCICA(T/C)TG-3’ En la dirección contraria (cebadores antisentido) 30 35 40 45 5’-GGGGGATCCCCICCI(G/C)(A/T)(A/G)TCICC(C/T)T(G/C/T)(G/A)CA-3’ La reacción en cadena de la polimerasa se realizó en condiciones convencionales usando la ADN polimerasa AmpliTaq (Perkin Elmer) según las recomendaciones del fabricante. Se empleó el siguiente perfil de PCR: 93ºC durante 3 minutos, seguidos de 35 ciclos de 93ºC durante 1 minuto, 48ºC durante 2 minutos y 72ºC durante 2 minutos. Después del último ciclo, se continuó la incubación a 72ºC durante 10 minutos más. Los fragmentos amplificados tenían una longitud aproximada de 500 pares de bases. Se contaron con EcoRI y BamHI y se insertaron en un vector Blue Script (Bluescript SK(-), Stratagene). Los clones resultantes se analizaron por determinación de la secuencia del ADN usando el procedimiento de terminación de cadena dideoxi (Sanger y col., Proc. Natl. Acad. Sci. USA 77, páginas 2163-2167, 1977) en un secuenciador automático de ADN (LI-COR, modelo 4000L; Lincoln, NE) usando un kit de secuenciación comercial (kit-LC de secuenciación de ciclo de lectura larga SequiTerm; Epicentre Technologies, Madison, WI). El análisis producía una secuencia de 474 pares de bases de la región catalítica del dominio de la serina proteasa del compuesto de la fórmula II. El fragmento de PCR de 474 pares de bases de longitud se usó para analizar una biblioteca de ADNc Uni-ZAPXR cebada con oligo(dT) del cerebro de ratones de 20 días de edad (Stratagene; Nº de cat. 937 319). Se analizaron un total de 3 x 106 placas lambda en condiciones altamente rigurosas (Sambrook y col., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1989) usando un fragmento de PCR marcado radiactivamente como sonda y se encontraron 24 clones positivos. 50 55 60 65 De los clones fagémidos Lambda-Uni-ZAP-XR positivos se cortó el plásmido Bluescript correspondiente por escisión in vivo según un procedimiento convencional recomendado por el fabricante (Stratagene). Para determinar la longitud de los fragmentos insertados, se digirieron los clones plasmídicos de Bluescript correspondientes con SacI y KpnI. Los clones que contenían los fragmentos más largos se analizaron por secuenciación de ADN (como se ha descrito anteriormente) y, para el análisis posterior de los datos, se usó el software GCG (versión 8.1, Unix; Silicon Graphics, Inc.). Puesto que ninguno de los clones contenía la secuencia codificadora de longitud completa, se analizó una segunda biblioteca de ADNc. La biblioteca usada en este análisis fue una biblioteca de ADNc cebada con oligo(dT) y con cebado aleatorio en un fago Lambda (Lambda gt10) que se basaba en el ARNm de embriones de ratones de 15 días de edad (biblioteca de ADNc lambda gt10 cebado con oligo(dT)) y cebado aleatorio, Clontech, Palo Alto, CA; Nº de cat. ML 3002a). Se usó como sonda un fragmento(AvaI/AatII) de ADN marcado radiactivamente del extremo 5’ del clon más largo del primer análisis y se analizaron aproximadamente 2 x 106 placas. Este análisis dio lugar a 14 clones positivos. Los fragmentos de ADN se escindieron con EcoRI y se clonaron en el vector Bluescript(KS(+); Stratagene). El análisis de la secuencia se realizó como se ha descrito anteriormente. De esta manera, se obtuvo la secuencia de nucleótidos del compuesto de la fórmula II sobre los ADNc de longitud completa de 2361 y 2376 pares de bases, respectivamente. Con el procedimiento descrito de clonación de PCR es 5 ES 2 251 077 T3 posible encontrar y aislar también formas variantes de los compuestos de las fórmulas I o II, como por ejemplo sus variantes alélicas y de ayuste. El procedimiento descrito de análisis de una biblioteca de ADNc permite también la detección y aislamiento de compuestos que hibridan en condiciones estrictas con las secuencias codificadoras de los compuestos de las fórmulas I o II. 5 Clonación del ADNc del compuesto de la fórmula I (neurotripsina de humanos) 10 La clonación del ADNc del compuesto de la fórmula I se realizó en base a la secuencia de nucleótidos del compuesto de la fórmula II. Como primera etapa, se amplificó un fragmento del compuesto de la fórmula I usando la reacción en cadena de la polimerasa (PCR). Como matriz usamos el ADN obtenido de una biblioteca de ADNc del cerebro de un feto humano (17ª-18ª semana de gestación) que está disponible en el mercado (biblioteca de ADNc del cerebro de feto humano cebado con Oligo(dT) y de forma aleatoria en el vector Lambda ZAP II, Nº de catálogo 936206, Stratagene). Los cebadores de PCR sintéticos contenían sitios de restricción para HindIII y XhoI en el extremo 5’ para facilitar la clonación posterior. 15 En la dirección de lectura (cebadores sentido): 5’-GGGAAGCTTGGICA(A/G)TGGGGIACI(A/G)TITG(C/T)GA(C/T)-3’ 20 En la dirección contraria (cebadores antisentido): 5’-GGGCTCGAGCCCCAICCTGTTATGTAAIAGTTG-3’ 25 30 La PCR se realizó en condiciones convencionales usando la ADN polimerasa AmpliTaq (Perkin Elmer) según las recomendaciones del fabricante. El fragmento resultante de 1116 pares de bases se insertó en el vector Bluescript (Bluescript SK(-), Stratagene). Se usó un fragmento HindIII/StuI de 600 pares de bases de longitud, correspondiente con la mitad 5’ del fragmento de PCR de 1116 pares de bases de longitud, para el análisis de una biblioteca de ADNc Lambda de cerebro fetal humano (biblioteca de ADNc de cerebro fetal humano 5’-STRETCH PLUS; Lambda gt10; Nº de cat. HL 3003a; Clontech). Se analizaron 2 x 106 placas de Lambda en condiciones muy estrictas (Sambrook y col., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 1989) mediante un fragmento de PCR marcado radiactivamente y se encontraron y aislaron 23 clones positivos. 35 A partir de los clones Lambda gt10 positivos, se cortaron los fragmentos de ADNc correspondientes con EcoRI y se insertaron en un vector Bluescript (Bluescript KS(+), Stratagene). La secuenciación se realizó mediante el procedimiento de terminación de cadena dideoxi (Sanger y col. Proc. Natl. Acad. Sci. USA 77, páginas 2163-2167, 1977), usando un kit de secuenciación comercial (kit-LC de secuenciación de ciclo de lectura larga SequiTerm; Epicentre Technologies, Madison, WI) y cebadores específicas de Bluescript. 40 En una estrategia de secuenciación alternativa, los fragmentos de ADNc de los clones Lambda gt10 positivos se amplificaron por PCR usando cebadores específicos de Lambda. La secuenciación se realizó como se describe anteriormente. El análisis por ordenador de las secuencias se realizó mediante el paquete de programación GCG (versión 8.1, Unix; Silicon Graphics Inc.). 45 50 De esta forma se obtuvo la secuencia de nucleótidos sobre la longitud completa del ADNc de 3350 pares de bases. Con el procedimiento descrito para la clonación por PCR es posible encontrar y aislar también formas variantes de los compuestos de las fórmulas I o II, como por ejemplo sus variantes alélicas o de ayuste. El procedimiento descrito para el análisis de una biblioteca de ADNc también permite la descripción y el aislamiento de compuestos que hibridan en condiciones estrictas con las secuencias codificadoras de los compuestos de las fórmulas I o II. Visualización de las secuencias codificadas de los compuestos de las fórmulas I o II mediante anticuerpos 55 El segmento básico rico en prolina de más de 60 aminoácidos de longitud del extremo amino terminal de la secuencia codificada de los componentes de las fórmulas I o II es muy adecuado para la producción de anticuerpos mediante la síntesis de péptidos y su uso para inmunización. Hemos seleccionado dos secuencias peptídicas con una longitud de 19 y 13 aminoácidos a partir del segmento básico rico en prolina en el extremo amino terminal de la secuencia codificada del compuesto de fórmula II para la generación de anticuerpos. Los péptidos tienen las secuencias siguientes: 60 Péptido 1: H2 N-SRS PLH RPH PSP PRS QX-CONH2 65 Péptido 2: H2 N-LPS SRR PPR TPR F-COOH 6 ES 2 251 077 T3 5 10 Los dos péptidos se sintetizaron químicamente, se conjugaron con un vehículo macromolecular (hemocianina de lapa bocallave) y se inyectaron 2 conejos para su inmunización. Los antisueros resultantes muestran un alto valor de anticuerpo y puede usarse sucesivamente tanto para la identificación de la neurotripsina nativa en extracto de cerebro de ratón como para la identificación de neurotripsina recombinante. También puede usarse el procedimiento empleado para la generación de anticuerpos para la generación de anticuerpos contra la secuencia codificada del compuesto de la fórmula I. Los anticuerpos resultantes contra las secuencias parciales de las secuencias codificadas de los compuestos de las fórmulas I o II pueden usarse para la detección y el aislamiento de formas variantes de los compuestos de las fórmulas I o II, como por ejemplo variantes alélicas o de ayuste. Estos anticuerpos también pueden usarse para la detección y aislamiento de variantes génicas generadas tecnológicamente de los compuestos de las fórmulas I o II. Purificación de las secuencias codificadas de los compuestos de las fórmulas I o II 15 20 25 Además de los procedimientos cromatográficos convencionales, como por ejemplo cromatografía de intercambio iónico, también puede conseguirse la purificación de las secuencias codificadas de los compuestos de las fórmulas I o II usando dos procedimientos de purificación por cromatografía de afinidad. Un procedimiento de purificación por afinidad cromatográfica está basado en la disponibilidad de los anticuerpos. Uniendo los anticuerpos a una matriz cromatográfica se obtiene un procedimiento de purificación con el que se puede alcanzar un grado muy alto de pureza del compuesto correspondiente en una sola etapa. Otra característica importante que puede usarse para la purificación de secuencias codificadas de los compuestos de las fórmulas I o II es el segmento básico rico en prolina del extremo amino terminal. Puede esperarse que, debido a la alta densidad de cargas positivas, este segmento medie en la unión de las secuencias codificadas de los compuestos de las fórmulas I o II a matrices de afinidad de heparina y similares a heparina. Este principio también permite el aislamiento, o al menos el enriquecimiento, de formas variantes de las secuencias codificadas de los compuestos de las fórmulas I o II, así como por ejemplo sus variantes alélica o de ayuste. Así mismo, puede usarse la cromatografía de afinidad en heparina para el aislamiento, o al menos el enriquecimiento de proteínas homólogas de especie de los compuestos de las fórmulas I o II. 30 Aplicabilidad industrial 35 40 Las secuencias codificadas de los compuestos de las fórmulas I o II pueden usarse para la producción de las proteínas codificadas, o parte de éstas, de las fórmulas I o II. La producción de las proteínas codificadas puede lograrse en sistemas de expresión procarióticos y eucarióticos. El patrón de expresión génica de los compuestos de la invención en el cerebro es sumamente interesante ya que estas moléculas se expresan en el sistema nervioso adulto predominantemente en neuronas de regiones que se piensa tienen un importante papel en las funciones de aprendizaje y memoria. Junto con las recientes evidencias encontradas de un papel de las proteasas extracelulares en la plasticidad neuronal, el patrón de expresión permite suponer que la actividad proteolítica de la neurotripsina tiene un papel en reorganizaciones estructurales en conexión con operaciones de aprendizaje y memoria, por ejemplo operaciones que están implicadas en el procesamiento y almacenamiento de comportamientos aprendidos, emociones aprendidas o contenidos de memoria. Los compuestos de la invención pueden, de este modo, representar una diana para la intervención farmacéutica en disfunciones del cerebro. 45 El patrón de expresión génica de los compuestos de la invención en la corteza cerebral (especialmente en las capas V y VI) es sumamente interesante, ya que se ha encontrado que una reducción de la diferenciación celular de la corteza cerebral está asociada con la esquizofrenia. Los compuestos de la invención pueden, de ese modo, ser diana para la intervención farmacéutica en la esquizofrenia y enfermedades psiquiátricas relacionadas. 50 55 Se ha encontrado que las secuencias codificadoras de los compuestos de la invención están aumentadas en las neuronas localizadas adyacentes a los tejidos dañados por un accidente cerebrovascular isquémico focal, lo que indica que los compuestos de la invención tienen un papel en la reacción tisular del tejido cerebral dañado. Los compuestos de la invención pueden, de ese modo, representar una diana para la intervención farmacéutica tras un accidente cerebrovascular isquémico y otras formas de daño tisular neuronal. 60 Se ha encontrado recientemente que el activador del plasminógeno de tipo tisular, una serina proteasa relacionada con los compuestos de la invención, está implicado en la muerte celular neuronal mediada por excitotoxicidad. Puede imaginarse una función similar para los compuestos de la invención y, de ese modo, los compuestos de la invención representan una posible diana para una intervención farmacéutica en enfermedades en las que se da muerte celular. 65 Es interesante el patrón de expresión génica de los compuestos de la invención en la médula espinal y en los ganglios sensoriales, ya que estas moléculas se expresan en el sistema nervioso adulto en las neuronas de regiones cerebrales que se piensa tienen un papel en el procesamiento del dolor, así como en la patogénesis del dolor patológico. Los compuestos de la invención pueden, de ese modo, ser diana de intervención farmacéutica en el dolor patológico. A continuación se recogen las características de los compuestos de las fórmulas I o II. 7 ES 2 251 077 T3 (1) Información sobre el compuesto de la Fórmula I (Neurotripsina de humanos) (i) CARACTERÍSTICAS DE LA SECUENCIA: 5 (A) LONGITUD: 3350 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADENA: cadena sencilla 10 (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc del ARNm 15 (vi) FUENTE ORIGINAL: (A) ORGANISMO: Homo sapiens (D) FASE DE DESARROLLO: fetal 20 (F) TIPO DE TEJIDO: cerebro (vii) FUENTE INMEDIATA: 25 (A) BIBLIOTECA: extensión 5’ del cerebro fetal humano más biblioteca de ADNc en el vector lambda gt10; Nº. cat.: HL 3003a, Clontech, Palo Alto, CA, USA (B) CLONES: Clones de ADNc Nº: 3-1, 3-2, 3-6, 3-7, 3-8, 3-10, 3-11, 3-12 30 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido señal (B) LOCALIZACIÓN: 44..103 35 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido maduro 40 (B) LOCALIZACIÓN: 104..2668 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: secuencia codificadora 45 (B) LOCALIZACIÓN: 44..2668 (ix) CARACTERÍSTICA: 50 (A) NOMBRE/CLAVE: segmento básico, rico en prolina (B) LOCALIZACIÓN 104..319 (ix) CARACTERÍSTICA: 55 (A) NOMBRE/CLAVE: dominio Kringle (B) LOCALIZACIÓN 320..538 60 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio SRCR 1 (B) LOCALIZACIÓN: 551..856 65 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio SRCR 2 8 ES 2 251 077 T3 (B) LOCALIZACIÓN: 881..1186 (ix) CARACTERÍSTICA: 5 (A) NOMBRE/CLAVE: dominio SRCR 3 (B) LOCALIZACIÓN: 1202..1504 (ix) CARACTERÍSTICA: 10 (A) NOMBRE/CLAVE: dominio SRCR 4 (B) LOCALIZACIÓN: 1541..1846 15 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio proteolítico 1 (B) LOCALIZACIÓN: 1898..2668 20 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: histidina de la triada catalítica 25 (B) LOCALIZACIÓN: 2069-2071 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: ácido aspártico de la triada catalítica 30 (B) LOCALIZACIÓN: 2219-2221 (ix) CARACTERÍSTICA: 35 (A) NOMBRE/CLAVE: serina de la triada catalítica (B) LOCALIZACIÓN: 2516..2518 (ix) CARACTERÍSTICA: 40 (A) NOMBRE/CLAVE: señal poliA (B) LOCALIZACIÓN: 2873..2878 45 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: señal poliA (B) LOCALIZACIÓN: 3034..3039 50 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: señal poliA 55 (B) LOCALIZACIÓN: 3215..3220 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: 3’ UTR 60 (B) LOCALIZACIÓN: 2669..3350 (ix) CARACTERÍSTICA: 65 (A) NOMBRE/CLAVE: 5’ UTR (B) LOCALIZACIÓN: 1..43 9 ES 2 251 077 T3 Compuesto de la fórmula I (neurotripsina de humano) 5 10 15 20 25 30 35 40 45 50 55 60 65 10 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 11 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 12 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 13 ES 2 251 077 T3 5 10 15 20 25 (1) Información sobre el compuesto de la Fórmula II (Neurotripsina de ratón) (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2376 pares de bases 30 (B) TIPO: ácido nucleico (C) TIPO DE CADENA: cadena sencilla 35 (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADNc del ARNm (vi) FUENTE ORIGINAL: 40 (A) ORGANISMO: Mus musculus (D) FASE DE DESARROLLO: día 10 tras el nacimiento 45 (F) TIPO DE TEJIDO: cerebro (G) TIPO CELULAR: neuronas (vii) FUENTE INMEDIATA: 50 55 (A) BIBLIOTECA: biblioteca de ADNc de cerebro de ratón en el vector lambda Uni-ZAP-XR, cebado con olig(dT) de ratones Balb/c, 20 días tras el nacimiento; Nº. cat.: 937 319; Stratagene, La Jolla, CA, USA (B) CLON: Clon de ADNc Nº 16 (vii) FUENTE INMEDIATA: 60 (A) BIBLIOTECA: biblioteca de ADNc de cerebro de ratón en el vector lambda gt10, cebado con olig(dT) y cebado aleatorio, de embrión de 15 días; Nº. cat.: ML 3002a; Clontech, Palo Alto, CA, USA (B) CLON: Clon de ADNc Nº 25 65 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido señal 14 ES 2 251 077 T3 (B) LOCALIZACIÓN: 24..86 (ix) CARACTERÍSTICA: 5 (A) NOMBRE/CLAVE: péptido maduro (B) LOCALIZACIÓN: 87..2306 (ix) CARACTERÍSTICA: 10 (A) NOMBRE/CLAVE: secuencia codificadora (B) LOCALIZACIÓN: 24..2306 15 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: segmento básico, rico en prolina (B) LOCALIZACIÓN 90..275 20 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio Kringle 25 (B) LOCALIZACIÓN 276..494 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio SRCR 1 30 (B) LOCALIZACIÓN: 519..824 (ix) CARACTERÍSTICA: 35 (A) NOMBRE/CLAVE: dominio SRCR 2 (B) LOCALIZACIÓN: 840..1142 (ix) CARACTERÍSTICA: 40 (A) NOMBRE/CLAVE: dominio SRCR 3 (B) LOCALIZACIÓN: 1179..1484 45 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: dominio proteolítico (B) LOCALIZACIÓN: 1536..2306 50 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: histidina de la triada catalítica 55 (B) LOCALIZACIÓN: 1707..1709 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: ácido aspártico de la triada catalítica 60 (B) LOCALIZACIÓN: 1857..1859 (ix) CARACTERÍSTICA: 65 (A) NOMBRE/CLAVE: serina de la triada catalítica (B) LOCALIZACIÓN: 2154..2156 15 ES 2 251 077 T3 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: señal poliA 5 (B) LOCALIZACIÓN: 2324..2329 y 2331..2336 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: segmento poliA 10 (B) LOCALIZACIÓN: 2357..2376 (ix) CARACTERÍSTICA: 15 (A) NOMBRE/CLAVE: 3’ UTR (B) LOCALIZACIÓN: 2307..2341 ó 2307..2356 (ix) CARACTERÍSTICA: 20 (A) NOMBRE/CLAVE: 5’ UTR (B) LOCALIZACIÓN: 1..23 25 30 35 40 45 50 55 60 65 16 ES 2 251 077 T3 Compuesto de la fórmula II (neurotripsina de ratón) 5 10 15 20 25 30 35 40 45 50 55 60 65 17 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 18 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 19 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 20 ES 2 251 077 T3 REIVINDICACIONES 1. Neurotripsinas de las fórmulas I o II 5 I: neurotripsina de humanos II: neurotripsina de ratón. 10 2. Secuencias de nucleótidos que codifican las neurotripsinas según la reivindicación 1, caracterizadas porque comprenden las secuencias de nucleótidos que codifican los compuestos de las fórmulas I o II. 3. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la producción de proteínas recombinantes. 15 4. Uso de proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II como dianas para el desarrollo de medicamentos, por ejemplo para la inhibición de la potenciación de la actividad catalítica de las proteínas codificadas de las fórmulas I o II. 20 25 5. Uso de las proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II para la determinación de la estructura espacial, por ejemplo la determinación de la estructura espacial mediante cristalografía o espectroscopia de resonancia magnética nuclear (RMN). 6. Uso de las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II para predecir la estructura de la proteína mediante procedimientos de predicción de estructura de proteínas por ordenador. 7. Uso de las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II como antígenos para la producción de anticuerpos, como por ejemplo anticuerpos que inhiben o promueven la función proteasa o anticuerpos que pueden usarse para estudios inmunohistoquímicos. 30 8. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la producción de animales transgénicos no humanos, como por ejemplo ratones transgénicos. 35 9. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la inactivación o mutación del gene correspondiente mediante técnicas de reconocimiento génico, como por ejemplo, la eliminación del gen en el ratón mediante de recombinación homóloga. 40 45 50 55 60 65 21 ES 2 251 077 T3 LISTA DE SECUENCIAS (1) INFORMACIÓN GENERAL: 5 (i) SOLICITANTE: (A) NOMBRE: Peter Sonderegger (B) CALLE: Winterthurerstr. 190 10 (C) CIUDAD: Zurich (E) PAÍS: Suiza (F) CÓDIGO POSTAL: CH-8057 (G) TELÉFONO: +41 1 635 55 41 15 (H) TELEFAX: +41 1 635 68 31 (ii) TÍTULO DE LA INVENCIÓN: Neurotripsina (iii) NÚMERO DE SECUENCIAS: 4 20 (iv) FORMATO LEGIBLE POR ORDENADOR: (A) TIPO DE MEDIO: Disquete (B) ORDENADOR: IBM PC compatible 25 (C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: PatentIn Release Nº 1.0, Versión Nº 1.30 (EPO) (vi) DATOS DE LA SOLICITUD ANTERIOR: 30 (A) NÚMERO DE SOLICITUD: CH 1997 0966/97 (B) FECHA DE PRESENTACIÓN: 26-abril-1997 (2) INFORMACIÓN PARA LA ID SEC Nº 1: 35 (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3350 pares de bases (B) TIPO: ácido nucleico 40 (C) TIPO DE CADENA: cadena sencilla (D) TOPOLOGÍA: Lineal (ii) TIPO DE MOLÉCULA: ADNc del ARNm 45 (iii) HIPOTÉTICA: NO (iv) ANTISENTIDO: NO (vi) FUENTE ORIGINAL: 50 (A) ORGANISMO: Homo sapiens (D) FASE DE DESARROLLO: fetal (F) TIPO DE TEJIDO: cerebro 55 (vii) FUENTE INMEDIATA: (A) BIBLIOTECA: biblioteca de ADNc; Nº. cat.: HL 3003a, Clontech, Palo Alto, CA, USA (B) CLONES: 3-1, 3-2, 3-6, 3-7, 3-8, 3-10, 3-11, 3-12 60 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido_señal (B) LOCALIZACIÓN: 44..103 65 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido_mad (B) LOCALIZACIÓN: 104..2668 1 ES 2 251 077 T3 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: CDS (B) LOCALIZACIÓN: 44..2668 5 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: 5’ UTR (B) LOCALIZACIÓN: 1..43 10 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: 3’ UTR (B) LOCALIZACIÓN: 2669..3350 15 (xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 1: 20 25 30 35 40 45 50 55 60 65 2 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 3 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 4 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 5 ES 2 251 077 T3 (2) INFORMACIÓN PARA LA ID SEC Nº 2: (i) CARACTERÍSTICAS DE LA SECUENCIA: 5 (A) LONGITUD: 875 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal 10 (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 2: 15 20 25 30 35 40 45 50 55 60 65 6 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 7 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 (2) INFORMACIÓN PARA LA ID SEC Nº 3: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 2356 pares de bases 60 (B) TIPO: ácido nucleico (C) TIPO DE CADENA: cadena sencilla (D) TOPOLOGÍA: lineal 65 (ii) TIPO DE MOLÉCULA: ADNc del ARNm (iii) HIPOTÉTICA: NO 8 ES 2 251 077 T3 (iv) ANTISENTIDO: NO (vi) FUENTE ORIGINAL: 5 (A) ORGANISMO: Mus musculus (B) CEPA: ICR-ZUR (D) FASE DE DESARROLLO: día 10 tras el nacimiento (F) TIPO DE TEJIDO: cerebro 10 (G) TIPO CELULAR: neuronas (vii) FUENTE INMEDIATA: (A) BIBLIOTECA: biblioteca de ADNc; Nº. cat.: ML 3002a, Clontech, Palo Alto, CA, USA 15 (B) CLON: clon de ADNc Nº 25 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido_señal 20 (B) LOCALIZACIÓN: 24..86 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: péptido_mad 25 (B) LOCALIZACIÓN: 87..2306 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: CDS 30 (B) LOCALIZACIÓN: 24..2306 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: sitio_poliA 35 (B) LOCALIZACIÓN: uno de (2341, 2356) (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: 5’ UTR (B) LOCALIZACIÓN: 1..23 40 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: 3’ UTR (B) LOCALIZACIÓN: 2307..uno de (2341, 2356) 45 (xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 3: 50 55 60 65 9 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 10 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 11 ES 2 251 077 T3 5 10 15 20 25 30 35 40 (2) INFORMACIÓN PARA LA ID SEC Nº 4: 45 (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 761 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal 50 (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 4: 55 60 65 12 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 13 ES 2 251 077 T3 5 10 15 20 25 30 35 40 45 50 55 60 65 14