Download ES 2 251 077 T3 - Patentes

Document related concepts

Genoteca wikipedia , lookup

Secuencia de aminoácidos wikipedia , lookup

Transcript
19
OFICINA ESPAÑOLA DE
PATENTES Y MARCAS
11 Número de publicación: 2 251 077
51 Int. Cl. : C12N 15/57, C12N 9/64
7
A61K 31/70, A61K 38/48
C12Q 1/37, A61K 48/00
C07K 16/40, C12N 15/00
A01K 67/027, C12Q 1/68
ESPAÑA
12
TRADUCCIÓN DE PATENTE EUROPEA
T3
86 Número de solicitud europea: 98913981 .1
86
Fecha de presentación : 24.04.1998
87 Número de publicación de la solicitud: 0977871
87 Fecha de publicación de la solicitud: 09.02.2000
54 Título: Neurotripsina.
30 Prioridad: 26.04.1997 CH 96697
73 Titular/es: Peter Sonderegger
Biochemisches Institut Universitat Zurich
Winterthurerstrasse 190
8057 Zürich, CH
45 Fecha de publicación de la mención BOPI:
72 Inventor/es: Sonderegger, Peter
16.04.2006
45 Fecha de la publicación del folleto de la patente:
74 Agente: Roeb Díaz-Álvarez, María
ES 2 251 077 T3
16.04.2006
Aviso: En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín europeo de patentes, de
la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea
de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se
considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 del
Convenio sobre concesión de Patentes Europeas).
Venta de fascículos: Oficina Española de Patentes y Marcas. Pº de la Castellana, 75 – 28071 Madrid
ES 2 251 077 T3
DESCRIPCIÓN
Neurotripsina.
5
Campo técnico
La presente invención se dirige a las neurotripsinas y a una composición farmacéutica que contiene estas sustancias
o tiene influencia sobre estas sustancias.
10
Descripción de la invención
La neurotripsina es una serina proteasa descrita recientemente, que se expresa predominantemente en el cerebro y
en los pulmones; la expresión en el cerebro tiene lugar casi exclusivamente en las neuronas.
15
La neurotripsina tiene una composición de dominios aún no encontrada previamente: además del dominio proteasa,
se han encontrado 3 ó 4 dominios SRCR (receptor con dominios ricos en cisteína tipo basurero) y un dominio Kringle.
Hay que señalar que aún no se había encontrado en proteínas la combinación de dominios Kringle y SRCR. En
el extremo amino terminal de la proteína neurotripsina hay un segmento de más de 60 aminoácidos que tiene una
proporción extremadamente alta de prolina y de aminoácidos básicos (arginina e histidina).
20
La invención se caracteriza por las características de las reivindicaciones independientes. Las realizaciones preferidas se definen en las reivindicaciones dependientes.
Las neurotripsinas recién encontradas
25
- neurotripsina de humanos (compuesto de la fórmula I),
- neurotripsina de ratón (compuesto de la fórmula II)
30
difieren mucho estructuralmente de las serina proteasas conocidas hasta ahora.
Las serina proteasas cuyos dominios proteasa están más relacionados estructuralmente con el dominio proteasa
de los nuevos compuestos, concretamente la plasmina (de humanos), tiene sólo un 44% de identidad de secuencia de
aminoácidos.
35
El segmento básico rico en prolina del extremo amino terminal tiene una cierta semejanza con los segmentos
básicos de las netrinas y las semaforinas/colapsinas. Debido a este segmento, es probable que puedan enriquecerse las
muestras de la neurotripsina mediante cromatografía de afinidad con heparina.
40
La neurotripsina de humanos (compuesto de la fórmula I) y la de ratón (compuesto de la fórmula II) muestran una
similitud estructural muy alta entre ellas.
La identidad de las secuencias de aminoácidos de las proteínas nativas de los compuestos de las fórmulas I o II,
asciende al 81%.
45
50
55
60
La neurotripsina de humanos (compuesto de la fórmula I) tiene una secuencia codificadora de 2625 nucleótidos. El
péptido codificado de la fórmula I tiene una longitud de 875 aminoácidos y contiene un péptido señal de 20 aminoácidos. La neurotripsina de ratón (compuesto de la fórmula II) tiene una secuencia codificadora de 2283 nucleótidos. La
proteína codificada del compuesto de la fórmula II tiene una longitud de 761 aminoácidos y contiene un péptido señal
de 21 aminoácidos. La razón de la mayor longitud de la neurotripsina de humanos consiste en que la neurotripsina de
humanos tiene 4 dominios SRCR, mientras que la de ratón tiene sólo 3 dominios SRCR.
Los dominios que están presente en ambos compuestos (compuesto de la fórmula I y compuesto de la fórmula II)
tienen un alto grado de similitud de secuencia. Los dominios SRCR correspondientes de las fórmulas I y II tienen una
identidad de secuencia de aminoácidos del 81% al 91%. Los dominios Kringle correspondientes tienen una identidad
de secuencia de aminoácidos del 75%. También comprende un alto grado de similitud (90% de identidad de secuencia
de aminoácidos) en el dominio enzimáticamente activo (es decir, proteolítico).
Los dominios proteasa de las neurotripsinas de humanos (compuesto de la fórmula I) y de ratón (compuesto de la
fórmula II) se alinean en la siguiente sección, para ilustrar el alto grado de identidad de secuencia.
65
2
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
De las 258 posiciones de la secuencia de aminoácidos incluidas en la comparación, hay 233 aminoácidos que son
idénticos en ambos compuestos (secuencia superior: compuesto de la fórmula I; secuencia inferior: compuesto de la
fórmula II: los aminoácidos idénticos se indican con líneas verticales).
Las neurotripsinas de la invención son únicas cuando se comparan con las serina proteasas conocidas que se
expresan según las observaciones actuales disponibles en un grado diferente en neuronas. Otros órganos con una
fuerte expresión de neurotripsina son los pulmones (véase Gschwend y col., Mol. Cell. Neurosci. 9, páginas 207-219,
1997).
Las proteínas que son más similares desde el punto de vista estructural con los compuestos de las fórmulas I o II
son las serina proteasas, tales como el activador del plasminógeno de tipo tisular (tPA), activador del plasminógeno de
tipo uroquinasa (uPA), plasmina, tripsina, apolipoproteína (a), factor de coagulación XI, neuropsina y acrosina.
En el cerebro adulto, los compuestos de la invención se expresan predominantemente en la corteza cerebral, el
hipocampo y la amígdala.
55
En el tronco cerebral y en la médula espinal de adulto, los compuestos de la invención se expresan predominantemente en las neuronas motoras. Se encuentra una expresión ligeramente más débil en las neuronas de las capas
superficiales del asa lateral de la médula espinal.
60
En el sistema nervioso periférico adulto, los compuestos de la invención se expresan en subpoblaciones de las
neuronas de los ganglios sensoriales.
Los compuestos de la invención se encontraron en conexión con un estudio que tenía como objetivo la descripción
de serina proteínas similares a tripsina en el sistema nervioso.
65
El primer compuesto que se encontró y caracterizó fue el compuesto de la fórmula II (Gschwend y col., Mol. Cell.
Neurosci. 9, páginas 207-219, 1997).
3
ES 2 251 077 T3
Mediante un alineamiento de los dominios proteasa de 7 serina proteasas conocidas (activador de plasminógeno
de tipo tisular, activador del plasminógeno de tipo uroquinasa, trombina, plasmina, tripsina, quimotripsina y elastasa
pancreática) en la proximidad de la histidina y la serina de la triada catalítica del sitio activo, se determinaron las
secuencias de los denominados oligonucleótidos cebadores para la reacción de la polimerasa en cadena.
5
Los oligonucleótidos cebadores se usaron en una reacción en cadena de la polimerasa (PCR) junto con el ADNc-cs
del ARN total de los cerebros de ratones de 10 días de edad y dieron lugar a la ampliación de un fragmento de ADNc
de una longitud aproximada de 500 pares de bases.
10
15
Se usó con éxito este fragmento de ADNc para el aislamiento de fragmentos de ADNc adicionales por análisis de
bibliotecas de ADNc disponibles en el mercado. Conjuntamente, los fragmentos de ADNc aislados cubrían la longitud
completa de la porción codificadora del compuesto de la fórmula II.
La secuencia completa de nucleótidos se obtuvo por secuenciación convencional y la secuencia de aminoácidos se
obtuvo a partir de ésta.
El compuesto de la fórmula I se clonó en base a su pronunciada similitud con el compuesto de la fórmula II.
Los oligonucleótidos cebadores usados se sintetizaron según la secuencia conocida del compuesto de la fórmula
20
II.
La clonación del compuesto de la fórmula I se realizó mediante dos bibliotecas de ADNc a partir de cerebro
humano fetal disponible en el mercado.
25
30
35
Este procedimiento de clonación también puede usarse para el aislamiento de los compuestos homólogos en otras
especies, tales como rata, conejo, cobaya, vaca, oveja, cerdo, primates, pájaros, pez cebra (Brachydanio rerio), Drosophila melanogaster, Caenorhabditis elegans, etc.
Pueden usarse las secuencias de nucleótidos codificadoras para producir proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II. Un procedimiento desarrollado en nuestro laboratorio permite
la producción de proteínas recombinantes en células de mieloma como proteínas de fusión con un dominio de inmunoglobulina (dominio constante de la cadena ligera kappa). El principio de la construcción se explica en detalle en Rader
y col. (Rader y col., Eur. J. Biochem. 215, páginas 133-141, 1993). La proteína de fusión producida por las células de
mieloma se aisló por cromatografía de inmunoafinidad usando un anticuerpo monoclonal contra el dominio de Ig de
la cadena ligera kappa. Con el mismo procedimiento de expresión, también puede producirse la proteína nativa de un
compuesto, empezando por la secuencia codificadora.
40
Pueden usarse las secuencias codificadoras de los compuestos de las fórmulas I o II como compuestos de inicio
para la descripción y el aislamiento de alelos de los compuestos de las fórmulas I o II. Pueden usarse para este fin
tanto la reacción en cadena de la polimerasa como la hibridación de ácido nucleico.
45
Las secuencias codificadoras de los compuestos de las fórmulas I o II pueden usarse como compuestos de inicio
para la denominada “mutagénesis dirigida a sitio”, para generar secuencias de nucleótidos que codifican las proteínas
codificadas definidas por los compuestos de las fórmulas I o II, o partes de éstas, pero cuya secuencia de nucleótidos
se genera con respecto a los compuestos de las fórmulas I o II debido al uso de codones alternativos.
Pueden usarse las secuencias codificadas de los compuestos de las fórmulas I o II como compuestos de inicio para
la producción de variantes de secuencia mediante la denominada mutagénesis dirigida a sitio.
50
Mejores maneras para realizar la invención (Ejemplos)
Clonación del ADNc del compuesto de la fórmula II (neurotripsina del ratón)
55
60
Se aisló el ARN total de los cerebros de ratones de 10 días de edad (ICR-ZUR) según el procedimiento de
Chomczynski y Sacchi (1987). La producción de ADNc de cadena sencilla se realizó usando un cebador oligo(dT) y
una ADN polimerasa dependiente de ARN (SuperScript RNase H-Reverse Transcriptase; Gibco BRL, Galthersburg,
MD) según las instrucciones del proveedor. Para la realización de la reacción en cadena de la polimerasa se sintetizó
un cebador sentido en base a la secuencia de aminoácidos de la región de la histidina conservada de la triada catalítica
y un cebador en dirección antisentido basado en la secuencia de aminoácidos de la región de la serina conservada de la
triada catalítica de las serina proteasas. Las secuencias de aminoácidos usadas para la determinación de los cebadores
oligonucleotídicos se tomaron de las siete serina proteasas conocidas y se presentan a continuación.
65
4
ES 2 251 077 T3
5
10
15
20
Se alinearon las regiones de la histidina y la serina conservadas de la triada catalítica del sitio activo de los dominios
proteasa de las 7 serina proteasas conocidas (activador del plasminógeno de tipo tisular, activador del plasminógeno
de tipo uroquinasa, trombina, plasmina, tripsina, quimotripsina y elastasa pancreática). Se tomaron como base los
aminoácidos conservados de éstas regiones para la determinación de los cebadores degenerados. Las secuencias de los
cebadores se dieron según la recomendación de nomenclatura de la IUB (Comité de Nomenclatura, 1985).
Los cebadores usados en la PCR contenían sitios de restricción para EcoRI y BamHI en sus extremos 5’ para
facilitar una clonación posterior.
Se usaron los siguientes cebadores:
En la dirección de lectura (cebadores sentido):
25
5’-GGGGAATTCTGGGTI(C/G)(T/C)I(T/A)(G/C)IGCIGCICA(T/C)TG-3’
En la dirección contraria (cebadores antisentido)
30
35
40
45
5’-GGGGGATCCCCICCI(G/C)(A/T)(A/G)TCICC(C/T)T(G/C/T)(G/A)CA-3’
La reacción en cadena de la polimerasa se realizó en condiciones convencionales usando la ADN polimerasa
AmpliTaq (Perkin Elmer) según las recomendaciones del fabricante. Se empleó el siguiente perfil de PCR: 93ºC
durante 3 minutos, seguidos de 35 ciclos de 93ºC durante 1 minuto, 48ºC durante 2 minutos y 72ºC durante 2 minutos.
Después del último ciclo, se continuó la incubación a 72ºC durante 10 minutos más.
Los fragmentos amplificados tenían una longitud aproximada de 500 pares de bases. Se contaron con EcoRI y
BamHI y se insertaron en un vector Blue Script (Bluescript SK(-), Stratagene). Los clones resultantes se analizaron
por determinación de la secuencia del ADN usando el procedimiento de terminación de cadena dideoxi (Sanger y col.,
Proc. Natl. Acad. Sci. USA 77, páginas 2163-2167, 1977) en un secuenciador automático de ADN (LI-COR, modelo
4000L; Lincoln, NE) usando un kit de secuenciación comercial (kit-LC de secuenciación de ciclo de lectura larga
SequiTerm; Epicentre Technologies, Madison, WI). El análisis producía una secuencia de 474 pares de bases de la
región catalítica del dominio de la serina proteasa del compuesto de la fórmula II.
El fragmento de PCR de 474 pares de bases de longitud se usó para analizar una biblioteca de ADNc Uni-ZAPXR cebada con oligo(dT) del cerebro de ratones de 20 días de edad (Stratagene; Nº de cat. 937 319). Se analizaron un
total de 3 x 106 placas lambda en condiciones altamente rigurosas (Sambrook y col., Molecular Cloning: A Laboratory
Manual, Cold Spring Harbor Laboratory Press, 1989) usando un fragmento de PCR marcado radiactivamente como
sonda y se encontraron 24 clones positivos.
50
55
60
65
De los clones fagémidos Lambda-Uni-ZAP-XR positivos se cortó el plásmido Bluescript correspondiente por
escisión in vivo según un procedimiento convencional recomendado por el fabricante (Stratagene). Para determinar la
longitud de los fragmentos insertados, se digirieron los clones plasmídicos de Bluescript correspondientes con SacI
y KpnI. Los clones que contenían los fragmentos más largos se analizaron por secuenciación de ADN (como se ha
descrito anteriormente) y, para el análisis posterior de los datos, se usó el software GCG (versión 8.1, Unix; Silicon
Graphics, Inc.).
Puesto que ninguno de los clones contenía la secuencia codificadora de longitud completa, se analizó una segunda
biblioteca de ADNc. La biblioteca usada en este análisis fue una biblioteca de ADNc cebada con oligo(dT) y con
cebado aleatorio en un fago Lambda (Lambda gt10) que se basaba en el ARNm de embriones de ratones de 15 días
de edad (biblioteca de ADNc lambda gt10 cebado con oligo(dT)) y cebado aleatorio, Clontech, Palo Alto, CA; Nº de
cat. ML 3002a). Se usó como sonda un fragmento(AvaI/AatII) de ADN marcado radiactivamente del extremo 5’ del
clon más largo del primer análisis y se analizaron aproximadamente 2 x 106 placas. Este análisis dio lugar a 14 clones
positivos. Los fragmentos de ADN se escindieron con EcoRI y se clonaron en el vector Bluescript(KS(+); Stratagene).
El análisis de la secuencia se realizó como se ha descrito anteriormente.
De esta manera, se obtuvo la secuencia de nucleótidos del compuesto de la fórmula II sobre los ADNc de longitud
completa de 2361 y 2376 pares de bases, respectivamente. Con el procedimiento descrito de clonación de PCR es
5
ES 2 251 077 T3
posible encontrar y aislar también formas variantes de los compuestos de las fórmulas I o II, como por ejemplo sus
variantes alélicas y de ayuste. El procedimiento descrito de análisis de una biblioteca de ADNc permite también la
detección y aislamiento de compuestos que hibridan en condiciones estrictas con las secuencias codificadoras de los
compuestos de las fórmulas I o II.
5
Clonación del ADNc del compuesto de la fórmula I (neurotripsina de humanos)
10
La clonación del ADNc del compuesto de la fórmula I se realizó en base a la secuencia de nucleótidos del compuesto de la fórmula II. Como primera etapa, se amplificó un fragmento del compuesto de la fórmula I usando la
reacción en cadena de la polimerasa (PCR). Como matriz usamos el ADN obtenido de una biblioteca de ADNc del
cerebro de un feto humano (17ª-18ª semana de gestación) que está disponible en el mercado (biblioteca de ADNc
del cerebro de feto humano cebado con Oligo(dT) y de forma aleatoria en el vector Lambda ZAP II, Nº de catálogo
936206, Stratagene). Los cebadores de PCR sintéticos contenían sitios de restricción para HindIII y XhoI en el extremo
5’ para facilitar la clonación posterior.
15
En la dirección de lectura (cebadores sentido):
5’-GGGAAGCTTGGICA(A/G)TGGGGIACI(A/G)TITG(C/T)GA(C/T)-3’
20
En la dirección contraria (cebadores antisentido):
5’-GGGCTCGAGCCCCAICCTGTTATGTAAIAGTTG-3’
25
30
La PCR se realizó en condiciones convencionales usando la ADN polimerasa AmpliTaq (Perkin Elmer) según las
recomendaciones del fabricante. El fragmento resultante de 1116 pares de bases se insertó en el vector Bluescript
(Bluescript SK(-), Stratagene). Se usó un fragmento HindIII/StuI de 600 pares de bases de longitud, correspondiente
con la mitad 5’ del fragmento de PCR de 1116 pares de bases de longitud, para el análisis de una biblioteca de ADNc
Lambda de cerebro fetal humano (biblioteca de ADNc de cerebro fetal humano 5’-STRETCH PLUS; Lambda gt10;
Nº de cat. HL 3003a; Clontech). Se analizaron 2 x 106 placas de Lambda en condiciones muy estrictas (Sambrook y
col., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 1989) mediante un fragmento
de PCR marcado radiactivamente y se encontraron y aislaron 23 clones positivos.
35
A partir de los clones Lambda gt10 positivos, se cortaron los fragmentos de ADNc correspondientes con EcoRI y
se insertaron en un vector Bluescript (Bluescript KS(+), Stratagene). La secuenciación se realizó mediante el procedimiento de terminación de cadena dideoxi (Sanger y col. Proc. Natl. Acad. Sci. USA 77, páginas 2163-2167, 1977),
usando un kit de secuenciación comercial (kit-LC de secuenciación de ciclo de lectura larga SequiTerm; Epicentre
Technologies, Madison, WI) y cebadores específicas de Bluescript.
40
En una estrategia de secuenciación alternativa, los fragmentos de ADNc de los clones Lambda gt10 positivos
se amplificaron por PCR usando cebadores específicos de Lambda. La secuenciación se realizó como se describe
anteriormente.
El análisis por ordenador de las secuencias se realizó mediante el paquete de programación GCG (versión 8.1,
Unix; Silicon Graphics Inc.).
45
50
De esta forma se obtuvo la secuencia de nucleótidos sobre la longitud completa del ADNc de 3350 pares de bases.
Con el procedimiento descrito para la clonación por PCR es posible encontrar y aislar también formas variantes de los
compuestos de las fórmulas I o II, como por ejemplo sus variantes alélicas o de ayuste. El procedimiento descrito para
el análisis de una biblioteca de ADNc también permite la descripción y el aislamiento de compuestos que hibridan en
condiciones estrictas con las secuencias codificadoras de los compuestos de las fórmulas I o II.
Visualización de las secuencias codificadas de los compuestos de las fórmulas I o II mediante anticuerpos
55
El segmento básico rico en prolina de más de 60 aminoácidos de longitud del extremo amino terminal de la
secuencia codificada de los componentes de las fórmulas I o II es muy adecuado para la producción de anticuerpos
mediante la síntesis de péptidos y su uso para inmunización. Hemos seleccionado dos secuencias peptídicas con
una longitud de 19 y 13 aminoácidos a partir del segmento básico rico en prolina en el extremo amino terminal de la
secuencia codificada del compuesto de fórmula II para la generación de anticuerpos. Los péptidos tienen las secuencias
siguientes:
60
Péptido 1:
H2 N-SRS PLH RPH PSP PRS QX-CONH2
65
Péptido 2:
H2 N-LPS SRR PPR TPR F-COOH
6
ES 2 251 077 T3
5
10
Los dos péptidos se sintetizaron químicamente, se conjugaron con un vehículo macromolecular (hemocianina de
lapa bocallave) y se inyectaron 2 conejos para su inmunización. Los antisueros resultantes muestran un alto valor de
anticuerpo y puede usarse sucesivamente tanto para la identificación de la neurotripsina nativa en extracto de cerebro
de ratón como para la identificación de neurotripsina recombinante. También puede usarse el procedimiento empleado
para la generación de anticuerpos para la generación de anticuerpos contra la secuencia codificada del compuesto de
la fórmula I.
Los anticuerpos resultantes contra las secuencias parciales de las secuencias codificadas de los compuestos de las
fórmulas I o II pueden usarse para la detección y el aislamiento de formas variantes de los compuestos de las fórmulas
I o II, como por ejemplo variantes alélicas o de ayuste. Estos anticuerpos también pueden usarse para la detección y
aislamiento de variantes génicas generadas tecnológicamente de los compuestos de las fórmulas I o II.
Purificación de las secuencias codificadas de los compuestos de las fórmulas I o II
15
20
25
Además de los procedimientos cromatográficos convencionales, como por ejemplo cromatografía de intercambio
iónico, también puede conseguirse la purificación de las secuencias codificadas de los compuestos de las fórmulas I
o II usando dos procedimientos de purificación por cromatografía de afinidad. Un procedimiento de purificación por
afinidad cromatográfica está basado en la disponibilidad de los anticuerpos. Uniendo los anticuerpos a una matriz
cromatográfica se obtiene un procedimiento de purificación con el que se puede alcanzar un grado muy alto de pureza
del compuesto correspondiente en una sola etapa.
Otra característica importante que puede usarse para la purificación de secuencias codificadas de los compuestos
de las fórmulas I o II es el segmento básico rico en prolina del extremo amino terminal. Puede esperarse que, debido a
la alta densidad de cargas positivas, este segmento medie en la unión de las secuencias codificadas de los compuestos
de las fórmulas I o II a matrices de afinidad de heparina y similares a heparina. Este principio también permite el
aislamiento, o al menos el enriquecimiento, de formas variantes de las secuencias codificadas de los compuestos de
las fórmulas I o II, así como por ejemplo sus variantes alélica o de ayuste. Así mismo, puede usarse la cromatografía
de afinidad en heparina para el aislamiento, o al menos el enriquecimiento de proteínas homólogas de especie de los
compuestos de las fórmulas I o II.
30
Aplicabilidad industrial
35
40
Las secuencias codificadas de los compuestos de las fórmulas I o II pueden usarse para la producción de las
proteínas codificadas, o parte de éstas, de las fórmulas I o II. La producción de las proteínas codificadas puede lograrse
en sistemas de expresión procarióticos y eucarióticos.
El patrón de expresión génica de los compuestos de la invención en el cerebro es sumamente interesante ya que
estas moléculas se expresan en el sistema nervioso adulto predominantemente en neuronas de regiones que se piensa
tienen un importante papel en las funciones de aprendizaje y memoria. Junto con las recientes evidencias encontradas
de un papel de las proteasas extracelulares en la plasticidad neuronal, el patrón de expresión permite suponer que la
actividad proteolítica de la neurotripsina tiene un papel en reorganizaciones estructurales en conexión con operaciones
de aprendizaje y memoria, por ejemplo operaciones que están implicadas en el procesamiento y almacenamiento
de comportamientos aprendidos, emociones aprendidas o contenidos de memoria. Los compuestos de la invención
pueden, de este modo, representar una diana para la intervención farmacéutica en disfunciones del cerebro.
45
El patrón de expresión génica de los compuestos de la invención en la corteza cerebral (especialmente en las capas
V y VI) es sumamente interesante, ya que se ha encontrado que una reducción de la diferenciación celular de la corteza
cerebral está asociada con la esquizofrenia. Los compuestos de la invención pueden, de ese modo, ser diana para la
intervención farmacéutica en la esquizofrenia y enfermedades psiquiátricas relacionadas.
50
55
Se ha encontrado que las secuencias codificadoras de los compuestos de la invención están aumentadas en las
neuronas localizadas adyacentes a los tejidos dañados por un accidente cerebrovascular isquémico focal, lo que indica
que los compuestos de la invención tienen un papel en la reacción tisular del tejido cerebral dañado. Los compuestos de la invención pueden, de ese modo, representar una diana para la intervención farmacéutica tras un accidente
cerebrovascular isquémico y otras formas de daño tisular neuronal.
60
Se ha encontrado recientemente que el activador del plasminógeno de tipo tisular, una serina proteasa relacionada
con los compuestos de la invención, está implicado en la muerte celular neuronal mediada por excitotoxicidad. Puede
imaginarse una función similar para los compuestos de la invención y, de ese modo, los compuestos de la invención
representan una posible diana para una intervención farmacéutica en enfermedades en las que se da muerte celular.
65
Es interesante el patrón de expresión génica de los compuestos de la invención en la médula espinal y en los
ganglios sensoriales, ya que estas moléculas se expresan en el sistema nervioso adulto en las neuronas de regiones
cerebrales que se piensa tienen un papel en el procesamiento del dolor, así como en la patogénesis del dolor patológico.
Los compuestos de la invención pueden, de ese modo, ser diana de intervención farmacéutica en el dolor patológico.
A continuación se recogen las características de los compuestos de las fórmulas I o II.
7
ES 2 251 077 T3
(1) Información sobre el compuesto de la Fórmula I (Neurotripsina de humanos)
(i) CARACTERÍSTICAS DE LA SECUENCIA:
5
(A) LONGITUD: 3350 pares de bases
(B) TIPO: ácido nucleico
(C) TIPO DE CADENA: cadena sencilla
10
(D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc del ARNm
15
(vi) FUENTE ORIGINAL:
(A) ORGANISMO: Homo sapiens
(D) FASE DE DESARROLLO: fetal
20
(F) TIPO DE TEJIDO: cerebro
(vii) FUENTE INMEDIATA:
25
(A) BIBLIOTECA: extensión 5’ del cerebro fetal humano más biblioteca de ADNc en el vector lambda gt10; Nº. cat.: HL 3003a, Clontech, Palo Alto, CA, USA
(B) CLONES: Clones de ADNc Nº: 3-1, 3-2, 3-6, 3-7, 3-8, 3-10, 3-11, 3-12
30
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido señal
(B) LOCALIZACIÓN: 44..103
35
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido maduro
40
(B) LOCALIZACIÓN: 104..2668
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: secuencia codificadora
45
(B) LOCALIZACIÓN: 44..2668
(ix) CARACTERÍSTICA:
50
(A) NOMBRE/CLAVE: segmento básico, rico en prolina
(B) LOCALIZACIÓN 104..319
(ix) CARACTERÍSTICA:
55
(A) NOMBRE/CLAVE: dominio Kringle
(B) LOCALIZACIÓN 320..538
60
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio SRCR 1
(B) LOCALIZACIÓN: 551..856
65
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio SRCR 2
8
ES 2 251 077 T3
(B) LOCALIZACIÓN: 881..1186
(ix) CARACTERÍSTICA:
5
(A) NOMBRE/CLAVE: dominio SRCR 3
(B) LOCALIZACIÓN: 1202..1504
(ix) CARACTERÍSTICA:
10
(A) NOMBRE/CLAVE: dominio SRCR 4
(B) LOCALIZACIÓN: 1541..1846
15
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio proteolítico 1
(B) LOCALIZACIÓN: 1898..2668
20
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: histidina de la triada catalítica
25
(B) LOCALIZACIÓN: 2069-2071
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: ácido aspártico de la triada catalítica
30
(B) LOCALIZACIÓN: 2219-2221
(ix) CARACTERÍSTICA:
35
(A) NOMBRE/CLAVE: serina de la triada catalítica
(B) LOCALIZACIÓN: 2516..2518
(ix) CARACTERÍSTICA:
40
(A) NOMBRE/CLAVE: señal poliA
(B) LOCALIZACIÓN: 2873..2878
45
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: señal poliA
(B) LOCALIZACIÓN: 3034..3039
50
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: señal poliA
55
(B) LOCALIZACIÓN: 3215..3220
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: 3’ UTR
60
(B) LOCALIZACIÓN: 2669..3350
(ix) CARACTERÍSTICA:
65
(A) NOMBRE/CLAVE: 5’ UTR
(B) LOCALIZACIÓN: 1..43
9
ES 2 251 077 T3
Compuesto de la fórmula I (neurotripsina de humano)
5
10
15
20
25
30
35
40
45
50
55
60
65
10
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
11
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
12
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
13
ES 2 251 077 T3
5
10
15
20
25
(1) Información sobre el compuesto de la Fórmula II (Neurotripsina de ratón)
(i) CARACTERÍSTICAS DE LA SECUENCIA:
(A) LONGITUD: 2376 pares de bases
30
(B) TIPO: ácido nucleico
(C) TIPO DE CADENA: cadena sencilla
35
(D) TOPOLOGÍA: lineal
(ii) TIPO DE MOLÉCULA: ADNc del ARNm
(vi) FUENTE ORIGINAL:
40
(A) ORGANISMO: Mus musculus
(D) FASE DE DESARROLLO: día 10 tras el nacimiento
45
(F) TIPO DE TEJIDO: cerebro
(G) TIPO CELULAR: neuronas
(vii) FUENTE INMEDIATA:
50
55
(A) BIBLIOTECA: biblioteca de ADNc de cerebro de ratón en el vector lambda Uni-ZAP-XR, cebado con olig(dT) de ratones Balb/c, 20 días tras el nacimiento; Nº. cat.: 937 319; Stratagene, La
Jolla, CA, USA
(B) CLON: Clon de ADNc Nº 16
(vii) FUENTE INMEDIATA:
60
(A) BIBLIOTECA: biblioteca de ADNc de cerebro de ratón en el vector lambda gt10, cebado con
olig(dT) y cebado aleatorio, de embrión de 15 días; Nº. cat.: ML 3002a; Clontech, Palo Alto, CA,
USA
(B) CLON: Clon de ADNc Nº 25
65
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido señal
14
ES 2 251 077 T3
(B) LOCALIZACIÓN: 24..86
(ix) CARACTERÍSTICA:
5
(A) NOMBRE/CLAVE: péptido maduro
(B) LOCALIZACIÓN: 87..2306
(ix) CARACTERÍSTICA:
10
(A) NOMBRE/CLAVE: secuencia codificadora
(B) LOCALIZACIÓN: 24..2306
15
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: segmento básico, rico en prolina
(B) LOCALIZACIÓN 90..275
20
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio Kringle
25
(B) LOCALIZACIÓN 276..494
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio SRCR 1
30
(B) LOCALIZACIÓN: 519..824
(ix) CARACTERÍSTICA:
35
(A) NOMBRE/CLAVE: dominio SRCR 2
(B) LOCALIZACIÓN: 840..1142
(ix) CARACTERÍSTICA:
40
(A) NOMBRE/CLAVE: dominio SRCR 3
(B) LOCALIZACIÓN: 1179..1484
45
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: dominio proteolítico
(B) LOCALIZACIÓN: 1536..2306
50
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: histidina de la triada catalítica
55
(B) LOCALIZACIÓN: 1707..1709
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: ácido aspártico de la triada catalítica
60
(B) LOCALIZACIÓN: 1857..1859
(ix) CARACTERÍSTICA:
65
(A) NOMBRE/CLAVE: serina de la triada catalítica
(B) LOCALIZACIÓN: 2154..2156
15
ES 2 251 077 T3
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: señal poliA
5
(B) LOCALIZACIÓN: 2324..2329 y 2331..2336
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: segmento poliA
10
(B) LOCALIZACIÓN: 2357..2376
(ix) CARACTERÍSTICA:
15
(A) NOMBRE/CLAVE: 3’ UTR
(B) LOCALIZACIÓN: 2307..2341 ó 2307..2356
(ix) CARACTERÍSTICA:
20
(A) NOMBRE/CLAVE: 5’ UTR
(B) LOCALIZACIÓN: 1..23
25
30
35
40
45
50
55
60
65
16
ES 2 251 077 T3
Compuesto de la fórmula II (neurotripsina de ratón)
5
10
15
20
25
30
35
40
45
50
55
60
65
17
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
18
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
19
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
20
ES 2 251 077 T3
REIVINDICACIONES
1. Neurotripsinas de las fórmulas I o II
5
I: neurotripsina de humanos
II: neurotripsina de ratón.
10
2. Secuencias de nucleótidos que codifican las neurotripsinas según la reivindicación 1, caracterizadas porque
comprenden las secuencias de nucleótidos que codifican los compuestos de las fórmulas I o II.
3. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la producción
de proteínas recombinantes.
15
4. Uso de proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II como
dianas para el desarrollo de medicamentos, por ejemplo para la inhibición de la potenciación de la actividad catalítica
de las proteínas codificadas de las fórmulas I o II.
20
25
5. Uso de las proteínas con las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o
II para la determinación de la estructura espacial, por ejemplo la determinación de la estructura espacial mediante
cristalografía o espectroscopia de resonancia magnética nuclear (RMN).
6. Uso de las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II para predecir la
estructura de la proteína mediante procedimientos de predicción de estructura de proteínas por ordenador.
7. Uso de las secuencias de aminoácidos codificadas de los compuestos de las fórmulas I o II como antígenos
para la producción de anticuerpos, como por ejemplo anticuerpos que inhiben o promueven la función proteasa o
anticuerpos que pueden usarse para estudios inmunohistoquímicos.
30
8. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la producción
de animales transgénicos no humanos, como por ejemplo ratones transgénicos.
35
9. Uso de las secuencias de nucleótidos codificadoras de los compuestos de las fórmulas I o II para la inactivación
o mutación del gene correspondiente mediante técnicas de reconocimiento génico, como por ejemplo, la eliminación
del gen en el ratón mediante de recombinación homóloga.
40
45
50
55
60
65
21
ES 2 251 077 T3
LISTA DE SECUENCIAS
(1) INFORMACIÓN GENERAL:
5
(i) SOLICITANTE:
(A) NOMBRE: Peter Sonderegger
(B) CALLE: Winterthurerstr. 190
10
(C) CIUDAD: Zurich
(E) PAÍS: Suiza
(F) CÓDIGO POSTAL: CH-8057
(G) TELÉFONO: +41 1 635 55 41
15
(H) TELEFAX: +41 1 635 68 31
(ii) TÍTULO DE LA INVENCIÓN: Neurotripsina
(iii) NÚMERO DE SECUENCIAS: 4
20
(iv) FORMATO LEGIBLE POR ORDENADOR:
(A) TIPO DE MEDIO: Disquete
(B) ORDENADOR: IBM PC compatible
25
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release Nº 1.0, Versión Nº 1.30 (EPO)
(vi) DATOS DE LA SOLICITUD ANTERIOR:
30
(A) NÚMERO DE SOLICITUD: CH 1997 0966/97
(B) FECHA DE PRESENTACIÓN: 26-abril-1997
(2) INFORMACIÓN PARA LA ID SEC Nº 1:
35
(i) CARACTERÍSTICAS DE LA SECUENCIA:
(A) LONGITUD: 3350 pares de bases
(B) TIPO: ácido nucleico
40
(C) TIPO DE CADENA: cadena sencilla
(D) TOPOLOGÍA: Lineal
(ii) TIPO DE MOLÉCULA: ADNc del ARNm
45
(iii) HIPOTÉTICA: NO
(iv) ANTISENTIDO: NO
(vi) FUENTE ORIGINAL:
50
(A) ORGANISMO: Homo sapiens
(D) FASE DE DESARROLLO: fetal
(F) TIPO DE TEJIDO: cerebro
55
(vii) FUENTE INMEDIATA:
(A) BIBLIOTECA: biblioteca de ADNc; Nº. cat.: HL 3003a, Clontech, Palo Alto, CA, USA
(B) CLONES: 3-1, 3-2, 3-6, 3-7, 3-8, 3-10, 3-11, 3-12
60
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido_señal
(B) LOCALIZACIÓN: 44..103
65
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido_mad
(B) LOCALIZACIÓN: 104..2668
1
ES 2 251 077 T3
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: CDS
(B) LOCALIZACIÓN: 44..2668
5
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: 5’ UTR
(B) LOCALIZACIÓN: 1..43
10
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: 3’ UTR
(B) LOCALIZACIÓN: 2669..3350
15
(xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 1:
20
25
30
35
40
45
50
55
60
65
2
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
3
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
4
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
5
ES 2 251 077 T3
(2) INFORMACIÓN PARA LA ID SEC Nº 2:
(i) CARACTERÍSTICAS DE LA SECUENCIA:
5
(A) LONGITUD: 875 aminoácidos
(B) TIPO: aminoácido
(D) TOPOLOGÍA: lineal
10
(ii) TIPO DE MOLÉCULA: proteína
(xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 2:
15
20
25
30
35
40
45
50
55
60
65
6
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
7
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
(2) INFORMACIÓN PARA LA ID SEC Nº 3:
(i) CARACTERÍSTICAS DE LA SECUENCIA:
(A) LONGITUD: 2356 pares de bases
60
(B) TIPO: ácido nucleico
(C) TIPO DE CADENA: cadena sencilla
(D) TOPOLOGÍA: lineal
65
(ii) TIPO DE MOLÉCULA: ADNc del ARNm
(iii) HIPOTÉTICA: NO
8
ES 2 251 077 T3
(iv) ANTISENTIDO: NO
(vi) FUENTE ORIGINAL:
5
(A) ORGANISMO: Mus musculus
(B) CEPA: ICR-ZUR
(D) FASE DE DESARROLLO: día 10 tras el nacimiento
(F) TIPO DE TEJIDO: cerebro
10
(G) TIPO CELULAR: neuronas
(vii) FUENTE INMEDIATA:
(A) BIBLIOTECA: biblioteca de ADNc; Nº. cat.: ML 3002a, Clontech, Palo Alto, CA, USA
15
(B) CLON: clon de ADNc Nº 25
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido_señal
20
(B) LOCALIZACIÓN: 24..86
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: péptido_mad
25
(B) LOCALIZACIÓN: 87..2306
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: CDS
30
(B) LOCALIZACIÓN: 24..2306
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: sitio_poliA
35
(B) LOCALIZACIÓN: uno de (2341, 2356)
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: 5’ UTR
(B) LOCALIZACIÓN: 1..23
40
(ix) CARACTERÍSTICA:
(A) NOMBRE/CLAVE: 3’ UTR
(B) LOCALIZACIÓN: 2307..uno de (2341, 2356)
45
(xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 3:
50
55
60
65
9
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
10
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
11
ES 2 251 077 T3
5
10
15
20
25
30
35
40
(2) INFORMACIÓN PARA LA ID SEC Nº 4:
45
(i) CARACTERÍSTICAS DE LA SECUENCIA:
(A) LONGITUD: 761 aminoácidos
(B) TIPO: aminoácido
(D) TOPOLOGÍA: lineal
50
(ii) TIPO DE MOLÉCULA: proteína
(xi) DESCRIPCIÓN DE LA SECUENCIA: ID SEC Nº 4:
55
60
65
12
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
13
ES 2 251 077 T3
5
10
15
20
25
30
35
40
45
50
55
60
65
14