Download Instrucciones para la preparación de Ponencias para Informática 2009

Document related concepts

ARN interferente wikipedia , lookup

SiRNA wikipedia , lookup

Empalme alternativo wikipedia , lookup

Pseudogén wikipedia , lookup

ARNs asociados a Piwi wikipedia , lookup

Transcript
SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN
PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ANÁLISIS DE
SECUENCIAS DE ARN MENSAJERO
COMPUTER SYSTEM FOR THE DESIGN OF SMALL INTERFERENCE RNA BY THE
ANALISYS OF MESSENGER RNA SEQUENCES
Vladir Antonio Parrado Cruz1, Edecio Ramón Rodríguez Batista2, Roberto Duniel Rivero Soto3,
Alexander Tornet4, Ricardo Bringas Pérez5
1, 2, 3 Universidad de las Ciencias Informáticas, Cuba, [email protected] , [email protected] , [email protected] Ctra San
Antonio km 21/2 La Lisa, Ciudad Habana
4, 5 Centro de Ingeniería Genética y Biotecnología, Cuba, [email protected], [email protected]
RESUMEN
trascrito de un gen. Se tiene en cuenta para el aná-
El uso de los ARN pequeños de interferen-
lisis la variabilidad genética entre individuos a través
cia (siRNA por sus siglas en Inglés) para el silen-
de los Polimorfismos de Nucleótidos Simples (SNP
ciamiento de genes, se perfila como una poderosa
por sus siglas en inglés). Se trabaja con información
herramienta terapéutica para combatir enfermeda-
almacenada en bases de datos y ficheros para ha-
des no solo en humanos, sino también en otros
cer la búsqueda lo más eficiente posible. Garantiza
organismos. Un componente fundamental de esta
la portabilidad de la aplicación desarrollada bajo
tecnología lo constituyen las herramientas informáti-
ambientes multiplataforma, fundamentalmente con
cas para el diseño de los siRNA. En internet existen
herramientas de software libre.
aplicaciones webs que permiten realizar este diseño, pero la seguridad de los resultados que se
desean obtener y los algoritmos que implementan
son aún requerimientos indispensables. Se presenta
un sistema que permite realizar diseños de siRNA
en dos variantes: conocida la secuencia de mRNA o
ensamblando la misma a partir de la información del
genoma humano. Además brinda información de
datos de genes, transcritos y la representación gráfica de dichos datos y de los sitios blancos encontrados en la secuencia. Los sitios blancos pueden
buscarse en secuencias comunes a todos los transcritos de un gen y en secuencias específicas a un
“VIII Congreso Internacional de Informática en la Salud”.
1
Palabras Clave: ARN de interferencia, genes,
miRNA, SNP, siRNA.
ABSTRACT
The use of small interference RNA (siRNA) is
portrayed as a powerful therapeutic tool to fight diseases in humans and economically valued species.
An important component of the siRNA development
is the design software. For that aim there are many
publicly available web applications out there on the
Internet, but still the exact knowledge of the search
algorithms employed and the confidentiality over the
queries and their results remain as concerns. Here a
system is presented that allows to design siRNA in
two different ways: either from the mRNA secuence
or from well known genetic identifiers from the human genome. The system complements its func-
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
tionality giving information of the genes, transcripts,
the graphic representation of that data and of the
target sites found in the sequence. The target sites
can be looked for in sequences common to all transcripts of a gene or in sequences specific to a transcript of a gene. The target sites can display the
Single Nucleotide Polymorphism (SNP) points or the
former can be excluded from the analysis in the
basis of containing such points. We work with information stored in data bases and disk-files to make
the search as efficient as possible. The systems has
been developed using free software tools and with
portability and multi-platform deploy in mind.
KeyWords: Small interference RNA, genes, miRNA, SNP, siRNA, .
1. INTRODUCCIÓN
Las secuencias genómicas contienen la información necesaria para llevar a cabo la síntesis de proteínas y de moléculas de RNA, responsables de las
características estructurales y funcionales de un
organismo. Las cadenas de Ácido Desoxirribonucleico (DNA por sus siglas en inglés) contenidas en
los cromosomas son las portadoras de esta información. En el DNA de los cromosomas se encuentran los genes, que son segmentos que contienen la
información necesaria para la síntesis de otras moléculas.
Mecanismos bioquímicos en el núcleo celular seleccionan y transcriben parte de la información en
un gen formando una copia de su mensaje en moléculas de mRNA, proceso que se conoce como
transcripción del DNA. Las moléculas de mRNA son
utilizadas entonces para la síntesis de la proteína
correspondiente en los ribozomas (traducción).
El mensaje genético se transmite en dos etapas
sucesivas, en las que el RNA es un intermediario
imprescindible. Existen mecanismos de regulación
en todas las etapas de la transcripción y la traducción. Algunos de esos mecanismos de regulación
pueden interferir a nivel del RNA el proceso de traducción a cadenas de aminoácidos.
Existe una maquinaria celular que a partir de
RNAs de cadena corta inhibe el efecto de cadenas
de mRNA complementarios. Más específicamente,
los RNAs de cadena corta son interceptados por un
mecanismo que incluye la acción de la endonucleasa Dicer y del Complejo Silenciador Inducido por
RNA (RISC por sus siglas en inglés) [1], para bloquear la traducción del mRNA. Se conocen de genes [2] que codifican secuencias de RNA (miRNA)
que activan el mecanismo de interferencia.
En 1998 Andrew Fire y Craig Mello [3], descubrieron que se podía activar el efecto de interferen“VIII Congreso Internacional de Informática en la Salud”.
2
cia inyectando RNA de doble cadena (dsRNA por
sus siglas en inglés) con algunas decenas de nucleótidos en la célula. A estos dsRNA se les denominó “RNAs pequeños de interferencia” o siRNA. Lo
importante de este descubrimiento es que se podían utilizar secuencias complementarias a genes
“legítimos” en la célula, y que entonces el mecanismo de interferencia no solo bloquearía la expresión
de los dsRNA inyectados, sino también la de los
genes del organismo seleccionados por los investigadores.
El mecanismo de silenciamiento génico a través
de RNA, puede activarse generalmente por dos
vías: cuando se expresa un miRNA o por la aparición de dsRNA.
El dsRNA puede proceder de virus, transposones (y el sistema actúa como defensa) o por inyecciones artificiales realizadas por investigadores.Hoy
se sabe que este mecanismo está conservado en la
mayor parte de los organismos con células eucariotas1.
Esta técnica de silenciamiento de genes mediante los siRNAs se perfila como una poderosa herramienta terapéutica, por lo que puede ser utilizado
como una forma de terapia génica: si cierta enfermedad es el efecto del aumento en la expresión de
un gen específico y se conoce su identidad, se podría “apagar” su expresión por medio de inyecciones de dsRNA. En estudios más profundos [4] se
dedujo, que la creación de forma artificial de un
siRNA sería una herramienta experimental para
combatir y buscar soluciones a problemas de enfermedades en animales, plantas y el genoma humano.
Actualmente, existe un gran número de científicos y
especialistas que realizan estudios sobre el diseño
de siRNA y su aplicación en el silenciamiento de
genes. Algunas de las aplicaciones desarrolladas
para el diseño de siRNA son: siRNA Target Finder[5, 6], siRNA Design Software [7, 8], Dharmacon
siDESIGN Center [9], DEQOR [10, 11], IDT´Scitools
RNAi Design [12], GenScript siRNA Target Finder
[13], siDirect [14, 15], siRNA Wizard v3.1 [16],
BIOPREDsi [17], Invitrogen [18]. Todas estas aplicaciones fueron revisadas. Es importante mencionar que las aplicaciones más avanzadas son comerciales o de la propiedad de compañías privadas.
Estas aplicaciones requieren el uso de internet y
por lo tanto es necesario introducir en ellas la secuencia o los identificadores de los genes que se
desea silenciar. En algunas investigaciones no es
conveniente divulgar esta información, por lo que
1 (mirbase, 2010) incluye especies de animales desde hidras y poríferos hasta homo sapiens por el dominio
de los animales, y desde las clorofitas en el clado viriplantae.
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
muchas empresas o grupo de investigación prefieren usar localmente este tipo de aplicación. El poseer un desarrollo propio tiene también la ventaja de
poder incorporar nuevas ideas y algoritmos que se
deriven del proceso investigativo. Además se conoce con exactitud lo que se implementa y cómo se
hace.
Se ha implementado una herramienta informática
con tecnología ciente-servidor propia y con interfaz
web que permite a los especialistas realizar sus
estudios sobre este tema.
2. METODOLOGÍA
Se diseñó, implementó y validó un sistema informático para el diseño de siRNA. Este sistema
está compuesto por dos subsistemas: un servidor
(siRNA Web Services) y un cliente (alasSiRNADesign). siRNA Web Services es un servicio web
que brinda una serie de funciones relacionadas con
la información que se necesita de la base de datos y
la implementación de los principales algoritmos, que
se describen en el siguiente acápite. alasSiRNADesign es un cliente web que utiliza los servicios del
servidor para consultar y mostrar las peticiones de
los usuarios. Ambos fueron implementados en java.
La metodología de desarrollo de software utilizada para la construcción del sistema fue OpenUp,
una metodología ágil que genera menos artefactos
y documentación que RUP, pero que contempla los
elementos indispensables de la Ingeniería de Software. Se realizan por tanto todos los artefactos de
las fases de OpenUp tanto para siRNA Web Services como para alasSiRNA-Design.
• Obtención de los sitios blancos comunes a todos los transcritos de un gen
• Obtención de los sitios blancos específicos a
un transcrito de un gen
3.1.1. ALGORITMO PARA ENSAMBLAJE
DE LA SECUENCIA DE ARN MENSAJERO
El algoritmo parte de la búsqueda de la información
de un gen o de un transcrito. Posteriormente se
buscan los exones correspondientes a dicho transcrito (los transcritos también tienen intrones, pero
estos no forman la secuencia, sino que se quedan
dentro del núcleo celular y son eliminados del
mRNA resultante por procesos de “splicing”) y con
las posiciones iniciales y finales de cada transcrito y
teniendo en cuenta el cromosoma, se busca la secuencia en el fichero del cromosoma correspondiente. A medida que se van teniendo las secuencias de cada uno de los exones, se van concatenando para finalmente obtener la secuencia de
mRNA. En el caso en que la orientación de la secuencia del exón sea negativa hay que invertir la
secuencia, pues la secuencia de mRNA debe quedar orientada positivamente (de 5’ a 3’). Aquí se
modela computacionalmente lo que sería el proceso
de “splicing” a nivel celular, obteniéndose una secuencia de nucleótidos. En la figura siguiente se
muestra el proceso antes descrito:
3. RESULTADOS Y DISCUSIÓN
3.1. DISEÑO DE ALGORITMOS
Se cuenta con una base de datos en un gestor
(PostgreSQL) y además 24 ficheros que contienen
los cromosomas pertenecientes a la especie humana. Cada organismo tiene 23 pares de cromosomas, pero son 24 ficheros porque el par 23 está
definido por los cromosomas “Y” y ”X”, dependiendo
del sexo. Con la referencia en la base de datos a
estos ficheros se localizan las secuencias en los
mismos.
El diseño de la base de datos es el punto de partida para que se puedan diseñar los algoritmos de
interés. A continuación se describe el diseño de los
principales algoritmos:
• Ensamblaje de secuencia de ARN mensajero
• Análisis de la secuencia ARN mensajero para
obtención de sitios blancos
• Obtención de los sitios blancos teniendo en
cuenta los SNP
“VIII Congreso Internacional de Informática en la Salud”.
3
Fig. 1: Proceso de ensamblaje de la secuencia de
mRNA, donde se observa que está constituida por la
concatenación de todos los exones, en este caso, de
un transcrito de un gen. Elaboración propia.
3.1.2. ALGORITMO PARA ANALIZAR LA
SECUENCIA MRNA Y OBTENER LOS SITIOS BLANCOS
Una vez obtenida la secuencia de mRNA, el análisis
de la misma parte de un grupo de reglas que deben
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
cumplir los sitios blancos. El algoritmo propuesto
por Reynolds, realiza una sumatoria de las reglas
que cumple el sitio blanco y selecciona aquellos que
tengan al menos una puntuación de seis [19]. A
diferencia de este algoritmo el especialista puede
seleccionar, a su necesidad, las reglas que considera deben cumplir los siRNA a diseñar. Tiene además la posibilidad de seleccionar el porciento de
cumplimiento de las reglas con que se cuenta y
cuántas reglas desea que se cumplan como mínimo. De esta forma la flexibilidad aumenta.
En células eucariotas los dsRNAs de longitud de
más de 30 nucleótidos pueden disparar el mecanismo de interferón que el organismo utiliza para
contrarrestar afectaciones por microbios (tales como virus y bacterias). Se provoca prácticamente
una eliminación global de la síntesis de proteína en
la célula [20].
Los siRNAs son también dsRNAs, solo que está
demostrado que estos tienen la longitud suficiente
(21-22 nt) para suprimir la expresión de un gen específico y lo suficientemente corto como para no
activar el mecanismo de interferón [21].
El algoritmo selecciona sitios blancos de 21 nucleótidos, iterando por toda la secuencia de mRNA.
Verifica las reglas y las opciones seleccionadas
para cada secuencia de 21nt. Cuando obtiene un
sitio que cumpla con todas las condiciones, es almacenado y posteriormente mostrado al usuario
que realiza el estudio. El proceso se describe en el
pseudocódigo siguiente:
Algoritmo 1: Ensamble de secuencia
Entrada:
seqMRna lista de nucleótidos
r Opciones dadas por el usuario
r1 comienza con AA
r2 T en la posición 10
r3 A en la posición 3
r4 A en la posición 19
r5 CG entre 30-50%
r6 ausencia de GC en la posición 19
r7 ausencia de G en la posición 13
r8 A/T entre las posiciones 15 y 19
cmr cantidad mínima de reglas
inicio
cantidadGC = 0
para i 0 a 21 hacer
base = seqMRna[i]
si base = ’C’ o base = ’G’ entonces
cantidadGC = cantidadGC + 1
total_puntos = Cantidad de opciones ri activas
puntos = 0
para i 0 a longitud(seqMRna) - 20 hacer
Invocar ChequeosPositivos( r, seqMRna, puntos )
Invocar ChequeoR5(r, seqMRna, puntos, cantidadGC)
Invocar ChequeosNegativos( r, seqMRna, puntos )
Invocar ChequeoR8( r, seqMRna, puntos )
si i + 21 < longitud(seqMRna) entonces
“VIII Congreso Internacional de Informática en la Salud”.
4
sitio_blanco = extraer_nucleotidos( seqMRna, i, i+ 21 )
si puntos >= cmr entonces
adicionar(sitio_blanco)
sino si puntos = total_puntos entonces
adicionar (sitio_blanco)
Excepto una de las reglas las demás son seleccionadas del artículo de Reynolds ([19]), el cuál contiene un estudio detallado y además una validación
estadística que se recomienda al lector. Estas reglas se implementan en al menos un caso en las
herramientas: DEQOR, Dharmacon siDesign Center, GenScript siRNA Target Finder, IDT´s RNAi
Design, siDirect, siRNA design software, Invitrogen,
siRNA target Finder, siRNA Wizard 3.1.
3.1.3. ALGORITMO PARA ANALIZAR LA
SECUENCIA MRNA Y OBTENER LOS SITIOS BLANCOS TENIENDO EN CUENTA
LOS SNP
Un transcrito tiene varios exones. Los exones tienen
posición inicial y final de la secuencia de nucleótidos
en el fichero del cromosoma al que pertenece. Un
SNP tiene la posición en la que se encuentra en
dicho fichero, por lo que en el rango que se encuentra un exón puede haber varios SNP. El algoritmo
realiza varias consultas a la base de datos. La primera busca todos los exones de un transcrito entrado por el usuario. Luego con la posición inicial y
final de cada exón del transcrito, se devuelven todas
las posiciones donde se encuentran los SNP. Se
crea una lista de enteros con la misma cantidad de
elementos que contiene la secuencia de mRNA
(con todos los exones concatenados). Esta lista se
actualiza poniendo un número uno en cada posición
donde se encuentre un SNP y un cero donde no
haya (son dos listas paralelas). De esta forma se
asocian una lista de SNPs con la lista de nucleótidos de la secuencia de mRNA.
Tabla I: Referencia de la secuencia de mRNA con los
SNP
mRNA A
A
U
U
C
G
G
A
SNP
0
0
1
0
0
0
1
0
Luego el especialista puede seleccionar entre dos
opciones:
1. Realizar el análisis en la secuencia de
mRNA y obtener todos los sitios blancos incluyendo los SNP de cada sitio blanco (el
especialista puede ver el sitio blanco en detalles, donde el SNP es marcado).
2. Realizar el análisis eliminando los SNP. Se
excluyen los sitios blancos donde se encuentre al menos un SNP.
En la figura siguiente se muestran los detalles:
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
Fig. 3: Búsqueda de sitios blancos comunes a todos los transcritos de un gen. Elaboración propia.
Fig. 2: Búsqueda de sitios blancos teniendo en
cuenta los SNP. Elaboración propia.
Solo en uno de los sistemas revisados [22] se dice
que tienen en cuenta los SNP para el análisis, pero
se realizaron pruebas que evidencian que esa opción no está disponible en dicho sistema. Se implementó un algoritmo propio con este fin. Se ofrece la
posiblidad de realizar un análisis tanto de una secuencia de mRNA con total ausencia de SNPs (y de
esta forma se garantiza que no se obtengan sitios
blancis que contengan estos puntos de variación) o
dejar los SNPs en la secuencia de mRNA y mostrar
(en caso de existir) el nucleótido que puede variar
en el sitio blanco.
2.1.4. ALGORITMO PARA OBTENER LOS
SITIOS BLANCOS COMUNES A TODOS LOS
TRANSCRITOS DE UN GEN
Con la información de un gen previamente seleccionado, se buscan todos los transcritos del mismo.
Se obtienen todos los exones (posiciones inicial y
final) por cada transcrito. Se itera por cada exón de
cada transcrito, buscando la intersección con los
demás exones de acuerdo a sus posiciones inicial y
final. Se concatenan todas aquellas secuencias que
se interceptan. En el caso donde un exón es “cortado” antes de su posición final o inicial, se concatena
un carácter “|”, para preveer que se identifiquen
sitios blancos que no tengan sentido biológico. Así
se obtiene la secuencia de mRNA perteneciente a
la unión de todos los exones de dichos transcritos, o
sea, es una secuencia coincidente para todos. Luego se aplica el algoritmo de búsqueda de sitios
blancos en esta secuencia. En la figura siguiente se
muestra la gráfica que detalla el proceso:
“VIII Congreso Internacional de Informática en la Salud”.
5
2.1.5. ALGORITMO PARA OBTENER LOS
SITIOS BLANCOS ESPECÍFICOS A UN
TRANSCRITO DE UN GEN
Este algoritmo es la antítesis del algoritmo anterior. Se parte de un gen y se buscan todos los
transcritos de dicho gen, el usuario selecciona el
transcrito para el cual se quiere la secuencia específica. Se obtienen los exones (posiciones inicial y
final) de cada transcrito del gen. Se itera por cada
exón del transcrito seleccionado y se desechan las
partes coincidentes con los demás exones de los
otros transcritos. Se almacena la secuencia que no
coincida con ningún otro exón de otro transcrito. Se
concatenan todas las porciones de secuencias específicas y de esta forma se obtiene la secuencia de
mRNA. Igualmente, se concatena un carácter “|”,
para preveer que se identifiquen sitios blancos que
no tengan sentido biológico. Luego se aplica el algoritmo de búsqueda de sitios blancos en esta secuencia.
En la figura se detalla el proceso:
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
Fig. 4: Búsqueda de sitios blancos específicos a
un transcrito de un gen. Elaboración propia.
2.2. DESARROLLO DEL SISTEMA INFORMÁTICO
El Sistema informático para el diseño de siRNA
está compuesto por dos subsistemas: el servidor
(siRNA Web Services) y el cliente (alasSiRNADesign). siRNA Web Services es un servicio web
(WS por sus siglas en inglés) que brinda una serie
de funciones relacionadas con la información que
se necesita de la base de datos y la implementación
de los principales algoritmos(entre los que se destacan los mencionados anteriormente). alasSiRNADesign es un cliente web que utiliza los servicios del
servidor para consultar y mostrar las peticiones de
los usuarios. Ambos fueron implementados en java.
Las funcionalidades de siRNA Web Services
son:
1. Realizar análisis de las secuencias mRNA.
2. Realizar análisis de las secuencias mRNA
teniendo en cuenta los SNP.
3. Buscar datos de un gen.
4. Buscar datos de un transcrito.
5. Calcular Energía Libre.
6. Ensamblar secuencia común a todos los
transcritos de un gen.
7. Ensamblar secuencia específica de un
transcrito de un gen.
8. Listar SNPs que estén en determinada región del cromosoma.
9. Listar SNPs que coinciden con los miRNAs.
Las funcionalidades de alasSiRNA-Design son:
1. Realizar análisis de las secuencias mRNA.
2. Mostrar datos de un gen.
3. Mostrar datos de un transcrito.
4. Mostrar datos de miRNAs.
5. Mostrar la secuencia común a todos los
transcritos de un gen.
6. Mostrar la secuencia específica de un transcrito de un gen.
Hasta ahora solo se ha utilizado el genoma humano. Se cuenta además con la base de datos que
hace referencia a esta información. El sistema está
concebido para que se puedan almacenar otros
genomas. El diseño del sistema con tecnología
cliente-servidor tiene como objetivo compartir información invirtiendo la menor cantidad de recursos.
Debido a esto la información que utiliza el sistema informático implementado se almacena cen“VIII Congreso Internacional de Informática en la Salud”.
6
tralmente en una base de datos al igual que los
ficheros de los genomas, sin necesidad de duplicar
información. De esta forma puede brindar servicios
haciendo un uso racional de los recursos. Los usuarios solo necesitan de una computadora con un
navegador web y de la red para utilizar el sistema.
El servidor, implementado como WS, brinda servicios a cualquier aplicación cliente que se realice.
Otras aplicaciones que requieran información de
genes, transcritos, exones, secuencias de mRNA,
SNP, miRNA y genes targets de miRNA del genoma
humano también pueden beneficiarse de este servicio.
El alasSiRNA-Design utiliza el servidor, con el
objetivo de ejecutar todas las peticiones que provienen del usuario. Dicho cliente, a través de la interfaz
web recibe las peticiones de los investigadores e
invoca la funcionalidad correspondiente en el servidor.
Con esta concepción de escalabilidad el sistema
puede ser utilizado por múltiples usuarios a la vez.
Las pruebas realizadas [23] demuestran que pueden estar conectados 70 usuarios a la vez sin que
se afecte la integridad y la capacidad de respuesta
del sistema.
En la implementación realizada se analiza una
secuencia de mRNA conformada a partir de la información del gen o transcrito introducido como
criterios de búsqueda. Estas búsquedas se hacen
sobre la base de datos y ficheros de cromosomas
almacenados localmente. La base de datos diseñada posee la información necesaria y suficiente para
realizar las funcionalidades del sistema. No se almacenan datos innecesarios.
Se implementó una herramienta para actualizar
esta base de datos a partir de los ficheros
seq_gene.md, seq_gene.q [24], seq_snp.md [25],
hsa.gff [2] descargados de los sitios NCBI [26] y
miRBase [2]. Los datos de las tablas Gene, Transcript y Exon se actualizan de seq_gene.md, los de
la tabla SNP de seq_snp.md y los de miRNA de
seq_gene.q y hsa.gff. El proceso de actualización
se puede realizar cuando se estime conveniente. Se
utiliza información pública, pero en un ambiente
local.
Las herramientas como siRNAWizard v3.0, siDirect, siRNA Target Finder, DEQOR solo permiten el
análisis de secuencias de mRNA introducidas por el
usuario en un campo de texto. IDT´Scitools RNAi
Design, siRNA Design Software, Dharmacon siDESIGN Center, RNAi Design, GenScript siRNA Target Finder, realizan consultas a una base de datos
utilzando identificadores de los genes. Ambas opciones se brindan como alternativas en alasSiRNADesign.
Silenciar determinados genes puede abrir vías
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
terapéuticas para tratar enfermedades como cáncer, problemas autoinmunes, infecciones víricas y
en otras ramas como la economía. Algunos ejemplos de sus aplicaciones en el mundo:
Se han creado tomates (Lycopersicons esculentum) transgénicos que llevan un gen artificial que
produce un RNA anti sentido para bloquear la expresión de otro gen implicado en la síntesis de etileno, la hormona vegetal que provoca maduración
(reducen su expresión un 90 %). Así, estos tomates
se conservan mucho más y su vida útil crece considerablemente [27].
Desde el punto de vista médico, ya se ha logrado frenar la replicación del VIH [28] y del virus de la
hepatitis “A” [29] exponiendo cultivos celulares humanos a siRNAs.
En un artículo reciente [30] se demuestra que el
gen RHOC acelera la metástasis en el cáncer de
mama y la intensidad de su expresión es regulada
por el miR-10b, que es un miRNA de los que se
muestran en alasSiRNA-Design. El silenciamiento
de dicho gen puede entonces retardar la aparición
de metástasis.
En el sitio web “cancer MicroRNA” [31] se pueden encontrar varios artículos que relacionan a los
miRNA con el desarrollo y regulación del cáncer y
otras enfermedades.
4. CONCLUSIONES



Los algoritmos implementados y la integración de información sobre SNP y sitios targets de miR-NA mejoran el diseño de los
siRNAs e incorporan al diseño información
sobre la variabilidad genética de los individuos.
La obtención siRNAs comunes a todos los
transcritos de un gen o específicos a solo
un transcrito del gen, brinda una opción no
encontrada en otras aplicaciones disponibles en Internet.
El diseño de un web services da una funcionalidad adicional al sistema extendiendo
sus posibilidades de uso a aplicaciones no
restringidas al tema del silenciamiento de
genes.
5. REFERENCIAS BIBLIOGRÁFICAS
[1]- E. Bernstein, A. Caudy, S. Hammond, y G.
Hannon, “Role for a bidentate ribonuclease in the
initiation step of RNA interference,” Nature, vol. 409,
no. 6818, pp. 363–365, 2001.
[2]- mirbase. “miRBase: the microRNA database,” 2008: http://mirbase.org.
“VIII Congreso Internacional de Informática en la Salud”.
7
[3]- A. Fire, S. Xu, M. Montgomery, S. Kostas, S.
Driver, C. Mello et al., “Potent and specific genetic
interference by double-stranded RNA in Caenorhabditis elegans,” NATURE-LONDON-, pp. 806–
810, 1998.
[4]- I. Bustos Jaimes, C. Castañeda Patlán, J.
Oria Hernández, E. Rendón Huerta, H. Reyes Vivas,
I. Romero Álvarez, A. Universitaria, y D. México,
“Biología molecular de rotavirus: una mirada a través de la interferencia de rna,” Mensaje Bioquímico,
vol. 32, 2008.
[5]- L. Wang y F. Mu, “A Web-based design center for vector-based siRNA and siRNA cassette,”
Bioinformatics, vol. 20, no. 11, p. 1818, 2004.
[6]sirna
target
finder:
2010:
http://www.ambion.com/techlib/misc/siRNAfinder.ht
ml
[7]- S. Yiu, P. Wong, T. Lam, Y. Mui, H. Kung, M.
Lin, y Y. Cheung, “Filtering of ineffective siRNAs and
improved siRNA design tool,” Bioinformatics, vol. 21,
no. 2, p. 144, 2005.
[8]- S. Y. Y. M. V. K. TW Lam, Prudence WH
Wong. (2009). sirna design software. Department of
Computer Science, The University of Hong Kong.
[En
línea].
Disponible
en:
http://i.cs.hku.hk/sirna/software/sirna.php
[9]- Dharmacon, “siDESIGN Center,” 2010:
.http://www.dharmacon.com/DesignCenter/.
[10]- A. Henschel, F. Buchholz, y B. Habermann,
“DEQOR:a web-based tool for the design and quality control of siRNAs,” Nucleic acids research, vol.
32, no. Web Server Issue, p. W113, 2004.
[11]- B. F. H. B. Henschel, A. (2009) Design and
quality control of rnai (deqor). DEQOR. [En línea].
Disponible
en:
http://cluster1.mpicbg.de/Deqor/deqor.html
[12]- W. Gong, Y. Ren, Q. Xu, Y. Wang, D. Lin,
H. Zhou, y T. Li, “Integrated siRNA design based on
surveying of features associated with high RNAi
effectiveness,” BMC bioinformatics, vol. 7, no. 1, p.
516, 2006.
[13]- genscript, “siRNA Target Finder,”. [En línea]. Disponible en: https://www.genscript.com/sslbin/app/rnai
[14]- Y. Naito, T. Yamada, K. Ui-Tei, S. Morishita,
y K. Saigo, “siDirect: highly effective, target-specific
siRNA design software for mammalian RNA interference,” Nucleic acids research, vol. 32, no. Web
Server Issue, p. W124, 2004.
[15]- siDirect. (2009) highly effective, target specific sirna online design site. siDirect. [En línea].
Disponible
en:
http://genomics.jp/sidirect/index.php?type=fc
[16]- invivogen, “sirna wizard: The online tool to
Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo |
“SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS
DE ARN MENSAJERO”
choose and design short hairpin rnas,” 2010:
http://www.sirnawizard.com/
[17]- BIOPREDsi. (2009) Biopredsi. Friedrich
Miescher Institute for Biomedical Research. [En
línea].
Disponible
en:
http://www.biopredsi.org/design.html
[18]- Invitrogen. (2009) Block rnai designer. Invitrogen Corporation. [En línea]. Disponible en:
https://rnaidesigner.invitrogen.com/rnaiexpress/setO
ption.do?designOption
[19]- A. Reynolds, D. Leake, Q. Boese, S.
Scaringe, W. Marshall, A. Khvorova et al., “Rational
siRNA design for RNA interference,” Nature biotechnology, vol. 22, no. 3, pp. 326–330, 2004.
[20]- J. Santoyo, J. Vaquerizas, y J. Dopazo,
“Highly specific and accurate selection of siRNAs for
high-throughput functional assays,” Bioinformatics,
vol. 21, no. 8, p. 1376, 2005.
[21]- S. Elbashir, W. Lendeckel, y T. Tuschl,
“RNA interference is mediated by 21-and 22nucleotide RNAs,” Genes and development, vol. 15,
no. 2, p. 188, 2001.
[22]- Y. Park, S. Park, Y. Choi, D. Lee, M. Won, y
Y. Kim, “AsiDesigner: exon-based siRNA design
server considering alternative splicing,” Nucleic acids research, 2008.
[23]- Y. Pérez Castellón y R. Leyva Hernández,
“Pruebas de liberación, su aplicación al sistema
informático: Silenciamiento de genes (sirna),” Tesis
de grado, Universidad de las Ciencias Informáticas,
2009.
[24]- N. C. for Biotechnology Information,“Human
genome,”
Noviembre
2009:
“VIII Congreso Internacional de Informática en la Salud”.
8
ftp://ftp.ncbi.nih.gov/genomes/Hsapiens/mapview.
[25]- S. Sherry, M.Ward, M. Kholodov, J. Baker,
L. Phan, E. Smigielski, y K. Sirotkin, “dbSNP: the
NCBI database of genetic variation,” Nucleic acids
research, vol. 29, no. 1, p. 308, 2001.
[26]- NCBI, 2009: http://www.ncbi.nlm.nih.gov/
[27]- A. Xiong, Q. Yao, R. Peng, X. Li, P. Han, y
H. Fan, “Different effects on ACC oxidase gene
silencing triggered by RNA interference in transgenic tomato,” Plant Cell Reports, vol. 23, no. 9, pp.
639–646, 2005.
[28]- M. Martínez, A. Gutiérrez, M. ArmandUgón, J. Blanco, M. Parera, J. Gómez, B. Clotet, y
J. Esté, “Suppression of chemokine receptor expression by RNA interference allows for inhibition of
HIV-1 replication,” Aids, vol. 16, no. 18, p. 2385,
2002.
[29]- Y. Kusov, T. Kanda, A. Palmenberg, J.
Sgro, y V. Gauss-Muller, “Silencing of hepatitis A
virus infection by small interfering RNAs,” Journal of
virology, vol. 80, no. 11, p. 5599, 2006.
[30]- L. Ma, J. Teruya-Feldstein, y R. Weinberg,
“Tumour invasion and metastasis initiated by microRNA-10b in breast cancer,” Nature, vol. 449, no.
7163, pp. 682–688, 2007.
[31]- c. MicroRNA. (Diciembre, 2009) Micrornacancer.
[En
línea].
Disponible
en:
http://www.nature.com/nature/journal/v435/n7043/ed
summ/e050609-16.html