Download Objetivos Salta en imágenes - Ingeniería en Sistemas de Información

Document related concepts
Transcript
Siguiente »
WICC 2015
WICC 2015
Autoridades
Comité Académico
Coordinadores
Artículos aceptados
Objetivos
Tesis de Doctorado
Compiladores
El Workshop de Investigadores en Ciencias de la Computación (WICC) es organizado anualmente por la Red de
Universidades Nacionales con Carreras de Informática (RedUNCI) y se lleva a cabo en alguna de las Universidades que
integran la Red. El primer WICC se realizó en 1999 en la Universidad Nacional de San Juan.
El objetivo del Workshop es permitir el intercambio de ideas y experiencias entre investigadores, de modo de fomentar la
vinculación y potenciar el desarrollo coordinado de actividades de Investigación, Desarrollo e Innovación.
WICC 2015, 17º edición del WICC, organizado localmente por el Departamento de Informática de la Universidad Nacional
de Salta, Provincia de Salta, se llevará a cabo en la misma universidad, los días 16 y 17 de abril de 2015.
Enlace al Sitio Web del Workshop
Salta en imágenes
Siguiente »
« Anterior | Siguiente »
WICC 2015
Autoridades
Autoridades
Comité Académico
Coordinadores
Artículos aceptados
WICC 2015
Tesis de Doctorado
Compiladores
Universidad Nacional de Salta, Provincia de Salta
Rector: CPN Víctor Hugo Claros
Departamento de Informática - Facultad de Ciencias Exactas
Director: Mgr. Gustavo Daniel Gil
Red de Universidades Nacionales con Carreras de Informática (RedUNCI)
Coordinador Titular: Ing. Armando De Giusti (UN La Plata)
Coordinador Alterno: Lic. Feierherd Guillermo (UNTDF)
Junta Directiva:
Mag. Dapozo Gladys (UNNE)
Lic. Hugo Padovani (U Morón)
Ing. Marcelo Estayno (UN Lomas de Zamora)
Dra. Fabiana Piccoli (UN San Luis)
Lic. Jorge Finocchieto (U CAECE)
Lic. Horacio Kuna (UN Misiones )
Lic. Fernanda Carmona (UN Chilecito)
Lic. Raúl Kantor (UN Rosario)
Comité Organizador Local
MSc. Daniel ARIAS FIGUEROA
Mgr. Gustavo GIL
Lic. Martín DIAZ
Lic. María Laura MASSE PALERMO
Mg. Sergio ROCABADO
Mg. Rosa MACAIONE
Lic. Jorge SILVERA
Lic. Marcela LOPEZ
C.U. Eduardo FERNANDEZ
Lic. Carina REYES
Lic. Claudia IBARRA
Esp. Loraine GIMNSON SARAVIA
« Anterior | Siguiente »
« Anterior | Siguiente »
WICC 2015
Comité Académico
Autoridades
Comité Académico
Coordinadores
WICC 2015
Artículos aceptados
Tesis de Doctorado
Compiladores
Universidades
Nombre Y Apellido
UBA-Ciencias Exactas
Fernandez Slezak, Diego
UBA-Ingenieria
Echeverria, Adriana
UN La Plata
De Giusti, Armando
UN Sur
Simari, Guillermo
UN San Luis
Esquivel, Susana
UNCPBA
Acosta, Nelson
UN Comahue
Vaucheret, Claudio
UN La Matanza
Spositto, Osvaldo
UN La Pampa
Alfonso, Hugo
UN Lomas de Zamora
Estayno, Marcelo
UN Tierra del Fuego
Feierherd, Guillermo
UN Salta
Gil, Gustavo Daniel
UN Patagonia Austral
Márquez, Maria Eugenia
UTN
Bursztyn, Andrés
UN San Juan
Otazú, Alejandra
UADER
Aranguren, Silvia
UN Patagonia SJB
Buckle, Carlos
UN Entre Ríos
Tugnarelli, Mónica
UN Nordeste
Dapozo, Gladys
UN Rosario
kantor, Raúl
UN Misiones
Kuna, Horacio
UNNOBA
Russo, Claudia
UN Chilecito
Carmona, Fernanda
UN Lanús
García Martínez, Ramón
UN Santiago del Estero
Durán, Elena
Esc. Sup. Ejercito
Castro Lechstaler, Antonio
UN Litoral
Loyarte, Horacio
UN Río IV
Arroyo, Marcelo
UN Córdoba
Brandán Briones, Laura
UN Jujuy
Paganini, José
UN Rio Negro
Vivas, Luis
UN Villa María
Prato, Laura
UN Luján
Scucimarri, Jorge
UN Catamarca
Barrera, María Alejandra
UN La Rioja
Nadal, Claudio
UN Tres de Febrero
Cataldi, Zulma
UN Tucumán
Luccioni, Griselda
UNAJ
Morales, Martin
UN Chaco Austral
Zachman, Patricia
U Morón
Padovani, Hugo René
UAI
De Vicenzi, Marcelo
U Belgrano
Guerci, Alberto
U Kennedy
Panizzi, Marisa
U Adventista del Plata
Bournissen, Juan
UCAECE
Finocchieto, Jorge
U Palermo
Ditada, Esteban
UCA
Grieco, Sebastian
U Salvador
Zanitti, Marcelo
U Aconcagua
Gimenez, Rosana
U Gastón Dachary
Belloni, Edgardo
« Anterior | Siguiente »
« Anterior | Siguiente »
WICC 2015
Base de Datos y Minería de Datos
Autoridades
Comité Académico
Coordinadores
Id
Título
Artículos aceptados
Agentes y Sistemas Inteligentes
6858
Arquitectura, Redes y Sistemas
Minería de Textos: Sistemas de Búsqueda de
Respuestas
Agustin Bini (UCASAL) [email protected]
Operativos
Cynthia Lorena Corso (UTN)
Aspectos Teóricos de Ciencia de la
Computación
Base de Datos y Minería de
Datos
Autores
M. Alicia Perez (UCASAL) [email protected],
Alejandra Carolina Cardoso (UCASAL)
[email protected],
Diseño de almacén de datos para el análisis eficiente de
6860 la información de incidentes informáticos y
mantenimientos.
Computación Gráfica, Imágenes y
Visualización
[email protected],
Claudio Luque (UTN-FRC)
[email protected],
Leonardo Ciceri (UTN-FRC)
[email protected],
Matias Donnet (UTN-FRC)
[email protected]
Ingeniería de Software
Javier Díaz (UNLP) [email protected],
Innovación en Educación en
Laura Lanzarini (UNLP) [email protected],
M. Emilia Charnelli (UNLP)
Informática
Innovación en Sistemas de
Software
6861
Analítica del Aprendizaje y la personalización de la
Educación.
Procesamiento de Señales y
Sistemas de Tiempo Real
[email protected],
Alejandra Schiavoni (UNLP) [email protected],
Ana Paola Amadeo (UNLP)
[email protected]
Procesamiento Distribuído y
Paralelo
Lucía Rosario Malbernat (CAECE)
[email protected],
Seguridad Informática
Tecnología Informática Aplicada en
Educación
[email protected],
Guillermo Baldino (UTN FRLP)
Maria Patricia Clemens (CAECE)
6862
Aplicación de Técnicas de Data Mining en Gestión de
Docentes de Educación Superior
[email protected],
Analia Elena Varela (CAECE)
Tesis de Doctorado
[email protected],
Compiladores
Ezequiel Matías Urrizaga (CAECE)
[email protected]
6864
Instrumento fiable para la Determinación de Perfiles
Sociales y Culturales de estudiantes universitarios
Myriam Herrera (UNSJ) [email protected],
Adriana Mallea (UNSJ) [email protected],
Flavia Millán (UNSJ) [email protected]
Utilización de NoSQL para resolución de problemas al
trabajar con cantidades masivas de datos
Giovanni Róttoli (UTN-FRBA) [email protected],
M Lopez-Nocera (UTN-FRBA)
[email protected],
Ma Florencia Pollo Cattaneo (UTN-FRBA)
[email protected]
Minería de datos para un Sistema de alerta temprana de
deserción en carreras de Ingeniería
Hernàn Ahumada (UNCa)
[email protected],
Hugo R. Dip (UNCa) [email protected],
Carlos Gabriel Herrera (UNCa)
[email protected],
Juan Carlos Leguizamon Almendra (UNCa)
[email protected]
6905
Algoritmos Eficientes para Busquedas a Gran Escala
Integrando Datos Masivos.
Gabriel Tolosa (UNLu) [email protected],
Santiago Banchero (UNLu) [email protected],
Esteban A Rissola (UNLu) [email protected],
Tomas Delvechio (UNLu) [email protected],
Santiago Ricci (UNLu) [email protected],
Esteban Feuerstein (UBA) [email protected]
6940
Análisis comparativo de dos Sistemas de Bases de Datos Silvina Migani (UNSJ) [email protected],
XML
Cristina Vera (UNSJ) [email protected]
6865
6880
Técnicas de Minería de Datos como alternativa a las
6955 Técnicas Estadísticas de Discriminación y Clasificación
Multivariadas Clásicas
6966
Recuperación y Procesamiento en Grandes Volúmenes
de Datos
María Paula Dieser (UNLPAM)
[email protected],
María Cristina Martin (UNLPAM)
[email protected],
Erica Schlaps (UNLPAM)
[email protected],
Vanina Celeste Bolaños (UNLPAM)
[email protected],
Lorena Verónica Cavero (UNLPAM)
[email protected],
María de los Angéles Irribarra (UNLPAM)
[email protected],
Claudina Solaro (UNLPAM)
[email protected],
Laura Wagner (UNLPAM)
[email protected],
Diamela Titionik (UNLPAM)
[email protected]
Luis Britos (UNSL) [email protected],
Maria E. Di Gennaro (UNSL) [email protected],
Jacqueline Fernandez (UNSL) [email protected] ,
Graciela Verónica Gil Costa (UNSL)
[email protected],
Fernando Kasián (UNSL) [email protected],
Acciones
Id
Título
Autores
Jair Lobos (UNSL) [email protected],
Verónica Ludueña (UNSL) [email protected],
Marcela Printista (UNSL) [email protected],
Nora Reyes (UNSL) [email protected],
Patricia Roggero (UNSL) [email protected],
Guillermo Trabes (UNSL)
[email protected],
Edgar Chávez (CICESE) [email protected],
Claudia Deco (UNR) [email protected]
Modelo de Sentiment Analysis para la clasificación de
6975 noticias en tiempo real en el Mercado de Valores de
Buenos Aires
Juan Pablo Braña (UAI) [email protected],
Alejandra Litterio (UAI) [email protected],
Cristina Camos (UAI) [email protected],
Alejandro Fernandez (UAI)
[email protected]
Serqio Quiroga (UNSJ) [email protected],
6984
Minería de datos en la detección de desperfectos en el
alumbrado público
María Alejandra Malberti Riveros (UNSJ)
[email protected],
Raúl Oscar Klenzi (UNSJ)
[email protected]
Claudio Delreiux (UNS) [email protected],
Damián Pablo Barry (UNPSJB)
Clasificación de Información en BigData mediante la
6991 utilización de Técnicas de Inteligencia Artificial y Análisis
de Redes Sociales
[email protected],
Romina Stickar (UNPSJB) [email protected],
Renato Mazzanti (UNPSJB)
[email protected],
Carlos Buckle (UNCOMA) [email protected],
Rodrigo René Cura (UNPSJB)
[email protected],
Marcos Zarate (UNCOMA)
[email protected]
Adriana Martin (UNSJ) [email protected],
Susana Beatriz Chavez (UNSJ) [email protected],
María Antonia Murazzo (UNSJ) marite@unsj-
6992 MongoDB en ambiente Cloud Híbrido con OpenStack
cuim.edu.ar, [email protected],
Nelson R. Rodriguez (UNSJ)
[email protected],
Francisca Adriana Valenzuela (UNSJ)
[email protected]
Ernesto Mangia (UADER) [email protected],
Omar Denis (UADER) [email protected],
M. E. Llorente (UADER) [email protected],
Javier Besso (UADER) [email protected],
6999
Implementación de un Modelo Multidimensional para un
Datawarehouse sobre pacientes diabéticos
7002 Geometría Computacional y Bases de Datos
7017
Bases de Datos no Convencionales: ?Indices y
Lenguajes de Consulta
Desarrollo de un Sistema Experto para el Proyecto de
7026 Investigación "Generador Automático de Modelos de
Datos Normalizados en Bases de Datos Relacionales"
Ald Daniel Sigura (UADER)
[email protected],
Alejandro Hadad (UADER)
[email protected],
Bartolomé Drozdowicz (UNER) [email protected]
María Gisela Dorzán (UNSL)
[email protected],
Susana Esquivel (UNSL) [email protected],
Olinda Edilma Gagliardi (UNSL) [email protected],
Guillermo Leguizamón (UNSL) [email protected],
Pablo Rafael Palmero (UNSL)
[email protected],
María Teresa Taranilla (UNSL) [email protected],
Gregorio Hernandez Peñalver (UPM)
[email protected]
Jorge Arroyuelo (UNSL) [email protected],
Susana Esquivel (UNSL) [email protected],
Alejandro Grosso (UNSL) [email protected],
Verónica Ludueña (UNSL) [email protected],
Cintia Valeria Martinez (UNSL)
[email protected],
Nora Reyes (UNSL) [email protected],
Edgar Chávez (CICESE) [email protected],
Gonzalo Navarro (UCHILE) [email protected],
Manuel Hoffhein (UTALCA) [email protected],
Rodrigo Paredes (UTALCA) [email protected]
Luis Esteban Damiano (UTN-FRC)
[email protected],
María Alejandra Paz Menvielle (UTN)
[email protected],
Roberto Miguel Muñoz (UTN-FRC)
rmuñ[email protected],
María Soledad Romero (UTN-FRC)
[email protected],
Juan Carlos Cuevas (UTN-FRC)
[email protected],
Carlos Bartó (UTN) [email protected],
Nicolás Fiorito (UTN-FRC)
[email protected],
Mauricio Spalletti (UTN-FRC)
[email protected]
Cristobal R. Santa María (UNLaM)
[email protected],
Técnicas de Minería de Datos Aplicadas al
7028
Victoria Santa María (UBA) [email protected],
Procesamiento de ADN de Comunidades Microbiológicas
Fernando Galanternick (UBA)
Acciones
Id
Título
Autores
Acciones
[email protected],
Luis López (UNLaM) [email protected],
Juan Carlos Otaegui (UNLaM)
[email protected],
Marcelo Soria (UBA) [email protected]
Gerardo E. Schneider (UNER)
[email protected],
7069
Gestión y procesamiento de imágenes aéreas de caña
de azúcar
Agustín Solano (UNER) [email protected],
Alejandra Kemerer (UNER)
[email protected],
Alejandro Hadad (UNER) [email protected]
Laura Lanzarini (UNLP) [email protected],
Waldo Hasperué (UNLP)
[email protected],
César Estrebou (UNLP)
[email protected],
Franco Ronchetti (UNLP)
[email protected],
Redes Neuronales Artificiales. Aplicaciones en Minería
7100
de Datos y Procesamiento de Señales Temporales
Augusto Villa Monte (UNLP)
[email protected],
Germàn Aquino (UNLP)
[email protected],
Facundo Quiroga (UNLP)
[email protected],
Luis Rojas (UNPSJB) [email protected],
Patricia Jimbo Santana (EPDE)
[email protected]
Viviana Mercado (UNPA)
7112
Atribución de Autoría y Determinación de la Orientación
Política en Documentos Periodísticos
[email protected],
Andrea Villagra (UNPA) [email protected],
Guillermo Leguizamón (UNSL) [email protected],
Marcelo Errecalde (UNSL) [email protected]
Aportes Esperados de la Técnica de Ärboles de decisión
7127 al aplicarlos a datos generados con la metodología
BLENDED LEARNING
Marcelo Omar Sosa (UNCa) [email protected],
Eugenia Cecilia Sosa Bruchmann (UNCa)
[email protected]
Anabella De Battista (UTN-FRCU)
[email protected],
Andrés Pascal (UTN-FRCU)
7129 Indexación y Búsquedas de Bases de Datos
[email protected],
Juan Pablo Nuñez (UTN-FRCU)
[email protected],
Soledad Retamar (UTN-FRCU)
[email protected],
Norma Edith Herrera (UNSL) [email protected],
Gilberto Gutierrez (UBB) [email protected]
Algoritmo Genético para la asignación eficiente de
recursos en casos de Catástrofes Climáticas
Marcos Trotti (UNCPBA) [email protected],
Rosa Dos Reis (UNCPBA)
[email protected],
Moises Bueno (UNCPBA)
[email protected],
Daniel Xodo (UNCPBA) [email protected]
Construyendo Campo Productivo en zona norte de Sant
7182 a Cruz, como política de Vinculación Tecnológica, a
través de un Sistemas de Información Geográfica
María Eugenia De San Pedro (UNPA)
[email protected],
Marta Lasso (UNPA) [email protected],
Natalia Serón (UNPA) [email protected],
A. Carrizo (UNPA) [email protected],
Cristian Montenegro (UNPA)
[email protected],
L Ramos (UNPA) [email protected]
7168
7191
Sistemas de apoyo a la toma de decisiones. Una
aplicación en el área de Gestión Universitaria
7215 Indexando Bases de Datos de Texto
Claudia López de Munain (UNPSJB)
[email protected],
Anahi Sandoval (UNPSJB)
[email protected],
Marcela Torrent (UNPSJB)
[email protected]
Norma Edith Herrera (UNSL) [email protected],
Carina Mabel Ruano (UNSL) [email protected],
Darío Ruano (UNSL) [email protected],
Susana Esquivel (UNSL) [email protected]
« Anterior | Siguiente »
Utilización de NoSQL para resolución de problemas al trabajar con
cantidades masivas de datos
Giovanni Daián Róttoli1, 2, Marcelo López Nocera1, Ma. Florencia PolloCattaneo1,2
1
Grupo de Estudio en Metodologías de Ingeniería de Software (GEMIS).
Facultad Regional Buenos Aires. Universidad Tecnológica Nacional. Argentina.
2
Ingeniería en Sistemas de Información, Facultad Regional Concepción del
Uruguay. Universidad Tecnológica Nacional. Argentina
{flo.pollo, gd.rottoli}@gmail.com, [email protected]
Resumen
Las bases de datos relacionales
(RDBMS)
se
han
utilizado
tradicionalmente para resolver una amplia
variedad de problemas asociados a datos
de diversa naturaleza. Sin embargo, con el
advenimiento de Big Data, se han
presentado nuevos desafíos que esta
arquitectura no ha podido resolver
eficientemente. Dicha situación dio
origen a nuevas tecnologías que no
utilizan SQL como lenguaje de consulta y
además plantean nuevas arquitecturas
para el modelado de los datos. Son
conocidas genéricamente bajo el nombre
“NoSQL” y son alternativas que podrían
resolver estas cuestiones asociadas con
cantidades masivas de datos. El presente
trabajo lleva adelante un estudio de
campo para ver en qué casos se obtiene
mejor resultado utilizando cada una de
estas innovadoras tecnologías.
Palabras clave: SQL, Big Data, NoSQL,
Persistencia Políglota.
Contexto
El proyecto planteado articula líneas
incipientes de trabajo del Grupo de
Estudio en Metodologías de Ingeniería de
Software (GEMIS) de la Facultad
Regional Buenos Aires (FRBA) y
Concepción del Uruguay (FRCU) de la
Universidad Tecnológica Nacional (UTN)
Introducción
Las bases de datos tradicionales, de
arquitectura relacional, que usan el
lenguaje
SQL,
y
frecuentemente
englobadas bajo la abreviatura RDBMS,
parecen no ofrecer soluciones eficientes
para un variado universo de nuevos
problemas
relacionados
con
el
tratamiento de datos masivos, conocidos
genéricamente como Big Data (por caso,
el análisis en línea de los datos recabados
de las redes sociales). Esto provocó, entre
otras cosas, el advenimiento de NoSQL
[1].
El concepto NoSQL tiene su auge en el
año 2009, y se refiere a todas aquellas
tecnologías de bases de datos que no
utilizan el lenguaje ANSI SQL para sus
consultas [1]. Se trata generalmente de
proyectos de código abierto, que corren
en grupos de servidores, utilizan una
arquitectura de procesamiento distribuido,
tienen modelos de datos distintos del
relacional tradicional, permitiendo el uso
de agregados (listas, registros, etc.), y
operan sin esquemas, permitiendo agregar
o quitar elementos a la base de datos de
manera sencilla, sin que esto represente
un problema [1]. Estas características
hacen posible palear las principales
problemáticas aportadas por la masividad
de los nuevos conjuntos de datos, entre
las cuales se encuentra:
1. El bajo rendimiento para grandes
volúmenes de datos [1][6][7][8].
2. La discordancia de la impedancia
(los datos en memoria tienen una
estructura distinta a la que se almacena en
la base de datos física) [1][5].
3. La necesidad de escalado del
almacenamiento
físico,
ya
sea
aumentando la capacidad de los
servidores, lo cual es caro y limitado, o
utilizando servidores colaborativos, lo
cual no es soportado por las bases de
datos tradicionales [2][3][6][7][8][10].
4. La imposibilidad de las bases de
datos relacionales de utilizar estructuras
de datos complejas anidadas, lo cual
surge a partir de la necesidad de modelar
datos de estructuras poco usuales que, si
se modelaran de una manera clásica, por
un lado no resultaría en un modelo fiel de
la realidad en cuestión, y por otro
disminuiría la eficiencia total de las
consultas de manera considerable
[1][4][6][7][8].
NoSQL engloba una gran cantidad de
alternativas que operan bajo paradigmas
completamente distintos y lenguajes de
consulta muy variados. Ante tal gran
abanico de posibilidades, las grandes
empresas, como Google1 o Amazon2 ,
optan por utilizar estas tecnologías, que
inclusive desarrollan por su cuenta para
adaptarlas
exclusivamente
a
sus
necesidades particulares.
1
2
Google - www.google.com
Amazon - www.amazon.com
Entre las opciones NoSQL, se pueden
destacar cuatro grupos o tipos principales,
los cuales se diferencian entre sí por el
paradigma de modelado de datos que
utilizan. Estos son: las bases de datos de
Clave-Valor, las de Familia de Columnas,
las Documentales y las Gráficas, cada una
con sus propias particularidades, ventajas
y desventajas a considerar a la hora de
elegir
por
alguna
de
ellas.
[2][4][5][6][7][8].
Por otro lado, se debe tener en cuenta
que la encapsulación de servicios puede
ayudar al cambio de las tecnologías de
almacenamiento de datos a medida que
las necesidades y evolucionan. La
separación por capas de las partes de las
aplicaciones permite introducir NoSQL
en una aplicación preexistente, pudiendo
además coexistir arquitecturas SQL y
NoSQL, aprovechando las ventajas de
cada una de ellas. Esto último se conoce
como persistencia políglota [5] y [9], es
decir,
el
uso
de
diferentes
almacenamientos de datos en distintas
circunstancias. Como ejemplo, podemos
mencionar la utilización de una base de
datos NoSQL Gráfica para mantener las
relaciones de compras entre usuarios y
productos, y una SQL para mantener los
datos de los usuarios. Otro ejemplo,
consistiría en la utilización de una base de
datos Documental para guardar historiales
médicos, debido a su falta de esquemas, y
una base de datos Clave-Valor para
vincular los pacientes con datos sobre su
habitación, médico a cargo, u otros datos,
debido a su rapidez de consulta y
sencillez en el manejo de datos simples.
Entre las principales características de
la persistencia políglota, podemos
enumerar [9]:
• La implicación de diferentes tecnologías
de datos para manejar las diversas
necesidades de almacenamiento de los
mismos.
• La aplicación de dicha arquitectura en
la totalidad de los datos de una empresa o
para un subconjunto de ellos.
• La reducción del impacto de los
cambios en la totalidad del sistema, al
encapsular los distintos servicios de bases
de datos.
• El aumento de la complejidad de las
aplicaciones al necesitar manipular
diversidad de lenguajes de consulta y
particularidades de los motores de bases
de datos.
Por todos estos motivos y para muchas
situaciones que lo requieran, comenzar a
utilizar motores de bases de datos
NoSQL, o bien, persistencia políglota
parecen
ser
opciones
más
que
satisfactorias para las organizaciones. Sin
embargo, el impacto de realizar estos
cambios puede resultar en costos
elevados, problemas de rendimiento y
otros relacionados a la seguridad de los
datos, debido a la necesidad de adaptar el
modelo de datos actual a los diferentes
paradigmas NoSQL[2][7][8].
El presente proyecto, propone el
estudio del comportamiento de las bases
de datos NoSQL al ser utilizadas con un
modelo de datos diferente, para conocer
el impacto de ello, esperando encontrar
evidencias que indiquen que un modelo
políglota permitiría mitigar dicho impacto
de una mejor manera.
Líneas de Investigación,
Desarrollo e Innovación
En el último tiempo, con la llegada de
las nuevas tecnologías de Bases de Datos
y la tendencia NoSQL, muchas empresas
quieren migrar sus datos a estas
plataformas por diferentes motivos [9].
Muchas veces, diseñar una estructura
de bases de datos NoSQL que se adapte a
la estructura de los datos actual, implica
sacrificar ciertas características como el
rendimiento, la normalización de las
tablas, etc., para que ambas arquitecturas
sean totalmente compatibles [5] y [6].
Surgen así interrogantes como ¿cuál es
el rendimiento entre las bases de datos
NoSQL si se mantiene la estructura de los
datos entre una y otra? y ¿qué tan
beneficioso es mantener un modelo
“genérico” entre las distintas bases de
datos y aprovechar solamente las
características de los motores? Una
organización que se encuentra en vías de
crecimiento, se plantea estas preguntas,
siendo la incertidumbre sobre el futuro lo
que le dificulta tomar una decisión sobre
la estructura de sus datos.
Por ello, se propone realizar una serie
de pruebas con datos de distinta
naturaleza, a los que se los modelará de
manera relacional y según los distintos
paradigmas NoSQL (Documentales,
Gráficas, Clave-Valor y Familia de
Columna), y cada uno de dichos modelos
se implantará en motores de bases de
datos tanto relacional, como es
PostgreSQL3, y NoSQL, como son
MongoDB4 (Documentos), Cassandra5
(Familia de Columnas), Redis6 (ClaveValor) y Neo4J7 (Gráfos).
De esta manera, se realizará un
modelo adecuado para las bases de datos
documentales y, si es posible, se
trasladará esa estructura de datos hacia las
demás tecnologías. Así mismo, este
procedimiento se repetirá con todos los
tipos de bases de datos nombrados
anteriormente.
Para llevar a cabo el proyecto
propuesto, se plantean las siguientes
actividades:
3
PostgreSQL – http://www.postgresql.org/
MongoDB – http://www.mongodb.org/
5
Cassandra – http://cassandra.apache.org/
6
Redis – http://redis.io/
7
Neo4J – http://neo4j.com/
4
1. Obtención de datos característicos:
por lo menos 3 juegos de datos de distinta
naturaleza.
Por
ejemplo,
datos
correspondientes a compras realizadas por
personas, datos médicos de pacientes, sus
historiales y relaciones con médicos, y
datos de redes sociales.
2. Modelado
2.1. Modelado de los datos de forma
relacional, documental, gráfica, clavevalor, y familia-columnas.
2.2. Traslado de cada modelo a los
diferentes motores de base de datos SQL
y NoSQL.
2.3. Pruebas mediante consultas
complejas (que requieran la utilización de
operaciones como Inner Join por
ejemplo), y en cada uno de los motores
para cada uno de los modelos
desarrollados. Obtención de tiempos de
ejecución de las consultas.
3. Análisis de Datos
3.1. Determinar si existen casos donde
una estructura de tal característica no
influye en la eficiencia de las consultas
bajo un determinado paradigma.
3.2. Determinar si las estructuras de
datos resultantes resultan comprensibles y
la utilización de los datos no ocasionaría
problemas futuros.
Resultados y Objetivos
Mediante
la
ejecución
del
procedimiento descripto en el apartado
anterior, se obtendrán los tiempos de
consulta correspondientes a cada uno de
los modelos de datos en los distintos
motores de bases de datos.
A partir del análisis de los mismos, se
podrá determinar si la migración de los
datos desde una base de datos SQL o
NoSQL a otra, puede realizarse (aunque
sea en una primera instancia) sin mayores
modificaciones de la estructura de los
mismos.
Se pretende además, confirmar que un
modelo políglota sería la mejor
alternativa a adoptar ante un escenario
plural, para aprovechar las características
de los distintos motores, o bien para
realizar las migraciones de datos de
manera modular.
Formación de Recursos Humanos
Este proyecto busca tanto la obtención
de nuevos conocimientos como la
motivación de los implicados para que
asciendan dentro del escalafón de la
carrera de investigadores. El grupo de
trabajo se encuentra integrado por dos
investigadores
formados
y
un
investigador en formación. Además se
encuentra en desarrollo un Trabajo Final
de Especialidad.
Se pretende formar especialistas en el
análisis de adopción de procesos
vinculados con la Ingeniería de Software.
Finalmente, en el marco de este
proyecto de investigación se prevé la
radicación de una Tesis de Maestría en
Ingeniería en Sistemas de Información.
Referencias
[1]. P. Sadalage, M. Fowler. NoSQL
Distilled, A Brief Guide 1to the Emerging
World of Polyglote Persistence. AddisonWesley, Boston, USA, 1st. Edition, 2013
[2]. R. Hecht. NoSQL Evaluation.
International Conference on Cloud and
Service Computing. ISBN:978-1-45771637-9.P.336-341.2011.
URL:
http://rogerking.me/wpcontent/uploads/2012/03/DatabaseSystem
sPaper.pdf (verificado el 23/02/2015)
[3]. D. López. “Análisis de las
posibilidades de uso de Big Data en las
organizaciones”.
Universidad
de
Cantabria, Santander, España, 2012.
URL:
http://repositorio.unican.es/xmlui/bitstrea
m/handle/10902/4528/TFM%20%20David%20L%C3%B3pez%20Garc%
C3%ADaS.pdf?sequence=1 (Verificado
el 27/02/2015)
[4.] A. Ramírez, H. Helio, C. Herrera,
J. Francined. Un viaje a través de bases
de datos espaciales. NoSQL: Redes de
ingeniería, Univ. Distrital Francisco J de
Caldas, Bogotá, Colombia, vol.4, no2,
págs. 35-47, agosto-diciembre 2013 URL:
http://revistas.udistrital.edu.co/ojs/index.p
hp/REDES/article/download/5923/7426
(verificado el 21-02-2015)
[5]. A. Nayak, A. Poriya, D. Poojary.
“Types of NOSQL Databases and its
Comparison with Relational Databases”.
International
Journal
of
Applied
Information Systems (IJAIS) – ISSN:
2249-0868 Foundation of Computer
Science FCS, New York, USA Volume
5–
No.4,
March
2013
URL:
http://research.ijais.org/volume5/number4
/ijais12-450888.pdf
(verificado el 21-02-2015)
[6]. C. Strauch, W. Kriha. “NoSQL
databases”. 2011. URL:
http://www.christofstrauch.de/nosqldbs.pdf
(verificado el 21-02-2015)
[7]. H. Del Busto, G. Hansel, O.
Enríquez. “Bases de datos NoSQL”.
Revista Telemática, vol. 11, no 3, 2013
URL:
http://revistatelematica.cujae.edu.cu/index
.php/tele/article/view/74/74
(verificado el 21-02-2015)
[8]. F. Bugiotti, L. Cabibbo. “A
Comparison of Data Models and APIs of
NoSQL Datastores”. Dipartamento di
Ingegneria della Università di Roma,
2013 URL:
http://www.bugiotti.it/downloads/publicat
ions/noamSEBD13.pdf
(verificado el 21-02-2015)
[9]. C. Nance, T. Losser, R. Iype, G.
Harmon. “NoSQL vs RDBMS - why
there is room for both”, Proceedings of
the Southern Association for Information
Systems Conference, Savannah, GA,
USA March 8th–9th, 2013 URL:
http://sais.aisnet.org/2013/Nance.pdf
(verificado el 21-02-2015)
[10]. M. Mannino. Administración de
Base de Datos. ISBN 9789701061091.
MCGRAW-HILL / Interamericana de
México.3ra Edición. 2007