Download BASE DE DATOS ESPACIALES Javier Tolosa, Luis Pulido, Carlos

Document related concepts

Base de datos espacial wikipedia , lookup

Modelo de base de datos wikipedia , lookup

Base de datos relacional wikipedia , lookup

Sistema de información geográfica wikipedia , lookup

Hibernate wikipedia , lookup

Transcript
BASE DE DATOS ESPACIALES
Javier Tolosa, Luis Pulido, Carlos Gamboa
Especialización en Sistemas de Información Geográfica, Universidad Distrital Francisco José de Caldas
Bogotá, Colombia
[email protected]
[email protected]
[email protected]
Resumen- En el momento de la concepción de las bases
de datos espaciales en indispensable tener en cuenta
que el tipo de base de datos espacial que se va a utilizar
depende de las necesidades y requerimientos de la
estructura de la información con que se tenga y en cierto
modo de los recursos con los que se disponga, puesto
que en la medida que se tenga una gran cantidad de
información, mayor recurso tecnológico requiere y de
esta forma el costo del software y del conocimiento para
la manipulación y administración requiere de
profesionales con un mayor grado de conocimientos en
la materia; independientemente del programa en que se
desee implementar los pasos iniciales requieren de un
modelamiento concienzudo de acuerdo de los
requerimientos y necesidades del usuario final, esto
quiere decir que es necesario la identificación de los
conceptos dentro de la idea del negocio, identificar las
relaciones existentes entre las temáticas o entidades y
determinar estructuradamente las características de
cada una de las componentes que permitan almacenar la
información, de manera que se acomode en la medida de
lo posible a las formas normalizadas o prexistentes del
modelamiento de las bases de datos espaciales.
INTRODUCCIÓN
La información y los datos que obtiene diariamente a
partir de las nuevas Tecnologías de la Información y
Conocimiento (TIC), como se observa actualmente con
servidores de mapas como google earth, servidores de la
NASA, USGS en formato raster u open street maps, tracks
de disposistivos móviles GPS que se soportan sobre un
servidor que almacena esta información, generan
información geográfica de forma abundante, información
que anteriormente no se tenia y no existía la
infraestructura de tecnológica para la manipulación de
este información, sin embargo esta información debe ser
procesadas para convertirse en insumo sea útil para
satisfacer cualquier tipo de necesidad .
En la actual revolución social el acceso y manejo de la
información denominada Sociedad de la Información
donde un conjunto exuberante de datos se encuentran
contenidos en nuevos soportes y que dan origen a la
Sociedad del Conocimiento, en la que se transmite
información con el fin de estimular la creación de nuevos
conocimientos mediante la educación, se establece la
información como un elemento accesible, que se puede
poseer, que da poder, que da conocimiento.
MARCO TEORICO
Con el desprendimiento de la información con respecto a
los equipos informáticos físicos se logro un gran avance
en materia de usabilidad, portabilidad y eficiencia en
materia de la generación de sistemas de información
geográficos
sencillos
y
autónomos
en
su
retroalimentación y administración, aspecto que
incrementa notablemente la vida útil de estos sistemas y
por consiguiente de las bases de datos espaciales que
soportan y gestionan este tipo de información.
Los sistemas de información, como tecnología de la
información nos ayudan a manejar la información, lo que
sabemos (what we know), permitiendo y facilitando la
organización,
almacenamiento,
acceso,
manejo,
manipulación, síntesis y aplicación de conocimiento para
la solución de problemas, a partir de un conjunto de
recursos, que normalmente incluyen hardware, software,
información, datos, aplicaciones, comunicaciones y
personas.
la gestión, manejo y almacenamiento de los datos
espaciales y no espaciales; mediante el desarrollo e
implementación de sistemas de gestión, acceso y
consulta denominados Manejadores de Bases de Datos
Espaciales (SMBD), pilar y núcleo de las tareas de análisis
de información y generación de conocimiento que sobre
el espacio los Sistemas de Información Geográfica (SIG)
involucran en multitud de procesos de planeación, toma
de decisiones y gestión de aspectos en determinados
casos de importancia estratégica y vital, debido a que en
cada proceso se debe inferir las necesidades y
exteriorización
Archivo de Datos Un conjunto de registros relacionado
conforma un. Registros relacionados implican que estos
representan diferentes ocurrencias del mismo tipo de
clases de personas, cosas, eventos o fenómenos.
El desarrollo de los primeros sistemas de
almacenamiento y consulta hasta los modernos sistemas
de bases de datos ha sido definido por diversos factores:
1.
2.
Es común usar los términos Datos e Información como
sinónimos, sin embargo ambos términos transmiten
diferentes conceptos:
•
•
Los Datos son hechos que describen sucesos y
entidades, es una palabra en plural que se
refiere a un cuerpo de de hechos o figuras que
han sido recolectadas sistemáticamente para
uno o más propósitos específicos [5].
Las colecciones o conjuntos de datos
pertenecientes a un mismo contexto y que son
almacenados sistemáticamente y de forma
persistente para su posterior uso, se
denominan Bases de Datos (BD) [7]
Los datos en una libreta o directorio telefónico
constituirían una base de datos; de hecho ni libreta, ni las
hojas con los números impresos o escritos en ellas
constituirían la BD, esta solo estaría definida por el
conjunto de datos que se encuentran allí:
Atributo es La unidad mínima de almacenamiento en una
base de datos espacial es un data-ítem o elemento de
dato, este representa una ocurrencia de una
característica particular correspondiente a una entidad
(persona, evento, fenómeno o cosa), y generalmente se
denomina Su nombre, su teléfono, son cada uno
independientemente atributos
Registro es un grupo relacionado de elementos de dato,
constituyen un (record). los datos son ocurrencias de
diferentes características correspondientes a la misma
persona, evento, etc. Los atributos que conforman un
registro pueden ser de diferente tipo, texto (string, char,
varchar, varchar2), valores numéricos (integer, float,
double, number, etc), imágenes, etc. Todos los atributos
de una misma persona, constituyen un registro.
3.
La constante necesidad de superar las limitaciones
de los sistemas de procesamiento.
Posibilitar el uso de los avances en la tecnología de
la computación.
El cambio conceptual del uso de los datos.
Dichos factores han generado en múltiples campos de
aplicación, la implementación de diferentes alternativas
mediante SMBD. Estas permiten categorizar los SMBD de
acuerdo a [4]:
Los beneficios de este esquema, radican en su
simplicidad, flexibilidad y productividad, puesto que los
datos se almacenan de forma simple, en Tablas como
listas bidimensionales de registros, generalmente
definidas como Relacion: cuya estructura es fácil de
entender y transmitir a otros sistemas relacionales. De
igual forma SQL facilita una mayor productividad, al ser
un lenguaje de fácil aprendizaje. Aunque la mayor
ventaja del modelo de datos relacional, es la capacidad
que tienen los usuarios de crear, ingresar y extender si es
necesario sus propios tipos de datos. La aparente simple
estructura que implica el modelo relacional ha probado
ser flexible y útil en un amplio rango de áreas de
aplicación, estimándose que un 95% de los datos
almacenados en SMBD, se encuentran bajo un modelo
relacional (SMBDR)[3], y es por ende el modelo
dominante en el mercado, con productos como: DB2 de
IBM, Informix, Oracle, Sybase, Microsoft Access y
SQLServer, FoxBase y Paradox [13].
Las limitaciones de los SMBDR radican principalmente
en la incapacidad de este modelo de almacenar y
consultar Objetos Completos y de Amplio Significado
directamente en la BD, elementos como imágenes,
audio/video, y como se presentara en secciones
posteriores elementos espaciales; pues el sistema fue
originalmente diseñado para el manejo datos
tradicionalmente asociados a transacciones bancarias,
manejo de recursos y personal, control de recursos e
inventario [3].
Modelo de datos orientado a objetos.
De la cada vez más creciente necesidad por combatir
las limitaciones de los SMBDR y permitir el uso y difusión
de datos sobre la Internet, los programadores
desarrollan e introducen en la década de 1990, los
conceptos de programación Orientada a Objetos [13].
Los sistemas manejadores orientados a objetos
(SMBDOO) proveen la capacidad de un acceso
consistente, seguro, y capacidad de almacenamiento de
Objetos Completos (comportamiento y atributos) en la
base de datos.
Un Objeto se define como un paquete de información
autocontenida, describiendo las características o
atributos (Estado) y capacidades (Comportamiento) de
una entidad de estudio. La interacción entre dos objetos
se denomina Relación, un conjunto de Objetos del
mismo tipo se denomina Clase [3].
Los SMBDOO involucran 4 importantes características a
partir de la conjunción de las tecnologías de la
programación orientada a objetos y el manejo de bases
de datos.
la extensión del modelo relacional para el manejo de
objetos [4].
Modelo de datos objeto relacional.
Los SMBD Objeto Relacional (SMBDOR), son sistemas
que cuentan con el robusto manejo de transacciones de
un sistema relacional y con la capacidad de manejar
objetos con la flexibilidad de almacenamiento y acceso
de los sistemas orientado a objetos. Los diferentes
esquemas de extensión de un modelo relacional a un
modelo orientado a objetos, comercialmente disponibles
como IBM DB2, Informix Dynamic Server, Microsoft SQL
Server y Oracle generalmente ofrecen como
característica la posibilidad que el usuario defina sus
propios tipos de datos, funciones de manipulación
acceso e indexado, sin necesidad de grandes cambios a
los SMBDR ya existentes en la organización, y
permitiendo a los programadores el usos de
programación en lenguajes orientados a objetos como
VisualBasic, Java y C++[12].
Evolución de la arquitectura en SMBD.
1.
2.
3.
4.
La Herencia, permite el desarrollo de soluciones a
problemas complejos en términos de objetos ya
existentes.
El Encapsulamiento, describe el hecho de que cada
objeto empaqueta y protege una descripción de
su estado y comportamiento.
La Identidad, permite a un objeto diferenciarse de
otros, y por ende ser independiente.
El Polimorfismo describe el proceso por el cual
cada objeto tiene su propia implementación para
las operaciones definidas
Este esquema representa una manera más natural de
pensar y abordar problemas a solucionar. Otras de las
ventajas de este modelo radican en que las operaciones
definidas no dependen de una aplicación en particular
[13], permitiendo el manejo de datos persistentes como
los almacenados en una BD y, datos transitorios o
semipermanentes como los encontrados en otros
programas en ejecución.
Sin embargo y a pesar de su indudable elegancia, estos
sistemas no han probado ser lo suficientemente exitosos
a nivel comercial como se había predicho, las causas de
dicho revés radican principalmente en la masiva cantidad
de SMBDR instalados y en funcionamiento, lo que ha
limitado el desarrollo en implementación de los modelos
OO [3] y [12], y a la importante implementación que
sobre los SMBDR cada proveedor ha realizado buscando
La implementación de los SMBD en una determinada
arquitectura de hardware y software, define muchos de
los aspectos de funcionamiento y estructura del sistema
de gestión, almacenamiento y análisis de los datos en la
BD. Múltiples opciones de configuración pueden ser
definidas, sin embargo se presentan de acuerdo con
Yeung, et al (2008) las características de los sistemas
centralizados y distribuidos, mediante una arquitectura
cliente/servidor (ver Figura 7), pues es este esquema de
procesamiento el más ampliamente difundido es SMBD.
Los primeros SMBD fueron desarrollados sobre
Mainframes o computadoras centrales con grandes
capacidades de almacenamiento, mediante un ambiente
operativo multitarea, donde varios procesadores
trabajan de forma concurrente en una sola unidad de
procesamiento. En estos sistemas, la BD, las aplicaciones
de manejo y otro tipo de aplicaciones se almacenaban en
un único computador central, por eso se denomina a
esta arquitectura como Centralizada.
Con el amplio avance en las tecnologías de la
comunicación y la mayor difusión y capacidad de los
sistemas de computo personal en la década de 1990, la
arquitectura de los SMBD avanzo rápidamente hacia el
concepto de Sistema Distribuido, en el que las
operaciones de manejo de la base de datos se
encuentran
separadas
de
las
funciones
de
almacenamiento [3], no solo en términos de la
separación física y geográfica de las estaciones a partir
de las ventajas de un ambiente de trabajo en red donde
los recursos son compartidos, también en términos de
separación
lógica de las operaciones y el
almacenamiento de la BD en dichos computadores [7].
Este tipo de arquitectura se define como
Cliente/Servidor, pues son los clientes los que requieren
datos o servicios de procesamiento de servidores que
llevan a cabo las tareas (proveer servicios) para
satisfacerlos [3]. La mayoría de los SMBD hoy en día son
construidos a partir del concepto de sistemas de
procesamiento distribuido.
El aumento en poder de procesamiento en las
estaciones de usuario (microcomputadores), permitió
remplazar las terminales mudas, y llevar a cabo algunas
de las tareas de procesamiento en el lado del cliente,
pasando de un modelo centralizado o denominado de
Servidor pesado (Figura 7a) a un modelo de Cliente
pesado (Figuras 7b y 7c), existen también terminales de
usuario (workstations) que permiten la ejecución de
todos los procesos sobre los datos de la BD que se
encuentran disponibles de forma remota (Figura 7d).
Una extensión al modelo de dos niveles, es la
arquitectura de tres niveles (Three-tier architecture), su
principal característica es que las funciones en cada nivel
son independientes a la implementación. En esta
arquitectura las tareas de procesamiento de datos, pasan
desde el nivel del cliente al nivel de aplicaciones, pues el
servidor de aplicaciones es mucho más poderoso que los
clientes, lo que implica que no es necesario ahora contar
con costosas estaciones de trabajo con altas prestaciones
para dichas tareas. Esta arquitectura se define como
configuración de Cliente Ligero (Thin Client) (ver Figura
7e), y es la base de los actuales sistemas de bases de
datos basados en la web, donde una pequeña aplicación
del lado del cliente (web browser) permite el acceso a
servidores de aplicaciones y almacenamiento [7]. Es
común denominar a cada uno de los niveles de esta
arquitectura como: Nivel de Presentación, Lógica del
negocio y Servidor de datos [3].
Naturaleza de los datos.
A partir de las características de los datos, y desde una
perspectiva de las BD, los SMBD pueden categorizarse
como Espaciales y No-Espaciales [4]. Aunque este
aspecto en la evolución de los SMBD no implica un
“descubrimiento” y/o desarrollo reciente en la
abstracción y representación de la información
relacionada con el espacio, si ha generado una amplia
corriente de investigación y desarrollo en el manejo y
procesamiento en el campo de los SMBD en los últimos
25 años [12].
Los datos relacionados con fenómenos en una
determinada región en el espacio se denominan Datos
Espaciales [19], esta relación se establece a partir de un
atributo denominado Espacial, generalmente un
conjunto de pares de coordenadas [4] que definen su
posición y posiblemente su forma, orientación y tamaño
[6] Es mediante este atributo espacial que es posible
definir como el objeto es representado, su Geometría,
así como la forma en que un dato o conjunto de datos
espaciales se relacionan en el espacio, Topología.
Otras denominaciones asociadas al término datos
espaciales son: datos espacialmente referenciados [16],
datos geográficos [3], datos geográficamente
referenciados o datos geoespaciales [4]. En los dos
primeros términos, sin el uso del prefijo geo, se hace
referencia en un amplio sentido a objetos geométricos
(líneas, polígonos, puntos, cubos, etc) en un espacio
bidimensional o tridimensional definido para propósitos
específicos, como el diseño a gran escala (VLSI, realidad
virtual, diseño estructural, análisis molecular, etc) y la
biometría y . El empleo del prefijo geo, implica que los
datos están relacionados a la superficie terrestre o su
cercanía [3], a un espacio denominado geográfico, a
partir de un determinado sistemas de coordenadas
definido que permite su integración y operación [4].
Los datos No-Espaciales, también denominados
atributos, datos característicos o atributos descriptivos
[9] son datos sobre un fenómeno almacenados en la BD
que son independiente de las consideraciones
geométricas (aspatial data) [22], este tipo de datos es
por lo general de tipo alfanumérico.
Existe otro tipo de datos, que aunque poseen atributos
o características espaciales, estos no pueden ser
empleados directamente como información relacionada
a un espacio geográfico, y se suelen denominar Datos
Pseudoespaciales [4], como por ejemplo los datos sobre
la dirección en una ciudad, datos geográficos
alfanuméricos,
como
estadísticas
demográficas,
información censal etc, imágenes y/o fotografías. Estos
datos requieren ser convertidos a datos espacialmente
referenciados, procesos largos y por lo general costosos,
llevados a cabo mediante herramientas SIG denominados
respectivamente Geocodificacion y Georreferenciacion
[8].
Almacenamiento de los Datos Espaciales.
Representación de los Datos Espaciales.
La representación, almacenamiento y modelamiento
de las características espaciales de una entidad o
fenómeno es decir su atributo espacial, en una BD son
determinadas por la adopción de un modelo geométrico
discreto. Este proceso parte de un modelo de objetos
discretos, que representan con límites claramente
definidos ocurrencias espaciales de fenómenos o
categorías definidas por el observador [3]. En la figura 8,
cada ocurrencia o entidad (L1 o L2) representan un único
objeto espacialmente definido.
La descripción de las características espaciales
geométricas en un espacio
, generalmente asumiendo
que la dimensión d es 2, y que las coordenadas y
distancias son euclidianas [9], parte de un conjunto de
Primitivas [16] o Abstracciones [21] que permiten las
construcción de formas más complejas, mediante la
transformación de las propiedades espaciales en
propiedades de pares de numero reales [23]. La primitiva
fundamental, en términos geométricos es el Punto,
entidades 0-dimensionales únicamente descritas por sus
coordenadas geográficas x e y [9], [16], [19], [21], [23] y
[24], (ej: puntos P1 a P6 en la Figura 8); esta permite
representar en términos espaciales la ocurrencia de un
fenómeno sin importar su forma, o dependiendo de la
escala de abstracción áreas demasiado pequeñas respeto
al espacio que las contienen. Mediante la definición de la
relación de un conjunto siempre finito y secuenciado de
puntos, se establece la Línea [16] y [21], se utiliza
también términos como Polilínea [9] o de acuerdo al
Modelo Geométrico estándar para aplicaciones
geoespaciales definido por el Open Geospatial
Consortium (OGC) como Curva [24], elementos 1dimensionales que facilitan la descripción de atributos
espaciales de los objetos especialmente sus fronteras
(boundaries) [23], por ejemplo en la Figura 8 los puntos
P1 y P2 definen la línea A, los puntos P4 y P1 la línea G,
las líneas F y A conformarían la Polilinea FA. Un conjunto
finito de curvas, o una polilínea cerrada definen un
Polígono [23] y [9], Región [19] y [21], Área [16] o de
acuerdo con OGC una Superficie, como un elemento
geométrico 2-dimensional [24] y [17], que representa
una región del plano delimitado por su frontera
asimilable a entidades espaciales con una extensión y
área considerable, en la figura 8 las líneas A, B, C y G o en
otras palabras la polilinea ABCG forman el polígono L1.
Convencionalmente los SMBD fueron diseñados para el
almacenamiento y manejo de datos alfanuméricos
representados por cadenas de caracteres, valores
numéricos, fechas, valores booleanos o expresiones
lógicas, los SMBDR no cuentan con el adecuado soporte
para el almacenamiento y procesamiento de datos
espaciales como puntos, líneas y superficies [4], un
ejemplo como el presentado en la figura 8, con el único
propósito de servir como ilustración, y en el que el
atributo espacial definido por la geometría (polilinea) de
cada uno de los elementos de área se almacena en un
único atributo no podría definirse en un SMBDR, pues no
existe un tipo de dato polilinea definida para este
modelo de datos [12] y se estaría violando el concepto
de atomicidad, por ende no se cumpliría con la
estructura normalizada que todo esquema relacional
debe poseer [16].
El esquema planteado inicialmente para la solución de
estos inconvenientes consiste en una colección de tablas
relacionadas
en
el
SMBDR,
permitiendo
la
descomposición en valores atómicos del las primitivas
geométricas de los datos espaciales (ver Figura 9) [12],
aunque este esquema se fundamenta en la consulta y
acceso mediante SQL, las principales desventajas radican
en que se viola el principio de independencia de los
datos, lo que implica que las consultas sobre la
información requieren del conocimiento de la compleja
estructura y organización de los datos, estructura que
reduce la velocidad de acceso y consulta, dificultando
tambien la definición de nuevos tipos de datos espaciales
y la imposibilidad de expresar relaciones geométricas
como adyacencia o consultas espaciales [9], estructura
denominada por lo tanto como no-topológica [4].
Se plantea entonces para mediados de la década de
1980 la implementación un sistema hibrido, denominado
Base de Datos Geo-relacional, en este esquema los
datos que representan atributos no espaciales se
almacenan en un SMBDR, mientras que los datos
espaciales son almacenados de forma separada en
estructuras de almacenamiento generalmente de tipo
propietario que varían de acuerdo a la implementación
diseñada por cada vendedor para su acceso [4] y [16],
esta arquitectura aunque permite superar algunas de las
graves limitaciones del modelo relacional, implica que la
coexistencia de dos sistemas requiere la definición de
modelos de datos diferentes que pueden limitar el uso e
integración de estos, limitando la funcionalidad del
SMBD en procesos de consulta y optimización, por lo que
se denomina este enfoque como Débilmente Acoplado
(Loosely Coupled), esquema implementado en entornos
de procesamiento y análisis de datos espaciales como
ArcInfo desarrollado por ESRI, así como MGE y TiGRis de
Intergraph [9].
Como ya se había mencionado en 3.1.3, es mediante
un esquema Orientado a Objetos y Objeto Relacional que
las capacidades de almacenamiento de datos complejos
pueden implementarse en el SMBD mediante ADT
definidos como Tipos de Datos Espaciales (SDT Spatial
Data Types) que proporcionan a los SMBDOO y SMBDOR
las capacidades para el manejo y procesamiento de datos
espaciales. El estándar que permite la definición del
esquema de implementación y almacenamiento se llevo
a cabo gracias al trabajo de la comunidad (usuarios y
proveedores de datos, hardware y software con énfasis
espacial) representada por el OGC y bajo el auspicio del
Comité Internacional de Estándares (International
Standards Organization) ISO, y se implementa a partir de
modelo de geometría orientado a objetos descrito en el
OpenGIS Simple Feature Specification for SQL (ver Figura
10) [3] y [24].
Mediante esta especificación la Geometría de un
objeto es definida a partir de la composición de objetos
de tipo punto, línea y superficie y sus combinaciones o
agregaciones que permiten la definición de cualquier
objeto espacial, con un determinado sistema de
coordenadas y proyección.
GEODATABASE
“La Geodatabase es un modelo que permite el
almacenamiento físico de la informacióngeográfica”.
Consta de dos elementos fundamentales:
•
•
Un archivo de almacenamiento de información
geográfica, el cual se encuentra en un sistema
gestor de bases de datos relacionales (SGBDR);
como por ejemplo, Microsoft Access, Oracle,
Microsoft SQL, Server, IBM DB2 e informix.
Un modelo de datos, el cual contiene los objetos
con reglas y comportamientos específicos [25].
Las Geodatabase tiene elementos estructurales los
cuales son:
Feature Class: Representa un elemento espacial que
tiene atributos alfa numéricos, datos espaciales y
comportamiento.
Table Object: Objeto no espacial.
Feature Data Set: Agrupación conceptual de Feature
Class.
TIPOS DE GEODATABASE
Hay tres tipos de Geodatabase, los cuales dependen de la
arquitectura (como se almacena y la funcionalidad),
según el componente de almacenamiento de la
Geodatabase, estas se pueden clasificar en tres tipos:
1. Geodatabase Personal
Se almacena en una base de datos Microsoft Access,
permitiendo crear y editar elementos (relaciones
espaciales, redes geométricas, topología, etc.). No
soporta la edición en modo multiusuario, por ser
este una limitante del SGBDR. Puede almacenar
hasta 2 GB.
2. Geodatabase de Fichero
Implementada empleando exclusivamente ArcInfo,
ArcEditor y ArcView, emplea una estructura de
archivos, debido a que no esta implementada sobre
un sistema gestor de bases de datos. Admite un
único editor y no soporta el mecanismo de
versiones, tiene capacidad de almacenamiento
ilimitada (con un limite de 1 TB por tabla, ampliable
hasta 256 TB).
3. Geodatabase Empresarial (ArcSDE)
Implementada sobre SGBDR Empresariales, como
por ejemplo: Oracle Entreprise, SqlServer
Profesional, entre otras. La tecnologia ArcSDE y los
productos ArcGIS (ArcGIS Desktop y ArcGIS Server)
permiten almacenar información geográfica en
SGDB. La principal característica de este tipo de GDB,
es que emplea el Middleware ArcSDE para la gestión
espacial de los datos, conforme a esto, estas se
pueden clasificar según el ArcSDE que empleen en:
• Geodatabase Enterprise ArcSDE
Geodatabase tradicional con ArcSDE diseñada para
sistemas corporativos a gran escala. Puede estar
implementada sobre Oracle, Microsoft SQL Server
(2000 ó 2005), IBM DB2 ó IBM Informix; permite la
edición en modo multiusuario sin límites y el trabajo
con versiones.
Disponible con ArcGis Server
Enterprise.
• Geodatabase Workgroup ArcSDE
Está implementada sobre Microsoft SQL Server 2005
Express. Soporta funciones como versionado y
archivado. Diseñada para organizaciones con grupos
de usuarios de hasta diez personas en
lectura/edición. Tamaño Máximo de 4 GB por
Geodatabase. Disponible con el nivel Workgroup de
ArcGIS Server.
• Geodatabase Personal ArcSDE
Implementada sobre Microsoft SQL Server 2005
Express. Presenta un tamaño máximo de 4 GB por
Geodatabase y admite un máximo de cuatro
usuarios
(uno en edición); posee funcionalidad
avanzada como versionado, archivado y replicación
de la información[25].
Los modelos de datos que presenta ArcGIS están
constituidos en plantillas que permiten modelar y
capturar el comportamiento de los elementos del
mundo real en el interior de un Geodatabase. Estos
modelos poseen herramientas para que la
importación de datos en la Geodatabase sea rápida y
efectiva; además, están construidos bajo estándares
industriales que pueden ser modificados mediante
ArcEditor y ArcInfo satisfaciendo necesidades de
cada usuario [25].
MODELO DE DATOS GEOGRAFICOS
Un modelo de datos geográfico es una abstracción del
mundo real. Emplea un conjunto de objetos (dato) que
soporta el despliegue de mapas, consultas, edición y
análisis; los modelos de datos espaciales son:
ARQUITECTURA DE LA GEODATABASE
La arquitectura de la Geodatabase se basa en tres
aspectos fundamentales: SGBDR, Tecnología ArcSDE y
lógica de Negocio.
1. Almacenamiento en SGDBR
Los SGBDR proporcionan un modelo sencillo para
almacenar y gestionar la información en tablas
(almacenamiento de la información geográfica en
disco, definición de tipos de artículo, consultad o
transacciones multiusuario)
2. Tecnología ArcSDE
La tecnología ArcSDE está integrada en ArcGIS
Desktop y ArcGIS Server. Sirve como conexión entre
los clientes GIS y el SGBDR permitiendo a los
usuarios almacenar, acceder y gestionar la
información almacenada en el sistema gestor.
ArcSDE es imprescindible para usuarios que
necesiten versionado y transacciones largas cómo:
Trabajos con históricos, edición distribuida, entornos
de edición multiusuario.
3. Lógica de Negocio
La lógica de negocio permite implementar
elementos más complejos como feature class,
feature data sets, catálogos raster, topologías, redes,
etc. los cuales implementan y modelan el
comportamiento geográfico.
Esta lógica esta
implementada usando una combinación de
funcionalidad avanzada de SGBDR y ArcObjects.
1. Vector Data Model (Modelo de Datos Vectorial)
Representa la estructura de datos vectorial; los
elementos que posee son punto, línea y polígono y
los conceptos de topología que maneja están
relacionados con conectividad, longitud y dirección,
área y adyacencia.
2. Raster Data Model (Modelo de Datos Raster)
Representa la estructura por celdas o píxeles. Realiza
representación de puntos, líneas y polígonos en una
grilla la cual soporta datos discretos, continuos y no
datos.
3. 3. TIN Data Model (Modelo TIN)
Representado en superficies funcionales y modelos
sólidos.
Para muchas aplicaciones la forma vectorial de
representar los elementos geográficos es la que
presenta más precisión y conveniencia; existen
aplicaciones que requieren de formas de
representación Raster o TIN.
Los elementos geográficos
características ó cualidades:
presentan
ciertas
Forma de los Elementos:
En Geodatabase los elementos tienen un campo
espacial en el cual se almacena la geometría, la cual
puede ser de tres tipos: Puntos y Multipluntos,
Polilíneas y Polígonos (segmentos de línea
conectados, cerrados y que no se cortan)[27].
Referencia Espacial:
La Geometría de los elementos es almacenada
basada en valores X, Y en el sistema de coordenadas
cartesianas. La referencia espacial especifica como
las coordenadas X,Y de un conjunto de elementos es
proyectada sobre la superficie del planeta[27].
Atributos:
Los elementos geográficos mantienen atributos
como campos en tablas basados en un modelo
relacional, los atributos poseen las siguientes
características:
•
•
•
•
En Geodatabase la herencia se dá a partir
de atributos.
La herencia Múltiple no es soportada porque
genera ambigüedad, presentándose juego de
atributos múltiple.
A través de la herencia se factorizan atributos.
En Geodatabase todos los atributos son
públicos[26].
Subtipos:
Los elementos geográficos se agrupan en clases, la cual
es un conjunto homogéneo de elementos básicamente
del mismo tipo, aunque pueden tener variaciones
considerables. Los subtipos se pueden definir como una
disgregación lógica basada en atributos, algunas ventajas
de los subtipos son:
•
•
•
•
•
•
•
•
Relaciones consigo mismo.
Herencia múltiple.
Más de una relación entre dos clases.
La relación muchos a muchos presenta gran
dificultad en Geodatabase por lo tanto se debe
evitar al máximo.
Aspectos Importantes de las Relaciones:
•
•
•
Toda relación debe tener un nombre.
Las relaciones poseen valor etiquetados: Origin
Class (determina quien domina la relación),
Class Origin Primary Key (Cuál es la clase que
provee la llave primaria), Origin Foreign Key
(cómo se llama la llave foránea), Origin Primary
Key (cómo se llama la llave primaria).
Entre subtipos pueden existir relaciones
particulares, asociando elementos particulares.
Este tipo de relaciones es muy útil para modelar
redes utilizando la regla de conectividad.
•
Dominios
Son los valores válidos que pude tomar un atributo, en
Geodatabase existen tres tipos de dominio: valor, redes
geométricas y rango. Algunos aspectos fundamentales
son:
•
•
•
•
•
Evitan ingreso de datos erróneos en la base.
Permite un valor por defecto, inclusive para
cada subtipo.
Asegura una mayor compatibilidad y los datos.
Permiten crear reglas de unión y división.
Los dominios son obligatorios para los subtipos.
Topología:
Mayor expresividad en cuanto a su
clasificación temática.
Análisis del comportamiento de elementos
cuando se separan o reúnen.
Clasificación de objetos por atributos.
Facilidad de Administración[26]
Relaciones:
Todos los elementos geográficos mantienen relación con
algún otro objeto, ya sea espacial (ó geográfica) ó no; se
conocen como Relation Ship Class. En Geodatabase está
prohibido cierto tipo de relaciones:
Es un tipo muy específico de relación entre elementos
geográficos, la topología describe relaciones especiales
de adyacencia, coincidencia, conectividad, contenencia,
etc., en un mapa. En SIG permite análisis e integridad de
los datos. Se presentan dos tipos de topología: La
topología plana en 2D y Red Geométrica (Geometric
Network), utilizada para modelar redes geométricas.
Aspectos Generales de la Topología en Geodatabase:
•
•
Ayuda a mantener la integridad de los datos.
La topología no es almacenada en la Base de
Datos, es procesada por ArcMap ó ArcCatalogo.
Se almacena las propiedades errores y
excepciones.
•
•
•
La topología sólo se evalúa.
Las propiedades de la topología son: Los Feature
Class que participan, distancia de tolerancia,
rango y reglas topológicas.
La topología es considerada como un elemento
dentro de la Geodatabase enfocada a aspectos
geométricos en 2D.
IV. CONCLUSIONES
Los requerimientos definidos en la conceptualización del
modelo entidad relación determinan el tipo de SGBD a
desarrollar , es decir el tipo de información y los procesos
dentro del modelo determinan si se implanta una base
de datos tipo nativa, middleware o geodatabase.
Middleware
“El Middleware es un software de conectividad que
ofrece un conjunto de servicios que hacen posible el
funcionamiento de aplicaciones distribuidas sobre
plataformas heterogéneas. Funciona como una capa de
abstracción de software distribuida, que se sitúa entre
las capas de aplicaciones y las capas inferiores (sistema
operativo y red).
El Middleware nos abstrae de la complejidad y
heterogeneidad de las redes de comunicaciones
subyacentes, así como de los sistemas operativos y
lenguajes de programación, proporcionando una API
para la fácil programación y manejo de aplicaciones
distribuidas. Dependiendo del problema a resolver.
Tipos de Middleware
Las middleware se pueden clasificar de acuerdo a su
estabilidad y su tolerancia a fallos, una de estas
clasificaciones es SQL-oriented Data Access, el cual tiene
las siguientes características:
•
•
•
•
“Es un middleware que conecta aplicaciones con
motores de bases de datos.
Traduce SQL generico al SQL nativo de la BD a
otros lenguajes.
Segmento dominado por los fabricantes de
bases de datos.
La conexión suele se sincrónica” [32].
Por lo general el middleware del lado cliente está
implementado por el Sistema Operativo subyacente, el
cual posee las librerías que implementan todas las
funcionalidades para la comunicación a través de la red.”
[29].
“Middleware es una incorporación relativamente
reciente en la computación. Obtuvo popularidad en los
80 como una solución al problema de cómo conectar
nuevas aplicaciones con viejos sistemas. De todas
maneras el término ha sido usado desde 1968.
La elección del RDBMS depende de las necesidades y
características de la información que se quiere montar
sobre la base de datos espacial, es importante tener en
cuenta que cada una de estas tendencias en cuanto a
RDBMS presentan ventajas y desventajas que se deben
de evaluar con el usuario en el momento de empezar aha
implementar la base de datos espacial.
La mayoría de Las bases de datos espaciales soportan los
tipos de datos básicos de punto, línea y polígono.
Algunos añaden otros tipos de datos del estándar de
transferencia de datos espaciales (SDTS), como las
cadenas de área y de red, que funcionan bien en un
estándar de transferencia pero son cuestionables en un
sistema operacional. Cada producto introduce su propio
conjunto de operadores espaciales, difiriendo uno del
otro tanto en sintaxis como en semántica. Y cada uno de
ellos ofrecía lo que consideraba ser restricciones de
integridad espacial esenciales, como impedir que se
cruzaran los límites de un polígono.
REFERENCIAS
[1] Cisneros, Ines. Garcia Ductor, Carolina y Lozano
Jurado, Isabel M. ¿Sociedad de la información û sociedad
del
conocmiento?.
Disponible
en
http://tecnologiaedu.us.es/edutec/paginas/43.html.
[2] Longley, Paul. Goodchild, Michael F. Maguire, David
J. Rhind, David W. Editores. Geographical Information
Systems and Science. Segunda Edicion. John Wiley and
Sons, West Sussex, England 2005. 517 páginas.
[3] Yeung, Albert K.W. Hall, Brent G. Spatial Database
Systems, Design, Implementation and Project
Management. The GeoJournal Library, volume 87.
Springer. Dordrecht, The Netherlands. 2007. 545 páginas.
[4] Yeung, Albert K. Data Organization and Structure,
NCGIA
Core
Curriculum
in
GIScience,
http://www.ncgia.ucsb.edu/giscc/units/u051/u051.html,
publicado el 15 de Octubre de 1998. Consultado el 1 de
Noviembre de 2008.
[5] Meyer, Thomas H. Non-Spatial Databases Models,
NGCIA
Core
Curriculum
in
GIScience,
http://www.ncgia.ucsb.edu/giscc/units/u045/u045.html,
[6]
Wikimedia
Foundation.
Wikipedia,
La
Enciclopedia
Libre.
http://es.wikipedia.org/wiki/Wikipedia:Portada.
[7]
Adler. David W. IBM® DB2® Spatial Extender - Spatial
data within the RDBMS. Very Large Data Bases
Proceedings of the 27th International Conference on
Very Large Data Bases. Paginas: 687 - 690.
[8] Rigaux, Philippe. Scholl, Michel. Voisard, Agnès.
Spatial Databases With Application To Gis. Morgan
Kaufmann Publishers. San Francisco, EE.UU. 2002. 440
páginas.
[9] Weinberger, Jason. The Spatial RDBMS in the
Enterprise. Publicado el 13 de Octubre de 2001.
Directions
Magazine.
Disponible
en
http://www.directionsmag.com/article.php?article_id=2
59.
[10] Shekhar, Shashi. Xiong, Hui. Editores. Encyclopedia
of GIS. Springer-Verlag New York, EE.UU. 2008. 1377
páginas.
[11] Shekhar, Shashi. Chawla, Sanjay. Spatial Databases:
A Tour. Prentice Hall, EE.UU. 2003. 262 páginas.