Download La Semántica como forma de integrar los sitios web sociales

Document related concepts

Semantically-Interlinked Online Communities wikipedia , lookup

Web semántica wikipedia , lookup

Web 2.0 wikipedia , lookup

HTML semántico wikipedia , lookup

Datos enlazados wikipedia , lookup

Transcript
Universidad ORT Uruguay
Facultad de Ingeniería
La Semántica como forma de
integrar los sitios web
sociales
Entregado como requisito para la obtención del título de
Licenciada en Análisis de Sistemas de Información
Ana Estela 100998
Tutor: Julio Fernández
2008
Universidad ORT Uruguay
Resumen
En los últimos años la tendencia más notoria en la Web ha sido el surgimiento de sitios web
que han facilitado significativamente la interacción entre las personas y promovido las
relaciones sociales. A esta nueva generación de aplicaciones se la conoce como la Web
Social. Este artículo pretende abordar la principal problemática que presenta la Web Social
actual que consiste en la falta de integración entre los diversos sitios web sociales y describir
la solución a esta problemática, la cual ha sido planteada por varios autores, y que se basa en
la aplicación de tecnologías de la Web Semántica a la Web Social.
Este trabajo está dirigido a todos los profesionales informáticos que tengan interés en la Web
Semántica y su aplicación a la Web Social.
2
Universidad ORT Uruguay
Índice
1.
La Web Social y su situación actual
1.1.
1.2.
2.
Surgimiento de la Web Social
Problemática de la Web Social Actual
La Web Semántica
2.1.
¿Qué es la Web Semántica?
2.2.
Principales componentes de la Web Semántica.
2.2.1. Extensible Markup Language
2.2.2. Resource Description Framework
2.2.3. Ontologías
2.2.4. Agentes de Software
4
4
4
5
5
6
6
6
7
8
3.
De Web Social a Web Social Semántica
8
4.
Conclusiones
10
5.
Bibliografía
11
3
Universidad ORT Uruguay
1.
1.1.
La Web Social y su situación actual
Surgimiento de la Web Social
Varios autores, entre ellos Uldis Bojars & John Breslin (2008), Peter Mika (2004), J. Breslin
& Stefan Decker (2007), han expresado que en los últimos años una de las tendencias más
notorias en la Web ha sido el surgimiento de los sitios web sociales. Los sitios web sociales
pueden describirse como aplicaciones web orientadas a facilitar la interacción entre las
personas y promover sus relaciones sociales.
Según Breslin et al. (2008) las comunidades online (grupo de personas con intereses en
común que se conecta e intercambia información mediante el uso de aplicaciones web
sociales), han remplazado la forma tradicional (bibliotecas y publicaciones) con la cual se
mantenían informadas las comunidades. Han mejorado la comunicación e interacción debido
a que proveen un espacio de colaboración online en el cual, los miembros, pueden encontrar
información e ideas relevantes y a su vez compartirla con otros a través del sitio (Breslin et
al., 2004).
Las primeras aplicaciones web sociales en aparecer fueron los blogs, wikis y otras formas de
comunicación y colaboración basada en la web. Luego, en el año 2003, surgieron las redes
sociales online que si bien se caracterizan por tener el mismo contenido que las páginas web
personales, proveen un punto central de acceso y traen estructura al proceso de intercambio
de información y sociabilización online (Mika, 2007).
Las redes sociales online tales como Friendster1, Facebook2, Linkedin3, MySpace4 entre otras,
han capturado la atención de millones de usuarios (Breslin & Decker, 2007). Estos sitios
permiten a los usuarios publicar un perfil con información básica, invitar a amigos e
interconectar sus perfiles en el sito. Los usuarios pueden ver la red resultante de esas
conexiones y de esa forma descubrir amigos en común y nuevos amigos en base a intereses
comunes (Mika, 2004).
1.2.
Problemática de la Web Social Actual
A pesar de que la Web Social ha mejorado la forma en que las personas crean, reúnen y
comparten la información, la principal problemática que presentan los sitios sociales es que se
encuentran aislados unos de otros. Por ejemplo, pueden existir variados foros de discusión
que contengan parte de la respuesta que una persona está buscando, pero las personas
1
www.friendster.com
www.facebook.com
3
www.linkedin.com
4
www.myspace.com
2
4
Universidad ORT Uruguay
participando en un foro no pueden acceder fácilmente a información relacionada en otros
foros de discusión (Bojars et al., 2008).
Mika (2004) señala la problemática existente en las redes sociales online en donde los perfiles
almacenados en estos sitios no pueden ser exportados en formatos procesables por los
ordenadores y como consecuencia la información no es portable a través de las diferentes
redes sociales online.
Según este autor, esta falta de portabilidad se volvió un problema luego de que surgieran
varias alternativas de redes sociales online en la web y los usuarios tuvieran que reingresar su
perfil y mantenerlo actualizado en forma independiente en los distintos sitios.
Breslin & Decker (2007) plantean esta misma problemática de falta de integración, y agregan
que los usuarios no solo deben reingresar su perfil sino que además deben redefinir sus
conexiones cada vez que se registran en nuevos sitios y que por lo general, los usuarios tienen
diversas identidades en distintas redes sociales.
Según Bojars et al. (2008) la razón principal de esta falta de interoperabilidad es que en la
mayor parte de la Web Social aún no existen estándares comunes para el intercambio e
interoperación del conocimiento y la información. Bojars también afirma que el proyecto de
la Web Semántica busca proveer las herramientas necesarias para definir estándares flexibles
y extensivos que permitan el intercambio e interoperabilidad de la información.
2.
La Web Semántica
2.1.
¿Qué es la Web Semántica?
En el año 2001 Tim Berners-Lee, fundador de la Web y director del World Wide Web
Consortium5 (W3C), publicó un artículo describiendo la evolución de la web actual, cuyo
contenido se diseña principalmente para ser leído por humanos, a una web en donde los
ordenadores puedan manipular la información en función de su significado (Berners-Lee et
al., 2001).
Berners-Lee ilustra su visión de la Web Semántica mediante un caso en el que usuarios de
internet del futuro solicitan a un agente de software el establecimiento de citas con un
fisioterapeuta. En este ejemplo se describe la posibilidad de mantener una interacción entre un
usuario y un agente de software de forma tal de que el usuario exprese sus objetivos de
búsqueda y el agente de software, en base a su propia iniciativa, elabore una estrategia de
búsqueda y obtenga la información solicitada.
5
www.w3.org
5
Universidad ORT Uruguay
Para Berners-Lee, la Web Semántica es una extensión de la Web actual en la cual se le da a la
información un significado bien definido habilitando a las personas y a los ordenadores a
trabajar cooperativamente (Berners-Lee et al., 2001).
Berners-Lee afirma que un elemento fundamental para que la Web Semántica funcione es la
representación del conocimiento. Los Ordenadores deben tener acceso a colecciones
estructuradas de información y a conjuntos de reglas de inferencia para efectuar un
razonamiento automatizado.
Según el autor, el desafío de la Web Semántica es proveer un lenguaje que exprese tanto la
información como las reglas para razonar sobre esa información y que posibilite que las reglas
de cualquier sistema de representación del conocimiento puedan ser exportadas a la Web
(Berners-Lee et al., 2001).
Para Mika (2007) la idea de la Web Semántica es proveer conocimiento en un formato que
permita a los ordenadores procesarlo fácilmente y realizar razonamientos. Este conocimiento
puede ser información contenida en páginas web pero que es difícil de extraer o bien
información adicional que puede ayudar a responder consultas en alguna forma.
2.2.
Principales componentes de la Web Semántica.
2.2.1. Extensible Markup Language
Para implementar la Web Semántica es necesario estructurar la información; para ello se
utiliza Extensible Markup Language (XML)6. El lenguaje XML permite al usuario crear sus
propias etiquetas (tags), las cuales pueden ser utilizadas por los scripts y programas (BernersLee et al., 2001).
XML permite agregar una estructura arbitraria a los documentos pero no nos dice nada acerca
del significado de dichas estructuras. Para poder expresar el significado es necesario utilizar el
Framework de Descripción de Recursos (RDF de las siglas en inglés: Resource Description
Framework) (Berners-Lee et al., 2001).
2.2.2. Resource Description Framework
RDF es un lenguaje para representar información sobre los recursos en la Web. Está
particularmente dirigido a representar metadatos sobre los recursos Web. Por ejemplo el
título, autor y fecha de modificación de una página web. También puede usarse para
representar información acerca de otros elementos que pueden ser identificados en la Web
(W3 Consortium, 2004).
El Lenguaje RDF está dirigido a situaciones en las cuales la información necesita ser
procesada por aplicaciones; brinda un marco común para expresar la información de forma tal
6
Para mayor información sobre el Lenguaje XML referirse a:
http://www.w3.org/TR/2000/REC-xml-20001006
6
Universidad ORT Uruguay
de que pueda ser intercambiada por aplicaciones sin pérdida de significado (W3 Consortium,
2004).
RDF se basa en la idea de identificar recursos mediante el uso de identificadores Web (URIs
de las siglas en ingles: Uniform Resource Identifiers) y en la descripción de los recursos en
base a propiedades y valores simples. En base a esto es posible representar los recursos, sus
propiedades y valores mediante un grafico de nodos y arcos. RDF provee una sintaxis basada
en XML, llamada RDF/XML, para el registro y distribución de estos gráficos (W3
Consortium, 2004).
El uso de URIs asegura que los conceptos no son solo palabras en un documento, sino que
están ligados a una única definición que todos pueden encontrar en la Web (Berners-Lee et
al., 2001).
2.2.3. Ontologías
El siguiente resumen sobre ontologías está basado en el trabajo de Tim Berners-Lee et al.
(2001).
Si bien mediante el uso de RDF y URIs es posible identificar los conceptos y ligarlos a una
única definición, en la realidad puede suceder que distintas bases de datos utilicen distintos
identificadores para un mismo concepto. Un programa que quiera comparar o combinar
información de dos bases de datos necesita conocer que ambos términos son utilizados para
referirse al mismo concepto. Este problema es solucionado mediante el uso de Ontologías.
En Filosofía, una ontología es una teoría sobre la naturaleza de la existencia, de que tipos de
cosas existen, la ontología como disciplina estudia dichas teorías. Los investigadores de la
Inteligencia Artificial y la Web adoptaron el término refiriéndose a una ontología como un
documento o archivo que define formalmente las relaciones entre los términos.
Una ontología típica para la web está compuesta por una taxonomía y un conjunto de reglas
de inferencias. La taxonomía define clases de objetos y las relaciones entre ellos. Las reglas
de inferencia aumentan el potencial de las ontologías.
Una ontología puede expresar la regla: “Si un código de ciudad está asociado a un código de
estado y una dirección usa ese código de ciudad, entonces la dirección tiene asociado el
código de estado”. Un programa puede deducir que la dirección de la Universidad Cornell,
que es en Ítaca, debe estar en El estado de Nueva York, que está en Estados Unidos. La
computadora realmente no entiende el significado de la información pero puede manipular los
términos más eficientemente y en formas que son más útiles para el usuario.
7
Universidad ORT Uruguay
2.2.4. Agentes de Software
Un elemento fundamental para comprobar el potencial de la Web Semántica son los Agentes
de Software. Los Agentes de Software son programas que recolectan información de diversas
fuentes, la procesan e intercambian resultados con otros programas. La efectividad de los
agentes de software irá en aumento en la medida que aumente la disponibilidad de contenido
web procesable por los ordenadores (Berners-Lee et al., 2001).
3.
De Web Social a Web Social Semántica
“La aplicación de tecnologías de la Web Semántica a la Web Social puede dirigirnos hacia una Web
Social Semántica, creando una red de conocimiento interconectado y enriquecido semánticamente, y
llevar a la Web Social a su máximo potencial” (Bojars et al., 2008)
Actualmente los sitios web sociales y comunidades online se encuentran alojados en sistemas
autónomos que no pueden ser integrados e interconectados debido a diferencias en las
aplicaciones e interfaces. Como consecuencia, discusiones sobre temas relacionados pueden
existir en diferentes sitios pero sus usuarios lo desconocen. Hay una gran cantidad de
información relacionada que podría ser aprovechada por todos los sitios sociales, como por
ejemplo, la información de los perfiles de miembros en común (Breslin et al., 2005).
Varios autores afirman que esta falta de integración e interconexión entre los diversos sitios
sociales puede ser resuelta mediante la aplicación de tecnologías de la Web Semántica a la
Web Social (Breslin et al., 2004) (Breslin et al., 2005) (Breslin & Decker, 2007) (Mika, 2007)
(Bojars et al., 2008) (Passant et al., 2008).
Mediante el uso de formatos de Web Semántica previamente acordados (como por ejemplo
RDF) junto con ontologías para describir personas, objetos y las conexiones que los unen, los
sitios sociales pueden interoperar apelando a semánticas en común (Breslin & Decker, 2007)
(Passant et al., 2008).
Breslin et al. (2004) afirma que las tecnologías de la Web Semántica pueden usarse para
enriquecer las comunidades online y para habilitar el acceso a la información tanto a las
personas como a los agentes de software.
Actualmente existen varias iniciativas de uso de tecnologías de la Web Semántica para
incrementar la forma en que se crea, rehúsa e interconecta la información en los sitios web
sociales. Estas iniciativas incluyen:
• el proyecto FOAF7 (de las siglas en ingles: Friend Of A Friend). FOAF es un
diccionario de clases y propiedades definidas mediante el uso de la tecnología RDF
recomendada por el W3 Consortium. Fue creado con el objetivo de permitir la
7
www.foaf-project.org
8
Universidad ORT Uruguay
integración de información a través de diversas aplicaciones, sitios web y sistemas de
software y para ser utilizado con la gran variedad de herramientas y servicios que han
sido creados para la Web Semántica (Brickley & Miller, 2007).
• NEPOMUK Social Semantic Desktop8. Es una infraestructura de colaboración en
grupo que posibilita la creación, intercambio y desarrollo de datos y metadatos.
Permite que las personas y las comunidades colaboren directamente con sus pares
reduciendo dramáticamente el tiempo que invierten en filtrar y archivar la
información (Decker & Frank, 2004).
• La ontología SIOC9 (de las siglas en ingles: Semantically Interlinked Online
Communities). SIOC es una ontología para la Web Semántica que combina términos
de vocabularios existentes, por ejemplo FOAF, junto con nuevos términos que son
necesarios para describir relaciones entre conceptos en el mundo de las comunidades
online. El objetivo de SIOC es interconectar las comunidades online (Breslin et al.,
2004).
Para Bojars et al.(2008) la aplicación de estructuras web semánticas tales como SIOC y
FOAF a la Web Social pueden llevar a la creación de una Web Social Semántica creando una
red de conocimiento interconectado y enriquecido semánticamente. Esta visión del autor se
ilustra en la figura 1.
Figura 1. La Web Social Semántica (Bojars et al., 2008)
8
9
nepomuk.semanticdesktop.org
www.sioc-project.org
9
Universidad ORT Uruguay
4.
Conclusiones
Los sitios web sociales han mejorado significativamente la forma en que las personas
interactúan e intercambian información en la web. A pesar de esta mejoría, la falta de
integración entre los diversos sitios sociales no ha permitido aprovechar al máximo el
potencial de la Web Social.
Mediante la aplicación de tecnologías de la Web Semántica, tales como RDF y Ontologías,
es posible lograr la interconexión de los diversos sitios sociales y mejorar la forma en que se
crea e intercambia la información. En la actualidad existen varios proyectos avocados a la
aplicación de tecnologías de la Web Semántica a la Web Social, entre ellos, el vocabulario
FOAF, la ontología SIOC, etc.
En función de la investigación bibliográfica realizada se concluye que la aplicación de
tecnologías de la Web Semántica a la Web Social puede lograr la integración de los diversos
sitios web sociales y crear una red de conocimiento compartido
y enriquecido
semánticamente, lo que esta de acuerdo con el pensamiento de Bojars et al. (2008).
10
Universidad ORT Uruguay
5. Bibliografía
Berners-Lee, T., Hendler, J. & Lassila, O. (2001). The Semantic Web. Scientific American,
284, pp. 34-43.
Bojars, U., Breslin, J., Peristeras, V., Tummarello, G. & Decker, S. (2008). Interlinking the
Social Web with Semantics. Intelligent Systems IEEE, 23, pp. 29-40.
Breslin, G., Harth, A., Bojars, U. & Decker, S. (2005). Towards Semantically-Interlinked
Online Communities. The UPGRADE European Journal for the Informatics Professional, 6.
Breslin, J. & Decker, S. (2007). The Future of Social Networks on the Internet: The Needs
For Semantics. IEEE Internet Computing, 11, pp. 86-90.
Breslin, J., Decker, S., Harth, A. & O'Murchu, I. (2004). Linking Semantically Enabled
Online Communitiy Sites. Proceedings of the 1st Workshop on Friend of a Friend, Social
Networking and the (Semantic) Web (FOAF Galway), Galway, Ireland, pp. 19-29.
Brickley, D. & Miller,
http://xmlns.com/foaf/spec/.
L.
(2007).
FOAF
Vocabulary
Specification
0.91.
Decker, S. & Frank, M. (2004). The Social Semantic Desktop. Tech. Report, Digital
Enterprise Research Institute.
Mika, P. (2004). Social Networks and the Semantic Web. In , Proceedings of the
IEEE/WIC/ACM International Conference on Web Intelligence (pp. 285-291 ).
Mika, P. (2007). Social Networks and the Semantic Web. In , Semantic Web and Beyond. :
Springer. p. 234.
Miller, E & Manola, L (eds.).
http://www.w3.org/TR/rdf-primer/.
(2004). RDF Primer. WC3 Recommendation.
Passant, A., Bojars, U., Breslin, J. & Decker, S. (2008). Social Network and Data Portability
using Semantic Web Technologies. In , 2nd Workshop on Social Aspects of the web (SAW
2008) (pp. pp. 5-19). :Departamento de Sistemas de Información, Universidad de Economía
de Poznan.
11