Download La Semántica como forma de integrar los sitios web sociales
Document related concepts
Transcript
Universidad ORT Uruguay Facultad de Ingeniería La Semántica como forma de integrar los sitios web sociales Entregado como requisito para la obtención del título de Licenciada en Análisis de Sistemas de Información Ana Estela 100998 Tutor: Julio Fernández 2008 Universidad ORT Uruguay Resumen En los últimos años la tendencia más notoria en la Web ha sido el surgimiento de sitios web que han facilitado significativamente la interacción entre las personas y promovido las relaciones sociales. A esta nueva generación de aplicaciones se la conoce como la Web Social. Este artículo pretende abordar la principal problemática que presenta la Web Social actual que consiste en la falta de integración entre los diversos sitios web sociales y describir la solución a esta problemática, la cual ha sido planteada por varios autores, y que se basa en la aplicación de tecnologías de la Web Semántica a la Web Social. Este trabajo está dirigido a todos los profesionales informáticos que tengan interés en la Web Semántica y su aplicación a la Web Social. 2 Universidad ORT Uruguay Índice 1. La Web Social y su situación actual 1.1. 1.2. 2. Surgimiento de la Web Social Problemática de la Web Social Actual La Web Semántica 2.1. ¿Qué es la Web Semántica? 2.2. Principales componentes de la Web Semántica. 2.2.1. Extensible Markup Language 2.2.2. Resource Description Framework 2.2.3. Ontologías 2.2.4. Agentes de Software 4 4 4 5 5 6 6 6 7 8 3. De Web Social a Web Social Semántica 8 4. Conclusiones 10 5. Bibliografía 11 3 Universidad ORT Uruguay 1. 1.1. La Web Social y su situación actual Surgimiento de la Web Social Varios autores, entre ellos Uldis Bojars & John Breslin (2008), Peter Mika (2004), J. Breslin & Stefan Decker (2007), han expresado que en los últimos años una de las tendencias más notorias en la Web ha sido el surgimiento de los sitios web sociales. Los sitios web sociales pueden describirse como aplicaciones web orientadas a facilitar la interacción entre las personas y promover sus relaciones sociales. Según Breslin et al. (2008) las comunidades online (grupo de personas con intereses en común que se conecta e intercambia información mediante el uso de aplicaciones web sociales), han remplazado la forma tradicional (bibliotecas y publicaciones) con la cual se mantenían informadas las comunidades. Han mejorado la comunicación e interacción debido a que proveen un espacio de colaboración online en el cual, los miembros, pueden encontrar información e ideas relevantes y a su vez compartirla con otros a través del sitio (Breslin et al., 2004). Las primeras aplicaciones web sociales en aparecer fueron los blogs, wikis y otras formas de comunicación y colaboración basada en la web. Luego, en el año 2003, surgieron las redes sociales online que si bien se caracterizan por tener el mismo contenido que las páginas web personales, proveen un punto central de acceso y traen estructura al proceso de intercambio de información y sociabilización online (Mika, 2007). Las redes sociales online tales como Friendster1, Facebook2, Linkedin3, MySpace4 entre otras, han capturado la atención de millones de usuarios (Breslin & Decker, 2007). Estos sitios permiten a los usuarios publicar un perfil con información básica, invitar a amigos e interconectar sus perfiles en el sito. Los usuarios pueden ver la red resultante de esas conexiones y de esa forma descubrir amigos en común y nuevos amigos en base a intereses comunes (Mika, 2004). 1.2. Problemática de la Web Social Actual A pesar de que la Web Social ha mejorado la forma en que las personas crean, reúnen y comparten la información, la principal problemática que presentan los sitios sociales es que se encuentran aislados unos de otros. Por ejemplo, pueden existir variados foros de discusión que contengan parte de la respuesta que una persona está buscando, pero las personas 1 www.friendster.com www.facebook.com 3 www.linkedin.com 4 www.myspace.com 2 4 Universidad ORT Uruguay participando en un foro no pueden acceder fácilmente a información relacionada en otros foros de discusión (Bojars et al., 2008). Mika (2004) señala la problemática existente en las redes sociales online en donde los perfiles almacenados en estos sitios no pueden ser exportados en formatos procesables por los ordenadores y como consecuencia la información no es portable a través de las diferentes redes sociales online. Según este autor, esta falta de portabilidad se volvió un problema luego de que surgieran varias alternativas de redes sociales online en la web y los usuarios tuvieran que reingresar su perfil y mantenerlo actualizado en forma independiente en los distintos sitios. Breslin & Decker (2007) plantean esta misma problemática de falta de integración, y agregan que los usuarios no solo deben reingresar su perfil sino que además deben redefinir sus conexiones cada vez que se registran en nuevos sitios y que por lo general, los usuarios tienen diversas identidades en distintas redes sociales. Según Bojars et al. (2008) la razón principal de esta falta de interoperabilidad es que en la mayor parte de la Web Social aún no existen estándares comunes para el intercambio e interoperación del conocimiento y la información. Bojars también afirma que el proyecto de la Web Semántica busca proveer las herramientas necesarias para definir estándares flexibles y extensivos que permitan el intercambio e interoperabilidad de la información. 2. La Web Semántica 2.1. ¿Qué es la Web Semántica? En el año 2001 Tim Berners-Lee, fundador de la Web y director del World Wide Web Consortium5 (W3C), publicó un artículo describiendo la evolución de la web actual, cuyo contenido se diseña principalmente para ser leído por humanos, a una web en donde los ordenadores puedan manipular la información en función de su significado (Berners-Lee et al., 2001). Berners-Lee ilustra su visión de la Web Semántica mediante un caso en el que usuarios de internet del futuro solicitan a un agente de software el establecimiento de citas con un fisioterapeuta. En este ejemplo se describe la posibilidad de mantener una interacción entre un usuario y un agente de software de forma tal de que el usuario exprese sus objetivos de búsqueda y el agente de software, en base a su propia iniciativa, elabore una estrategia de búsqueda y obtenga la información solicitada. 5 www.w3.org 5 Universidad ORT Uruguay Para Berners-Lee, la Web Semántica es una extensión de la Web actual en la cual se le da a la información un significado bien definido habilitando a las personas y a los ordenadores a trabajar cooperativamente (Berners-Lee et al., 2001). Berners-Lee afirma que un elemento fundamental para que la Web Semántica funcione es la representación del conocimiento. Los Ordenadores deben tener acceso a colecciones estructuradas de información y a conjuntos de reglas de inferencia para efectuar un razonamiento automatizado. Según el autor, el desafío de la Web Semántica es proveer un lenguaje que exprese tanto la información como las reglas para razonar sobre esa información y que posibilite que las reglas de cualquier sistema de representación del conocimiento puedan ser exportadas a la Web (Berners-Lee et al., 2001). Para Mika (2007) la idea de la Web Semántica es proveer conocimiento en un formato que permita a los ordenadores procesarlo fácilmente y realizar razonamientos. Este conocimiento puede ser información contenida en páginas web pero que es difícil de extraer o bien información adicional que puede ayudar a responder consultas en alguna forma. 2.2. Principales componentes de la Web Semántica. 2.2.1. Extensible Markup Language Para implementar la Web Semántica es necesario estructurar la información; para ello se utiliza Extensible Markup Language (XML)6. El lenguaje XML permite al usuario crear sus propias etiquetas (tags), las cuales pueden ser utilizadas por los scripts y programas (BernersLee et al., 2001). XML permite agregar una estructura arbitraria a los documentos pero no nos dice nada acerca del significado de dichas estructuras. Para poder expresar el significado es necesario utilizar el Framework de Descripción de Recursos (RDF de las siglas en inglés: Resource Description Framework) (Berners-Lee et al., 2001). 2.2.2. Resource Description Framework RDF es un lenguaje para representar información sobre los recursos en la Web. Está particularmente dirigido a representar metadatos sobre los recursos Web. Por ejemplo el título, autor y fecha de modificación de una página web. También puede usarse para representar información acerca de otros elementos que pueden ser identificados en la Web (W3 Consortium, 2004). El Lenguaje RDF está dirigido a situaciones en las cuales la información necesita ser procesada por aplicaciones; brinda un marco común para expresar la información de forma tal 6 Para mayor información sobre el Lenguaje XML referirse a: http://www.w3.org/TR/2000/REC-xml-20001006 6 Universidad ORT Uruguay de que pueda ser intercambiada por aplicaciones sin pérdida de significado (W3 Consortium, 2004). RDF se basa en la idea de identificar recursos mediante el uso de identificadores Web (URIs de las siglas en ingles: Uniform Resource Identifiers) y en la descripción de los recursos en base a propiedades y valores simples. En base a esto es posible representar los recursos, sus propiedades y valores mediante un grafico de nodos y arcos. RDF provee una sintaxis basada en XML, llamada RDF/XML, para el registro y distribución de estos gráficos (W3 Consortium, 2004). El uso de URIs asegura que los conceptos no son solo palabras en un documento, sino que están ligados a una única definición que todos pueden encontrar en la Web (Berners-Lee et al., 2001). 2.2.3. Ontologías El siguiente resumen sobre ontologías está basado en el trabajo de Tim Berners-Lee et al. (2001). Si bien mediante el uso de RDF y URIs es posible identificar los conceptos y ligarlos a una única definición, en la realidad puede suceder que distintas bases de datos utilicen distintos identificadores para un mismo concepto. Un programa que quiera comparar o combinar información de dos bases de datos necesita conocer que ambos términos son utilizados para referirse al mismo concepto. Este problema es solucionado mediante el uso de Ontologías. En Filosofía, una ontología es una teoría sobre la naturaleza de la existencia, de que tipos de cosas existen, la ontología como disciplina estudia dichas teorías. Los investigadores de la Inteligencia Artificial y la Web adoptaron el término refiriéndose a una ontología como un documento o archivo que define formalmente las relaciones entre los términos. Una ontología típica para la web está compuesta por una taxonomía y un conjunto de reglas de inferencias. La taxonomía define clases de objetos y las relaciones entre ellos. Las reglas de inferencia aumentan el potencial de las ontologías. Una ontología puede expresar la regla: “Si un código de ciudad está asociado a un código de estado y una dirección usa ese código de ciudad, entonces la dirección tiene asociado el código de estado”. Un programa puede deducir que la dirección de la Universidad Cornell, que es en Ítaca, debe estar en El estado de Nueva York, que está en Estados Unidos. La computadora realmente no entiende el significado de la información pero puede manipular los términos más eficientemente y en formas que son más útiles para el usuario. 7 Universidad ORT Uruguay 2.2.4. Agentes de Software Un elemento fundamental para comprobar el potencial de la Web Semántica son los Agentes de Software. Los Agentes de Software son programas que recolectan información de diversas fuentes, la procesan e intercambian resultados con otros programas. La efectividad de los agentes de software irá en aumento en la medida que aumente la disponibilidad de contenido web procesable por los ordenadores (Berners-Lee et al., 2001). 3. De Web Social a Web Social Semántica “La aplicación de tecnologías de la Web Semántica a la Web Social puede dirigirnos hacia una Web Social Semántica, creando una red de conocimiento interconectado y enriquecido semánticamente, y llevar a la Web Social a su máximo potencial” (Bojars et al., 2008) Actualmente los sitios web sociales y comunidades online se encuentran alojados en sistemas autónomos que no pueden ser integrados e interconectados debido a diferencias en las aplicaciones e interfaces. Como consecuencia, discusiones sobre temas relacionados pueden existir en diferentes sitios pero sus usuarios lo desconocen. Hay una gran cantidad de información relacionada que podría ser aprovechada por todos los sitios sociales, como por ejemplo, la información de los perfiles de miembros en común (Breslin et al., 2005). Varios autores afirman que esta falta de integración e interconexión entre los diversos sitios sociales puede ser resuelta mediante la aplicación de tecnologías de la Web Semántica a la Web Social (Breslin et al., 2004) (Breslin et al., 2005) (Breslin & Decker, 2007) (Mika, 2007) (Bojars et al., 2008) (Passant et al., 2008). Mediante el uso de formatos de Web Semántica previamente acordados (como por ejemplo RDF) junto con ontologías para describir personas, objetos y las conexiones que los unen, los sitios sociales pueden interoperar apelando a semánticas en común (Breslin & Decker, 2007) (Passant et al., 2008). Breslin et al. (2004) afirma que las tecnologías de la Web Semántica pueden usarse para enriquecer las comunidades online y para habilitar el acceso a la información tanto a las personas como a los agentes de software. Actualmente existen varias iniciativas de uso de tecnologías de la Web Semántica para incrementar la forma en que se crea, rehúsa e interconecta la información en los sitios web sociales. Estas iniciativas incluyen: • el proyecto FOAF7 (de las siglas en ingles: Friend Of A Friend). FOAF es un diccionario de clases y propiedades definidas mediante el uso de la tecnología RDF recomendada por el W3 Consortium. Fue creado con el objetivo de permitir la 7 www.foaf-project.org 8 Universidad ORT Uruguay integración de información a través de diversas aplicaciones, sitios web y sistemas de software y para ser utilizado con la gran variedad de herramientas y servicios que han sido creados para la Web Semántica (Brickley & Miller, 2007). • NEPOMUK Social Semantic Desktop8. Es una infraestructura de colaboración en grupo que posibilita la creación, intercambio y desarrollo de datos y metadatos. Permite que las personas y las comunidades colaboren directamente con sus pares reduciendo dramáticamente el tiempo que invierten en filtrar y archivar la información (Decker & Frank, 2004). • La ontología SIOC9 (de las siglas en ingles: Semantically Interlinked Online Communities). SIOC es una ontología para la Web Semántica que combina términos de vocabularios existentes, por ejemplo FOAF, junto con nuevos términos que son necesarios para describir relaciones entre conceptos en el mundo de las comunidades online. El objetivo de SIOC es interconectar las comunidades online (Breslin et al., 2004). Para Bojars et al.(2008) la aplicación de estructuras web semánticas tales como SIOC y FOAF a la Web Social pueden llevar a la creación de una Web Social Semántica creando una red de conocimiento interconectado y enriquecido semánticamente. Esta visión del autor se ilustra en la figura 1. Figura 1. La Web Social Semántica (Bojars et al., 2008) 8 9 nepomuk.semanticdesktop.org www.sioc-project.org 9 Universidad ORT Uruguay 4. Conclusiones Los sitios web sociales han mejorado significativamente la forma en que las personas interactúan e intercambian información en la web. A pesar de esta mejoría, la falta de integración entre los diversos sitios sociales no ha permitido aprovechar al máximo el potencial de la Web Social. Mediante la aplicación de tecnologías de la Web Semántica, tales como RDF y Ontologías, es posible lograr la interconexión de los diversos sitios sociales y mejorar la forma en que se crea e intercambia la información. En la actualidad existen varios proyectos avocados a la aplicación de tecnologías de la Web Semántica a la Web Social, entre ellos, el vocabulario FOAF, la ontología SIOC, etc. En función de la investigación bibliográfica realizada se concluye que la aplicación de tecnologías de la Web Semántica a la Web Social puede lograr la integración de los diversos sitios web sociales y crear una red de conocimiento compartido y enriquecido semánticamente, lo que esta de acuerdo con el pensamiento de Bojars et al. (2008). 10 Universidad ORT Uruguay 5. Bibliografía Berners-Lee, T., Hendler, J. & Lassila, O. (2001). The Semantic Web. Scientific American, 284, pp. 34-43. Bojars, U., Breslin, J., Peristeras, V., Tummarello, G. & Decker, S. (2008). Interlinking the Social Web with Semantics. Intelligent Systems IEEE, 23, pp. 29-40. Breslin, G., Harth, A., Bojars, U. & Decker, S. (2005). Towards Semantically-Interlinked Online Communities. The UPGRADE European Journal for the Informatics Professional, 6. Breslin, J. & Decker, S. (2007). The Future of Social Networks on the Internet: The Needs For Semantics. IEEE Internet Computing, 11, pp. 86-90. Breslin, J., Decker, S., Harth, A. & O'Murchu, I. (2004). Linking Semantically Enabled Online Communitiy Sites. Proceedings of the 1st Workshop on Friend of a Friend, Social Networking and the (Semantic) Web (FOAF Galway), Galway, Ireland, pp. 19-29. Brickley, D. & Miller, http://xmlns.com/foaf/spec/. L. (2007). FOAF Vocabulary Specification 0.91. Decker, S. & Frank, M. (2004). The Social Semantic Desktop. Tech. Report, Digital Enterprise Research Institute. Mika, P. (2004). Social Networks and the Semantic Web. In , Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence (pp. 285-291 ). Mika, P. (2007). Social Networks and the Semantic Web. In , Semantic Web and Beyond. : Springer. p. 234. Miller, E & Manola, L (eds.). http://www.w3.org/TR/rdf-primer/. (2004). RDF Primer. WC3 Recommendation. Passant, A., Bojars, U., Breslin, J. & Decker, S. (2008). Social Network and Data Portability using Semantic Web Technologies. In , 2nd Workshop on Social Aspects of the web (SAW 2008) (pp. pp. 5-19). :Departamento de Sistemas de Información, Universidad de Economía de Poznan. 11