Download FLINK: Semantic Web technology for the extraction and analysis of

Document related concepts

Semantically-Interlinked Online Communities wikipedia , lookup

SPARQL wikipedia , lookup

Web semántica wikipedia , lookup

Freebase wikipedia , lookup

FOAF wikipedia , lookup

Transcript
FLINK: Semantic Web
technology for the
extraction and analysis of
social networks
Tecnologías Emergentes en Sistemas Telemáticos
Máster MUITIC – UVA
José Antonio Barros Ramos

Año 2003 -> Web comienza a ser un espacio de
“socialización” para la mayoría de los usuarios.

Hay aplicaciones que permiten publicar un perfil
con información básica, enviar invitaciones y
vincular perfiles de amigos

Servicios de redes sociales
◦ Combinan:
 Redes sociales
 Compartición de contenidos
Introducción

Inconvenientes red social centralizada:
◦ Perfiles no exportables en formatos procesables por las
máquinas
◦ Los datos no pueden transferirse de un sistema a otro
◦ Poca capacidad de control de la información por parte de
los usuarios
Introducción

Tecnología de la Web Semántica
◦ Permite abordar los inconvenientes planteados
◦ Proyecto FOAF:
 Representación procesable de perfiles de usuarios
 Acuerdo sobre cómo describir los términos en un formato
semántico (OWL full)
 Integración de información obtenida de fuentes heterogéneas
Introducción

Es el resultado de un trabajo de doctorado relacionado con
“conectividad social” de los investigadores de la Web
Semántica

La información sobre el perfil y la red social está basada en
el análisis de páginas web, correos electrónicos y
publicaciones

Navegación por perfiles
◦ “Clicking”

La información acerca de los intereses de los
investigadores se utiliza para generar una ontología de la
comunidad de la Web Semántica
FLINK

Arquitectura
◦ Tres capas:
 Adquisición de metadatos
 Almacenamiento
 Visualización
FLINK. Diseño del sistema

Adquisición de Metadatos
◦ Diferentes tipos de fuentes: páginas HTML,
perfiles FOAF, colecciones de emails, datos
bibliográficos…
◦ Los perfiles FOAF se obtienen en dos pasos:
◦ 1. Un rastreador de RDF recoge los perfiles
◦ 2. Los perfiles FOAF encontrados se comparan con los
perfiles de los miembros de la comunidad destinataria
para filtrar los pertinentes perfiles de la colección
FLINK. Diseño del sistema

Adquisición de Metadatos
◦ Información de los emails:
 Se descargan de POP3 e IMAP
 Se captura la información relevante en formato
RDF
◦ Información bibliográfica:
 Usando Google Scholar
FLINK. Diseño del sistema

Almacenamiento
◦ La colección de datos RDF es almacenada en
un Sesame server.
◦ Se hace uso de reglas en el lenguage
◦ Escalabilidad:
 Sesame server ofrece un rendimiento muy alto en el
almacenamiento de datos en la escala de millones de
tripletas.
FLINK. Diseño del sistema

Visualización
◦ Aplicación Web en JAVA
◦ Servlets, JSP y JSTL son empleadas para
generar el front-end
◦ El interfaz de usuario ofrece funcionalidades de
exportación de datos
FLINK. Diseño del sistema

Nuestra “conectividad” social se está incrementando
últimamente.

Aparición primeros ordenadores… reemplazarían a los
humanos??

RETOS:
◦ Área del software social:
 Extracción, representación y agregación
del conocimiento social
◦ Creación de una “ontología social”
◦ Tecnología:
 Agregación: Falta de reglas de lenguaje e implementaciones
RDF
Conclusiones y Retos Futuros
[1]:Flink: Semantic technology for the extraction and social
networks . http://dx.doi.org/10.1016/j.websem.2005.05.006
[2]: Semantic Web Challenge: Flink.
http://www.informatik.uni-bremen.de/swc/flink.html
[3]: Friendster. http://www.friendster.com/info/index.php
Bibliografía
FIN