Download Servidor Complutense de E-prints

Document related concepts
Transcript
E-PrintsUCM
Víctor Manuel Herreros Villanueva
Departamento de Automatización de la Biblioteca
Servicio Informático de Apoyo a la Docencia e Investigación
Marzo de 2005
Estructura de la presentación
z Definiciones clave
z Criterios para la elección de sistemas de
software que provean un servidor de
publicaciones electrónicas
z Requisitos del sistema
z Características del sistema GNU EPrints
z Ejemplos de la flexibilidad del sistema
z Perspectivas de futuro
z Breve recorrido por nuestra instalación
Definiciones clave
zE-print o publicación electrónica
zOpen Archives Initiative (OAI)
Definiciones clave
z E-print o publicación electrónica
Los e-prints son copias electrónicas de artículos de
investigación académica. Pueden adoptar la forma de preprints (artículos antes de haber sido revisados por un comité
científico) o post-prints (tras haber sido revisados). Pueden
ser artículos de revistas, conferencias, capítulos de libros o
cualquier otro producto resultado de investigación. Un archivo
de e-prints es sencillamente un repositorio on-line de estos
materiales. Usualmente se pone a disposición a través de la
web de un modo gratuito al objeto de asegurar la mayor
diseminación posible de sus contenidos.
Definiciones clave
zOpen Archives Initiative (OAI)
La iniciativa de archivos abiertos u OAI “desarrolla y
promueve estándares de interoperabilidad que
pretenden facilitar la diseminación eficiente del
contenido”. En el núcleo de este trabajo se sitúa el
protocolo de recolección de datos OAI-MH, que permite
la recolección de metadatos procedentes de archivos de
e-prints y su centralización en una base de datos
consultable. Los metadatos recolectados siguen el
estándar formal Dublin Core.
Definiciones clave
zE-print o publicación electrónica
zOpen Archives Initiative (OAI)
Sobre el respeto a estos dos conceptos se apoya el
sistema que se va a describir a continuación, y que
constituye el servidor de publicaciones electrónicas de
la Universidad Complutense de Madrid (E-PrintsUCM).
Debe ser visto, empleando la terminología utilizada en
OAI, como un proveedor de datos y a la vez como un
proveedor de servicios, pues ofrece metadatos para
recolectores externos y habilita al usuario final para
realizar búsquedas particulares.
Criterios para la elección de software
de publicaciones electrónicas
z Disponible públicamente y actualizado regularmente
z Disponible gratuitamente y libremente modificable y
redistribuible
z Compatible con la última versión de los protocolos de
recolección de datos OAI
ARNO
CDSware
Dspace
Eprints
Fedora
i-Tor
MyCoRe
Criterios para la elección de software
de publicaciones electrónicas
z Eprints tiene un mayor conjunto de instalaciones que el
resto de sistemas. Está desarrollado por la Universidad de
Southampton. Su primera versión (1.0) data de Noviembre
de 2000. La versión actual es la 2.3.10. Ofrece un intensivo
apoyo a través de la red a los nuevos implementadores, y
puede ser puesto en funcionamiento relativamente rápido y
con un mínimo de conocimientos técnicos. Sobre este
sistema con funcionalidades básicas, pueden integrarse de
un modo sencillo características avanzadas. Permite almacenar un número
en la práctica ilimitado de publicaciones electrónicas. En el momento actual,
en nuestro servidor hay 1440 publicaciones electrónicas, correspondientes en
su mayoría a tesis doctorales defendidas en la UCM durante el período 19912000. Esta colección responde a la intención de ofrecer un servidor de eprints con contenido lo suficientemente atractivo como para que nuestra
comunidad investigadora comience a utilizarlo no sólo en modo consulta sino
como depósito institucional de artículos sensu lato.
Criterios para la elección de software
de publicaciones electrónicas
z Además, está basado en PERL – Apache – MySQL
sobre plataformas tipo Unix, entorno en el que
poseemos un conocimiento suficiente como para adaptar
el software a nuestras necesidades.
Requisitos del sistema
z Hardware capaz de soportar un sistema operativo GNU/Linux o
similar, a partir de procesadores Pentium II
z Sistema operativo de tipo GNU/Linux o similar (RedHat, Debian,
SuSE, Solaris, Mac OS X)
z Servidor web Apache
z Intérprete de lenguaje de programación PERL y un reducido número
de módulos adicionales para este lenguaje
z Módulo mod_perl para Apache
z Gestor de bases de datos MySQL
z Software Eprints
¾ Es de destacar que todos los requisitos software se distribuyen de
modo gratuito, y que el coste de la plataforma hardware mínima es
ínfimo.
Características de EPrints
z Desarrollo en continua evolución
z Flexibilidad en la configuración
z Puede almacenar documentos en cualquier formato, inclusive para
un mismo e-print
z Se puede emplear cualquier esquema de metadatos
z Los e-prints pueden encuadrarse dentro de una jerarquía de
materias expandible
z Los e-prints pueden remitirse al archivo a través de una sencilla
interfaz web, bien procedentes de archivos locales o de URLs
remotas
z Los autores también pueden tener asociada una serie de metadatos
Características de EPrints
z Los trabajos remitidos deben superar un proceso de moderación
para asegurar un nivel mínimo de calidad (formal y/o de contenido).
Este proceso se ejecuta mediante interfaz web
z Se contempla la indexación a texto completo de documentos en los
siguientes formatos: ASCII, HTML, PDF, Word, LaTeX
z Se contempla el uso de motores externos de búsqueda, como
Google
z Uso opcional de HTTPS en áreas restringidas
z Exportación/importación de metadatos de e-prints, usuarios y
materias en formato XML
z Configuración de la interfaz web mediante XHTML
z La intervención del administrador del sistema, una vez configurado
y adaptado éste, es mínima
Flexibilidad de EPrints
Las características que se han adaptado a las peculiaridades de
nuestro entorno son:
z Posibilidad de almacenar los ficheros en una red de
almacenamiento remoto y los metadatos de las mismas en el propio
servidor de e-prints
z Posibilidad de almacenar e-prints compuestos sólo de metadatos
z Posibilidad de realizar cargas masivas de e-prints a partir de
registros bibliográficos extraídos del catálogo USMARC de la BUC,
empleando XML como lenguaje formal de intercambio de datos
z Personalización de la interfaz web de usuario para adaptarse a la
hoja de estilos empleada en el sitio web de la BUC y para mostrar
una disposición acorde con el resto del sitio web de la BUC
z Interfaz web multilingüe
Flexibilidad de EPrints
Las características que se han adaptado a las peculiaridades de
nuestro entorno son:
z Posibilidad de instalar varios archivos de e-prints en un mismo
servidor
z Administración distribuida geográfica y temáticamente de los
usuarios administradores, ideal para el esquema funcional de la
biblioteca complutense
z Empleo del listado de encabezamientos de materias utilizados en la
BUC
z Creación de tipos de e-prints a la medida de las necesidades de la
BUC
z Creación de metadatos personalizados para cada tipo de e-print, a
partir del esquema básico conforme a Dublin Core
Perspectivas de futuro
Trabajos a realizar a corto plazo
1.
2.
3.
4.
5.
Migración de la plataforma actual (Linux Suse 9.0) a un entorno
plenamente soportado por nuestros servicios infraestructurales
informáticos (Solaris 8)
Integración con la cadena de producción de tesis doctorales digitalizadas
procedentes de nuestro servicio de publicaciones
Incremento del volumen de la colección de publicaciones electrónicas
con la incorporación de otros tipos
Labor de difusión del servicio, en una primera instancia entre nuestra
comunidad universitaria y más adelante en entornos más ambiciosos
Registro del servicio E-PrintsUCM como proveedor de datos acorde con
OAI, para proporcionar un amplio contexto de búsquedas más allá de la
Universidad Complutense de Madrid
Nuestra instalación
Recorrido por las características básicas de la implementación de
E-PrintsUCM
z
z
z
z
z
z
z
z
Indices (Año / Materia / Facultades / Autor)
Búsqueda simple
Búsqueda avanzada
Registro de usuarios
Depósito de e-prints
Servicio de subscripción
Cambio de idioma
Ayuda
E-PrintsUCM
Víctor Manuel Herreros Villanueva
Departamento de Automatización de la Biblioteca
Servicio Informático de Apoyo a la Docencia e Investigación
Marzo de 2005