RESÚMENES, ABSTRACTS, RÉSUMÉS

(Updated: 2-08-2007)

M. Mercedes Martínez González. Principios para la explotación dinámica de relaciones entre documentos en las bibliotecas digitales: aplicación al entorno jurídico / Principes d'exploitation dynamique des relations inter-documents dans les bibliothèques électroniques: application au domaine juridique. U. Valladolid (Spain), Institut National Polytechnique de Lorraine/ Institut National de Recherche en Informatique et Automatique (France). PhD. 2001.

Abstract:
Digital libraries's development is asking for including in these systems new services, able to complement those that can be considered "basic" digital libraries services. This thesis makes proposals that allow to improve the exploitation of semantic relationships between documents in digital libraries. Queries that express user's interest in relationships themselves are eased. Moreover, these relationships are exploited in order to allow the dynamic composition of new documents (for ex., historical versions). The proposals made cover three aspects: normalising documents, modelling relationships and their exploiting, and, finally, the architectural propositions that allow to integrate new relationship-oriented functionalities in digital libraries. The convenience of the proposed solutions is shown on a prototype consisting in a legislative digital library.
KEYWORDS: Digital library, relationship, dynamic relationship exploitation, structured document, digital library architecture, document versions, interoperability, XML.
[.pdf]

Resumen:
El desarrollo de las bibliotecas digitales ha propiciado el estudio de las posibilidades de inclusión en las mismas de nuevos servicios que complementen los que se pueden considerar básicos.
En esta tesis se ofrecen propuestas que permiten mejorar la explotación de las relaciones semánticas entre documentos en las biblitecas digitales. Se facilitan las consultas donde el usuario se interesa por dichas relaciones y se explotan estas relaciones con el objetivo de facilitar la composición dinámica de nuevos documentos (versiones históricas).
La propuesta se traduce en tres aspectos: normalización de documentos, modelado de relaciones y explotación y, finalmente, propuesta arquitectónica que permite integrar las nuevas funcionalidades en bibliotecas operativas. La idoneidad de la propuesta realizada se demuestra sobre un prototipo consistente en una biblioteca digital que contiene documentos jurídicos.
[.pdf ]

Résumé :
Le développement des bibliothèques électroniques demande d'incorporer à ces systèmes de nouveaux services, qui viennent compléter les services "basiques" traditionnellement proposés. Les propositions développées dans cette thèse permettent d'améliorer l'exploitation des relations sémantiques inter-documents dans les bibliothèques électroniques. On facilite les requêtes dans lesquelles l'utilisateur s'intéresse de préférence aux relations elles-mêmes. On exploite aussi ces relations pour faciliter la génération dynamique de nouveaux documents (les versions historiques d'un même document, par exemple). La proposition se décline en trois aspects : la normalisation des documents, la modélisation des relations et leur exploitation et, enfin, la proposition d'une architecture qui permet l'intégration des nouvelles fonctionnalités dans des bibliothèques opérationnelles. L'adéquation de l'approche proposée est validée à l'aide d'un prototype opérationnel qui exploite une bibliothèque de documents juridiques.
MOTS-CLÉS : bibliothèques électroniques, relations inter-documents, document structuré, versions des documents, architecture des bibliothèques électroniques, interopérabilité, XML, exploitation dynamique des relations, composition des documents.

Martínez-González, M.M., de la Fuente, P. Introducing structure management in automatic reference resolution: An XML-based approach. In Information Processing & Management 43(6) pp. 1808-1832, November 2007, doi: 10.1016/j.ipm.2006.12.004

References to parts of structured documents use their structure to locate the piece of document which is the reference target. On the other hand, XML has become an increasingly important language for structured documents. One of its most important related languages is XPath, the language that permits fragments of XML documents to be selected. In this article we present a methodology, and an application case, to automatically extract and solve references to fragments of structured documents. This approach combines structure manipulation and information extraction, to enhance reference extraction tools by improving the precision of the references extracted. We take advantage of XML markup to locate the position within the structure in which the references are found. The use of XPath, one of the most important XML related languages, for reference resolution is original: the resolution tool automatically builds XPath expressions. This proposal is inspired (and implemented) from our work with legislative documents.
KEYWORDS: Information extraction; XML; Structured documents; Reference extraction; Reference resolution; Legislative documents

Mercedes Martínez-González, Gérald Duffing. Teaching databases in compliance with the European dimension of higher education: best practices for better competences. In Education and Information Technologies 12(4), pp. 211-228, December 2007, doi: 10.1007/s10639-007-9047-3

The Convergence process in which European Union (EU) universities are at present involved supposes that these institutions not only have to re-structure their degree programmes, but also their teaching and learning methodologies. We study the impact of this EU process on Database teaching, comparing the practices of three different European universities and using the Convergence goals as criteria. In our discussion, we identify which aspects in each university are closer to the Convergence goals, and which are likely to help in achieving these goals.

Mercedes Martínez. Approaches to the document versioning issue in digital libraries. In Encyclopedia of Database Technologies and Applications (DBEncyclopedia), Idea-Group Inc. (USA), 2005, pp. 201-205.

Digital libraries are systems that contain organized collections of objects, serving in their most basic functions as a mirror of the traditional library that contains paper documents. Most of the information contained in the collections of a digital library consists of documents, which can evolve with time. That is, a document can be modified to obtain a new document, and digital library users may want access to any of those versions. This introduces in digital libraries the problem of versioning.

Mercedes Martínez, Pablo de la Fuente, Dámaso-Javier Vicente. Dealing with the automatic extraction of references from legislative digital libraries. Veille Strategique, Scientifique et Technologique 2004 (VSST 2004), 2004, pp. 281-288.

An application of information extraction to the legal domain is presented. Its goal is to automate the extraction of references from legal documents (by content analysis) and the storage of their information in order to facilitate an automatic treatment of these information items by services offered in digital libraries. The steps followed cover the analysis of the legal domain to the implementation of software tools, and some experiments.

Mercedes Martínez, Pablo de la Fuente, Jean-Claude Derniame. XML as a means to support information extraction from legal documents. In International Journal of Computer Systems, Science and Engineering (JCSSE) 8(5), pp. 263-277.

XML seems to be the preferred standard for legal documents. Several DTDs have been created specifically for these documents by public institutions and private legal publishers, and work continues with the adaptation of the additional legislation for XML representation. We present an approach to automate information extraction processes from legal documents, that pays special attention to document structure and relationships. It combines information extraction techniques to extract document structure, to detect references (relationships), and tackles consolidation (document updating) of normative documents as a knowledge extraction process. In this paper we emphasise the role of XML during the implementation of these techniques. Its appropriateness to manipulate structure, to model semantic features, and to share information are decisive in making this phase feasible.
KEYWORDS: information extraction, legal documents, XML

Mercedes Martínez. Bibliotecas digitales: retos y libre acceso. In SCIRE. Representación y Organización del Conocimiento 9(2), 2003, pp. 19-36.

En este artículo se estudia el impacto en las bibliotecas del uso de soportes electrónicos, procesos automáticos y la Web para difundir información. El primer aspecto considerado es el acceso a la información. Los modelos económicos presentados en la primera parte están adaptados a las bibliotecas digitales. La segunda parte se dedica a otros retos: decidir cuál es la información que la biblioteca debe albergar, garantizar su calidad, y la preservación de la información. Esta revisión se hace desde dos perspectivas: se evalúa la posibilidad de automatizar, y en qué grado, estas tareas; y se examina cómo resultan afectadas estas mismas tareas por la carencia de revisores en un medio de difusión masivo como la Web.
PALABRAS CLAVE: Bibliotecas digitales. Modelos económicos. Libre acceso. Búsqueda de información. Calidad. Preservación.
[.pdf]

Mercedes Martínez, Pablo de la Fuente, Jean-Claude Derniame. Relationship-based dynamic versioning of evolving legal documents. Lecture Notes on Artificial Intelligence (LNAI) 2543, 2003, pp. 290-306.

Rule evolution is usually performed by creating a new document which explicitly details changes to specific parts inside other rules's content. Obtaining (virtual) document versions corresponding to a rules's state at a specific date is thus left to document users, who manually extract from library collections, and compose, the pieces of text needed to obtain the desired version. When changes are numerous this can be a tedious task. We propose a solution to dynamically generate virtual rule versions on user demand, respecting the library documents integrity. References to other documents and modification relationships can be automatically detected and are modelled as typed links --modelled with XLink-- in a relationships graph. This graph can be used to query relationships, to create hypertext, and to dynamically generate rule versions. In this paper, we focus on the version generation process: a dynamic document composition based in a graph traversal, during which we intelligently infer the composition rules of the desired version.
[.pdf]

M. Martínez, P. de la Fuente, J. C. Derniame. Una propuesta integrada de extracción de información para gobierno electrónico: estructura, referencias y evolución de los documentos jurídicos. IV Jornadas de Bibliotecas Digitales (JBIDI'2003) Alicante (Spain), September 2003.

Los documentos jurídicos son el soporte fundamental de las aplicaciones de gobierno electrónico. En este trabajo se presenta una propuesta cuyo objetivo es automatizar los procesos de extracción de información de documentos legislativos. Las técnicas de extracción de información se combinan para extraer la estructura de los documentos a partir de su contenido, para extraer referencias (relaciones), y se enfoca la consolidación (actualización) de textos normativos como un proceso de extracción de conocimiento a partir de la información extraida en los procesos anteriores (estructura y referencias). La evaluación (metodología y resultados) se ha hecho sobre un conjunto de textos normativos españoles. La utilización de XML en la implementación ha potenciado las posibilidades de extensión de lo desarrollado con otras posibilidades.
[.pdf]

M. Martínez, J. C. Derniame, P. de la Fuente. A method for the dynamic generation of virtual versions of evolving documents. 17th ACM Simposium on Applied Computing (SAC 2002), Special Track on Database and Digital Library Technologies. Madrid (Spain), March 2002.

Document evolution is usually performed by creating a new document which explicitly details changes to specific paragraphs inside other document content. Obtaining (virtual) document versions corresponding to its state at a specific date is left to document users, who manually extract from library collections, and compose, the pieces of text needed to obtain the desired version. But this can be a very tedious and difficult task when changes are numerous. We propose a solution to dynamically generate virtual document versions on user demand, respecting the library documents integrity. References to other documents and modification relationships can be automatically detected and are modelled as typed links -modelled with XLink- in a relationship graph. In this paper, we focus on the version generation process, consisting in a dynamic document composition based on a graph traversal. This solution has already shown its adequacy with a legislative digital library.
[.pdf]

M. Martínez, P. de la Fuente, J. C. Derniame, A. Pedrero. Explotación dinámica de relaciones en las bibliotecas digitales: aplicación a una biblioteca jurídica. Segundas Jornadas de Bibliotecas Digitales (JBIDI'2001) Almagro (Spain), 19-20 November 2001.

Las relaciones son una importante fuente de información, poco aprovechada aún en las bibliotecas digitales operativas. Uno de los modos más extendidos de explotar estas relaciones es la creación de hipertexto, por el cual los usuarios ''navegan'' entre documentos relacionados. Si bien ésta es una valiosa funcionalidad, no es la única posibilidad para aprovechar la información que aportan las relaciones. En este trabajo se propone expandir dicho aprovechamiento a los dos casos siguientes: consultas sobre las relaciones, y generación dinámica de documentos virtuales. Desde el punto de vista teórico, un grafo de relaciones nos permite modelar éstas y aplicar tratamientos capaces de extraer nueva información, que utilizamos en la construcción de nuevos documentos. La propuesta se completa con la implementación de dicho grafo mediante una base de enlaces XML, donde se aprovecha la potencia de los estándares XLink, XPointer y XPath para obtener la máxima precisión, en la representación del grafo y la semántica de las relaciones consideradas. La aplicabilidad de la propuesta se ilustra sobre una biblioteca de textos legislativos.
[.pdf]

M. Martínez, S. Cruz-Lara, P. de la Fuente, J. C. Derniame. La génération de documents virtuels dans les bibliotèques éléctroniques : application aux textes juridiques. Veille Strategique Scientifique & Technologique (VSST'01). Barcelone (Spain), 15-19 October 2001

Les relations sont une importante source d'information, encore peu utilisée dans les bibliothèques électroniques en exploitation. Utiliser les relations entre plusieurs documents signifie communément créer de l'hypertexte à partir duquel les utilisateurs pourront « naviguer » entre les documents en relation. S'il est vrai que ce mode de navigation est une fonctionnalité extrêmement importante, ce n'est pas la seule possibilité permettant d'exploiter l'information contenue dans les relations entre documents. A fin d'exploiter au mieux cette information, nous proposons une extension sur deux plans : des consultations sur les relations elles-mêmes et la génération dynamique de documents virtuels. D'un point de vue théorique, un graphe permet de représenter les relations (i.e. graphe de relations). Sur ce graphe, on est capable d'appliquer des traitements capables d'extraire des nouvelles informations ce qui permet la construction de nouveaux documents. Notre proposition est d'utiliser une base de liens XML où l'on profite de la puissance des standards XLink, XPointer et XPath pour la représentation du graphe et pour la sémantique des relations considérées. Nous illustrons finalement une application de notre proposition sur une bibliothèque de textes juridiques.

M. Martínez. Extended Markup Language (XML): una solución para modelar documentos y sus interrelaciones basada en la semántica de la información. In SCIRE. Representación y Organización del Conocimiento 6(2), Jul-Dec 2000, pp. 123-153.

Se presenta el estándar del W3C Extended Markup Language (XML) y se discuten sus características y ventajas. Entre las mismas destacan la sencillez y legibilidad de los documentos, la separación entre presentación y contenido, y la potencia de sus hiperenlaces. Las características comentadas se ilustran mediante una aplicación XML para el tratamiento y recuperación de información jurídica.
[.pdf]

M. Martínez, C. E. Cuesta, P. de la Fuente, J. C. Lamirel. Integración de Colecciones Heterogéneas en Bibliotecas Digitales. In Primeras Jornadas de Bibliotecas Digitales (JBIDI'2000) Valladolid (Spain), 6-7 November 2000.

La integración de colecciones documentales destinadas a constituir una nueva biblioteca digital se ve dificultada por la heterogeneidad. Esta heterogeneidad puede deberse, entre otras, a las siguientes causas: distintos modelos de documentos, formatos diferentes, distintos modelos en los atributos, y distintas sintaxis en los lenguajes de consulta y en los datos que circulan por la biblioteca. La biblioteca que acoge una nueva colección debe garantizar la interoperabilidad entre la recién llegada y el resto del sistema. Las soluciones para bibliotecas heterogéneas se apoyan en la utilización de protocolos creados específicamente para la Recuperación de Información y/o mediadores que se integran en la biblioteca, asumiendo el papel de "traductores". En este trabajo presentamos y comparamos dos modelos de biblioteca digital donde se trata el problema de la heterogeneidad: una arquitectura donde los mediadores se implementan como objetos, y una solución utilizando el protocolo Z39.50.
[.pdf]

M. Martínez, C. E. Cuesta, P. de la Fuente, J. C. Lamirel. Consultas heterogéneas en bibilotecas digitales distribuidas. Simposio Español de Informática Distribuida (SEID 2000) Orense (Spain), 25-27 september 2000.

La heterogeneidad en los lenguajes de consulta dificulta la integración de bibliotecas ya existentes con el fin de constituir una nueva biblioteca digital en entornos distribuidos. A la multiplicidad en los lenguajes de consulta se suma la diversidad en los formatos de los datos y en los resultados de las consultas de cada servidor. La biblioteca que acoge un nuevo servidor debe garantizar la interoperabilidad entre el recién llegado y el resto del sistema. En este trabajo hacemos una revisión del problema y las posibles soluciones, y presentamos una propuesta basada en la integración en el sistema de mediadores que asumen las tareas de traducción necesarias para garantizar la interoperabilidad en el sistema. La implementación de la solución propuesta opera sobre una biblioteca documental (documentos XML) donde tanto los datos como los sistemas de acceso a dichos datos están distribuidos; cada servidor de datos del sistema contiene su propio software de indexación y búsqueda en sus bases de documentos. La propuesta es suficientemente flexible para utilizarla en casos de mayor heterogeneidad como, por ejemplo, en la integración de bases de datos relacionales y repositorios que contienen documentos XML.
PALABRAS CLAVE: Biblioteca digital, federación, mediadores, distribución, heterogeneidad, interopera- bilidad, lenguajes de consulta
[.pdf]