RESÚMENES, ABSTRACTS, RÉSUMÉS
(Updated: 2-08-2007)M. Mercedes Martínez González. Principios para la explotación dinámica de relaciones entre documentos en las bibliotecas digitales: aplicación al entorno jurídico / Principes d'exploitation dynamique des relations inter-documents dans les bibliothèques électroniques: application au domaine juridique. U. Valladolid (Spain), Institut National Polytechnique de Lorraine/ Institut National de Recherche en Informatique et Automatique (France). PhD. 2001.
Abstract:
Digital libraries's development is asking for including
in these systems new services, able to complement those that can
be considered "basic" digital libraries services.
This thesis makes proposals that allow to improve the exploitation of
semantic relationships between documents in digital libraries. Queries
that express user's interest in relationships themselves are eased.
Moreover, these relationships are exploited in order to allow the dynamic composition of new documents (for ex., historical versions).
The proposals made cover three aspects: normalising documents, modelling relationships and their exploiting, and, finally, the architectural propositions that allow to integrate new relationship-oriented functionalities in digital libraries.
The convenience of the proposed solutions is shown on a prototype
consisting in a legislative digital library.
KEYWORDS:
Digital library, relationship, dynamic relationship exploitation,
structured document, digital library architecture, document versions,
interoperability, XML.
[.pdf]
Resumen:
El desarrollo de las bibliotecas digitales ha propiciado el estudio de
las posibilidades de inclusión en las mismas de nuevos servicios que
complementen los que se pueden considerar básicos.
En esta tesis se ofrecen propuestas que permiten mejorar la
explotación de las relaciones semánticas entre documentos en las
biblitecas digitales. Se facilitan las consultas donde el usuario se
interesa por dichas relaciones y se explotan estas relaciones con el
objetivo de facilitar la composición dinámica de nuevos documentos
(versiones históricas).
La propuesta se traduce en tres aspectos: normalización de documentos, modelado de relaciones y explotación y, finalmente, propuesta arquitectónica que permite integrar las nuevas funcionalidades en bibliotecas operativas. La idoneidad de la propuesta realizada se demuestra sobre un prototipo consistente en una biblioteca digital que contiene documentos jurídicos.
[.pdf ]
Résumé :
Le développement des bibliothèques électroniques demande
d'incorporer à ces systèmes de nouveaux services, qui viennent compléter les services "basiques" traditionnellement proposés.
Les propositions développées dans cette thèse permettent d'améliorer
l'exploitation des relations sémantiques inter-documents dans les
bibliothèques électroniques.
On facilite les requêtes dans lesquelles l'utilisateur s'intéresse de
préférence aux relations elles-mêmes.
On exploite aussi ces relations pour faciliter la génération dynamique
de nouveaux documents (les versions historiques d'un même document, par exemple).
La proposition se décline en trois aspects : la normalisation des
documents, la modélisation des relations et leur exploitation et, enfin,
la proposition d'une architecture qui permet l'intégration des nouvelles
fonctionnalités dans des bibliothèques opérationnelles.
L'adéquation de l'approche proposée est validée à l'aide d'un prototype opérationnel qui exploite une bibliothèque de documents juridiques.
MOTS-CLÉS :
bibliothèques électroniques, relations inter-documents, document
structuré, versions des documents, architecture des bibliothèques
électroniques, interopérabilité, XML, exploitation dynamique des
relations, composition des documents.
Martínez-González, M.M., de la Fuente, P.
Introducing structure management in automatic reference resolution: An XML-based approach.
In Information Processing & Management 43(6) pp. 1808-1832, November 2007,
doi: 10.1016/j.ipm.2006.12.004
References to parts of structured documents use their structure to locate the piece of document which is the reference
target. On the other hand, XML has become an increasingly important language for structured documents. One of its most important related languages is XPath, the language that permits fragments of XML documents to be selected. In this article we present a methodology, and an application case, to automatically extract and solve references to fragments of structured documents. This approach combines structure manipulation and information extraction, to enhance reference extraction tools by improving the precision of the references extracted. We take advantage of XML markup to locate the position within the structure in which the references are found. The use of XPath, one of the most important XML related languages, for reference resolution is original: the resolution tool automatically builds XPath expressions. This proposal is inspired (and implemented) from our work with legislative documents.
KEYWORDS: Information extraction; XML; Structured documents; Reference extraction; Reference resolution; Legislative documents
Mercedes Martínez-González, Gérald Duffing. Teaching databases in compliance with the European dimension of higher education: best practices for better competences. In Education and Information Technologies 12(4), pp. 211-228, December 2007, doi: 10.1007/s10639-007-9047-3
The Convergence process in which European Union (EU) universities are at present involved supposes that these institutions not only have to re-structure their degree programmes, but also their teaching and learning methodologies. We study the impact of this EU process on Database teaching, comparing the practices of three different European universities and using the Convergence goals as criteria. In our discussion, we identify which aspects in each university are closer to the Convergence goals, and which are likely to help in achieving
these goals.
Mercedes Martínez. Approaches to the document versioning issue in digital libraries. In Encyclopedia of Database
Technologies and Applications (DBEncyclopedia), Idea-Group Inc. (USA), 2005, pp. 201-205.
Digital libraries are systems that contain organized collections
of objects, serving in their most basic functions as
a mirror of the traditional library that contains paper
documents. Most of the information contained in the
collections of a digital library consists of documents,
which can evolve with time. That is, a document can be
modified to obtain a new document, and digital library
users may want access to any of those versions. This
introduces in digital libraries the problem of versioning.
Mercedes Martínez, Pablo de la Fuente, Dámaso-Javier Vicente. Dealing with the automatic extraction of references from legislative
digital libraries. Veille Strategique, Scientifique et Technologique 2004
(VSST 2004), 2004, pp. 281-288.
An application of information extraction to the legal domain is presented. Its goal is to automate the extraction of references from legal documents (by content analysis) and the storage of their information in order to facilitate an automatic treatment of these information items by services offered in digital libraries.
The steps followed cover the analysis of the legal domain to the implementation of software tools, and some experiments.
Mercedes Martínez, Pablo de la Fuente, Jean-Claude Derniame.
XML as a means to support information extraction from legal documents.
In International Journal of Computer Systems, Science and Engineering (JCSSE) 8(5), pp. 263-277.
XML seems to be the preferred standard for legal documents. Several DTDs have been created specifically for these documents by public institutions
and private legal publishers, and work continues with the adaptation of the additional legislation for XML representation. We present an approach to
automate information extraction processes from legal documents, that pays special attention to document structure and relationships. It combines
information extraction techniques to extract document structure, to detect references (relationships), and tackles consolidation (document updating)
of normative documents as a knowledge extraction process. In this paper we emphasise the role of XML during the implementation of these techniques.
Its appropriateness to manipulate structure, to model semantic features, and to share information are decisive in making this phase feasible.
KEYWORDS: information extraction, legal documents, XML
Mercedes Martínez.
Bibliotecas digitales: retos y libre acceso.
In SCIRE. Representación y Organización del Conocimiento 9(2),
2003, pp. 19-36.
En este artículo se estudia el impacto en las bibliotecas del uso de
soportes electrónicos, procesos automáticos y la Web para difundir
información. El primer aspecto considerado es el acceso a la
información. Los modelos económicos presentados en la primera parte
están adaptados a las bibliotecas digitales.
La segunda parte se dedica a otros retos: decidir cuál es la
información que la biblioteca debe albergar, garantizar su calidad,
y la preservación de la información. Esta revisión se hace desde dos
perspectivas: se evalúa la posibilidad de automatizar, y en qué grado,
estas tareas; y se examina cómo resultan afectadas estas mismas tareas
por la carencia de revisores en un medio de difusión masivo como la Web.
PALABRAS CLAVE:
Bibliotecas digitales. Modelos económicos. Libre acceso.
Búsqueda de información. Calidad. Preservación.
[.pdf]
Mercedes Martínez, Pablo de la Fuente, Jean-Claude Derniame.
Relationship-based dynamic versioning of evolving legal documents.
Lecture Notes on Artificial Intelligence (LNAI) 2543, 2003, pp. 290-306.
Rule evolution is usually performed by creating a new document which
explicitly details changes to specific parts
inside other rules's content.
Obtaining (virtual) document versions corresponding to
a rules's state at a specific date is thus left to
document users, who manually extract from library collections,
and compose, the pieces of text needed to obtain the desired version.
When changes are numerous this can be a tedious task.
We propose a solution to dynamically generate virtual rule
versions on user demand, respecting the library documents
integrity.
References to other documents and modification relationships can be
automatically detected and are
modelled as typed links --modelled with XLink-- in a relationships
graph. This graph can be used to query relationships, to create hypertext,
and to dynamically generate rule versions.
In this paper, we focus on the version generation process:
a dynamic document composition based in a graph traversal, during
which we intelligently infer the composition rules of the desired version.
[.pdf]
M. Martínez, P. de la Fuente, J. C. Derniame.
Una propuesta integrada de extracción de información para gobierno
electrónico: estructura, referencias y evolución de los documentos
jurídicos.
IV Jornadas de Bibliotecas Digitales (JBIDI'2003)
Alicante (Spain), September 2003.
Los documentos jurídicos son el soporte fundamental de las aplicaciones
de gobierno electrónico.
En este trabajo se presenta una propuesta cuyo objetivo es automatizar los
procesos de extracción de información de documentos legislativos.
Las técnicas de extracción de información se combinan para extraer la
estructura de los documentos a partir de su contenido, para extraer
referencias (relaciones), y se enfoca la consolidación (actualización) de
textos normativos como un proceso de extracción de conocimiento a partir
de la información extraida en los procesos anteriores
(estructura y referencias).
La evaluación (metodología y resultados) se ha hecho sobre un conjunto
de textos normativos españoles. La utilización de XML en la implementación
ha potenciado las posibilidades de extensión de lo desarrollado con otras
posibilidades.
[.pdf]
M. Martínez, J. C. Derniame, P. de la Fuente. A method for the dynamic generation of virtual versions of evolving documents.
17th ACM Simposium on Applied Computing (SAC 2002),
Special Track on Database and Digital Library Technologies.
Madrid (Spain), March 2002.
Document evolution is usually performed by creating a new document which
explicitly details changes to specific paragraphs
inside other document content.
Obtaining (virtual) document versions corresponding to
its state at a specific date is left to
document users, who manually extract from library collections,
and compose, the pieces of text needed to obtain the desired version.
But this can be a very tedious and difficult task when
changes are numerous.
We propose a solution to dynamically generate virtual document
versions on user demand, respecting the library documents integrity.
References to other documents and modification relationships can be
automatically detected and are
modelled as typed links -modelled with XLink- in a relationship graph.
In this paper, we focus on the version generation process, consisting
in a dynamic document composition based on a graph traversal.
This solution has already shown its adequacy with a
legislative digital library.
[.pdf]
M. Martínez, P. de la Fuente, J. C. Derniame, A. Pedrero.
Explotación dinámica de relaciones en las bibliotecas digitales:
aplicación a una biblioteca jurídica.
Segundas Jornadas de Bibliotecas Digitales (JBIDI'2001)
Almagro (Spain), 19-20 November 2001.
Las relaciones son una importante fuente de información,
poco aprovechada aún en las bibliotecas
digitales operativas.
Uno de los modos más extendidos de explotar estas relaciones es la
creación de hipertexto, por el cual los usuarios ''navegan'' entre
documentos relacionados. Si bien ésta es una valiosa funcionalidad, no es
la única posibilidad para aprovechar la información que aportan las
relaciones.
En este trabajo se propone expandir dicho aprovechamiento a los dos
casos siguientes: consultas sobre las relaciones, y generación
dinámica de documentos virtuales.
Desde el punto de vista teórico, un grafo de relaciones nos permite
modelar éstas y aplicar tratamientos capaces de extraer nueva
información, que utilizamos en la construcción de nuevos documentos.
La propuesta se completa con la
implementación de dicho grafo mediante una base de enlaces XML, donde se aprovecha la potencia de los estándares XLink, XPointer y XPath para obtener la
máxima precisión, en la representación del
grafo y la semántica de las relaciones consideradas.
La aplicabilidad de la propuesta se ilustra sobre una
biblioteca de textos legislativos.
[.pdf]
M. Martínez, S. Cruz-Lara, P. de la Fuente, J. C. Derniame.
La génération de documents virtuels dans les bibliotèques éléctroniques :
application aux textes juridiques.
Veille Strategique Scientifique & Technologique (VSST'01).
Barcelone (Spain), 15-19 October 2001
Les relations sont une importante source d'information, encore peu utilisée dans les bibliothèques électroniques en exploitation. Utiliser les relations entre plusieurs documents signifie communément créer de l'hypertexte à partir duquel les utilisateurs pourront « naviguer » entre les documents en relation. S'il est vrai que ce mode de navigation est une fonctionnalité extrêmement importante, ce n'est pas la seule possibilité permettant d'exploiter l'information contenue dans les relations entre documents.
A fin d'exploiter au mieux cette information, nous proposons une extension sur deux plans : des consultations sur les relations elles-mêmes et la génération dynamique de documents virtuels.
D'un point de vue théorique, un graphe permet de représenter les relations (i.e. graphe de relations). Sur ce graphe, on est capable d'appliquer des traitements capables d'extraire des nouvelles informations ce qui permet la construction de nouveaux documents. Notre proposition est d'utiliser une base de liens XML où l'on profite de la puissance des standards XLink, XPointer et XPath pour la représentation du graphe et pour la sémantique des relations considérées. Nous illustrons finalement une application de notre proposition sur une bibliothèque de textes juridiques.
M. Martínez. Extended Markup Language (XML):
una solución para modelar
documentos y sus interrelaciones basada en la semántica de la información.
In SCIRE. Representación y Organización del Conocimiento 6(2), Jul-Dec 2000, pp. 123-153.
Se presenta el estándar del W3C Extended Markup Language (XML) y se discuten sus características y ventajas. Entre las mismas destacan la sencillez y legibilidad de los documentos, la separación entre presentación y contenido, y la potencia de sus hiperenlaces. Las características comentadas se ilustran mediante una aplicación XML para el tratamiento y recuperación de información jurídica.
[.pdf]
M. Martínez, C. E. Cuesta, P. de la Fuente, J. C. Lamirel.
Integración de Colecciones Heterogéneas en Bibliotecas Digitales.
In Primeras Jornadas de Bibliotecas Digitales (JBIDI'2000)
Valladolid (Spain), 6-7 November 2000.
La integración de colecciones documentales destinadas a constituir una nueva biblioteca digital se ve dificultada por la heterogeneidad. Esta heterogeneidad puede deberse, entre otras, a las siguientes
causas:
distintos modelos de documentos, formatos diferentes,
distintos modelos en los atributos, y
distintas sintaxis en los lenguajes de consulta y en los datos que
circulan por la biblioteca.
La biblioteca que acoge una nueva colección debe garantizar la interoperabilidad
entre la recién llegada y el resto del sistema.
Las soluciones para bibliotecas heterogéneas se apoyan en la
utilización de protocolos creados específicamente para la Recuperación
de Información y/o mediadores que se integran en la
biblioteca, asumiendo el papel de "traductores".
En este trabajo presentamos y comparamos dos modelos de biblioteca
digital donde se trata el problema de la heterogeneidad: una
arquitectura donde los mediadores se implementan como objetos,
y una solución utilizando el protocolo Z39.50.
[.pdf]
M. Martínez, C. E. Cuesta, P. de la Fuente, J. C. Lamirel.
Consultas heterogéneas en bibilotecas digitales distribuidas. Simposio Español de Informática Distribuida (SEID 2000)
Orense (Spain), 25-27 september 2000.
La heterogeneidad en los lenguajes de consulta dificulta la integración de bibliotecas ya existentes con el fin de
constituir una nueva biblioteca digital en entornos distribuidos. A la multiplicidad en los lenguajes de consulta
se suma la diversidad en los formatos de los datos y en los resultados de las consultas de cada servidor. La
biblioteca que acoge un nuevo servidor debe garantizar la interoperabilidad entre el recién llegado y el resto
del sistema. En este trabajo hacemos una revisión del problema y las posibles soluciones, y presentamos
una propuesta basada en la integración en el sistema de mediadores que asumen las tareas de traducción
necesarias para garantizar la interoperabilidad en el sistema. La implementación de la solución propuesta
opera sobre una biblioteca documental (documentos XML) donde tanto los datos como los sistemas de acceso
a dichos datos están distribuidos; cada servidor de datos del sistema contiene su propio software de indexación
y búsqueda en sus bases de documentos. La propuesta es suficientemente flexible para utilizarla en casos de
mayor heterogeneidad como, por ejemplo, en la integración de bases de datos relacionales y repositorios que
contienen documentos XML.
PALABRAS CLAVE: Biblioteca digital, federación, mediadores, distribución, heterogeneidad, interopera-
bilidad, lenguajes de consulta
[.pdf]