Lecciones en TTHub

Las Guías directrices de la Text Encoding Initiative, su manejo y su traducción al español

Susanna Allés Torrent

DOI

I. Estructura de las Guías directrices

La Text Encoding Initiative se sustenta en primer lugar en las Guías directrices que establecen un modelo concreto de codificación. Estas pautas son publicadas por el mismo Consorcio, en acceso abierto, en su página oficial. La versión actual es la P5 (donde P corresponde a “Proposal”) y se remontan al año 2007, aunque cada pocos meses la versión es actualizada con pequeñas mejoras. Su problema principal es que no son muy amigables, si se considera que su edición en papel llega casi a las 2.000 páginas. Aún así, constituyen el núcleo de cualquier trabajo en TEI, y su consulta es siempre inevitable.

Empecemos con la definición que ofrece la misma página web del Consorcio TEI:

English Español
The TEI Guidelines for Electronic Text Encoding and Interchange define and document a markup language for representing the structural, renditional, and conceptual features of texts. They focus (though not exclusively) on the encoding of documents in the humanities and social sciences, and in particular on the representation of primary source materials for research and analysis. These guidelines are expressed as a modular, extensible XML schema, accompanied by detailed documentation, and are published under an open-source license. The Guidelines are maintained and developed by the TEI Consortium, through its Technical Council, with the support and participation of the TEI community. Las Guías directrices TEI para la codificación y el intercambio de textos electrónicos define y documenta un lenguaje de marcado para la representación de los rasgos estructurales, de presentación y conceptuales de los textos. Estas se centran, aunque no exclusivamente, en la codificación de documentos en Humanidades y Ciencias Sociales, y en particular en la representación de fuentes primarias para la investigación y el análisis. Estas Guías directrices se expresan a través de módulos, de esquemas XML extensibles, acompañadas por una documentación detallada, y son publicadas bajo una licencia de acceso abierto. Las Guías directrices son mantenidas y desarrolladas por el Consorcio TEI, a través del Consejo técnico, con el apoyo y la participación de la comunidad TEI.

De esta definición podemos establecer, pues, diferentes puntos:

Veamos pues de qué manera estas Guías directrices documentan el modelo en su página oficial.

La sección que ahora nos interesa es la que concierne a las directrices para la codificación y el intercambio de textos electrónicos. Esta documentación se debe concebir como una especie de manual, de recomendaciones y de buenas prácticas para la codificación de los textos en TEI; cuanto más familiarizados uno esté con las Guías directrices, más agilidad tendrá para concebir un marcado concreto para un determinado fenómeno textual o lingüístico o del tipo que sea.

Las Guías directrices pueden descargarse en diferentes formatos, pero lo más habitual -debido al volumen de las mismas- es hacerlo en su versión HTML en inglés o parcialmente en español.

La página se estructura en cuatro bloques que en realidad reflejan la estructura de todo documento TEI:

Cada proyecto de codificación, pues, debe crear su propio esquema a partir de una combinación de los módulos obligatorios y los módulos optativos. En total disponemos de veintiún módulos: cuatro son obligatorios (tei, core, header, textstructure), mientras que los otros son optativos en función de las necesidades del proyecto.

Los módulos obligatorios son:

Nombre del Módulo Identificador público formal Definición en las GD
core Common Core 3. Elements Available in All TEI Documents
header Common Metadata 2. The TEI Header
tei TEI Infrastructure 1. The TEI Infrastructure
textstructure Default Text Structure 4. Default Text Structure

Los módulos optativos son:

Nombre del Módulo Identificador público formal Definición en las GD
analysis Analysis and Interpretaion 17. Simple Analytic Mechanisms
certainty Certainty and Uncertainty 21. Certainty, Precision, and Responsibility
corpus Metadata for Language Corpora 15. Language Corpora
dictionaries Print Dictionaries 9. Dictionaries
drama Performance Texts 7. Performance Texts
figures Tables, Formulae, Figures 14. Tables, Formulae, Graphics and Notated Music
gaiji Character and Glyph Documentation 5. Characters, Glyphs, and Writing Modes
iso-fs Feature Structure 18. Features Structures
linking Linking, Segmentation, and Alignment 16. Linking, Segmentation, and Alignment
msdescription Manuscript Description 10. Manuscript Description
namesdates Names, Dates, People, and Places 13. Names, Dates, People, and Places
nets Graphs, Networks, and Trees 19. Graphs, Networks, and Trees
spoken Transcribed Speech 8. Transcriptions of Speech
tagdocs Documentation Elements 22. Documentation Elements
textcrit Text Criticism 12. Critical Apparatus
transcr Transcription of Primary Sources 11. Representation of Primary Sources
verse Verse 6. Verse

Cada módulo define una serie de etiquetas propias (de un total de aproximadamente 500 elementos), así como las clases de modelo y de los atributos.

Cada módulo tiene una presentación general, donde se explica el funcionamiento de cada uno de sus elementos. Por ejemplo, si estamos interesados en los diccionarios, tenemos a nuestra disposición la explicación general sobre diccionarios en las Guías directrices, y si necesitamos uno de sus elementos podemos acceder a su información individualizada, pongamos por caso <entryFree> (véase Figura 1).

Definición del elemento "EntryFree" en las GD

Cada uno de los elementos, contiene siempte:

En la lección sobre Tipologías tendremos tiempo de trabajar con algunos de estos módulos.

Como cabe imaginar, el mismo Consorcio prevé que la actualización constante, especialmente la evolución de P4 a P5, suponga cambios considerables. Por ello, ofrece consejos de migración y una Wiki sobre cuestiones relativas a TEI, entre ellas la migración entre versiones para aquellos proyectos que utilizaron la versión anterior de TEI P5.

II. Formatos de publicación

Las Guías directrices se fundamentan sobre el principio del acceso abierto, por ello todo lo que las rodea se publica bajo esa licencia y puede descargarse por completo:

Las Guías directrices pueden descargarse en diferentes formatos:

Una de las opciones más interesantes es la posibilidad de instalarnos una copia de las Guías directrices en nuestro ordenador personal a través de SVN (Version Control System), pero ello está indicado especialmente para que los usuarios más avanzados puedan probar los últimos desarrollos y proveer feedback sobre lo que piensan y como deberían desarrollarse. Lo que sí, en cambio, es muy útil es la descarga de la última versión de las Guías directrices, disponible aquí. Se puede descargar una copia y conservarla en su ordenador para que pueda ser consultada incluso cuando no se esté en línea.

III. Recursos

En el apartado de las Guidelines, aparte de las Guías propiamente dichas, encontramos otra serie de materiales y recursos relacionados que conviene conocer. En la página se encuentran las siguientes secciones: