Blog del grup de recerca Tradumàtica

Blog del grup de recerca Tradumàtica sobre tecnologies de la traducció

Tag Archive 'Lucía Morado Vázquez'

set. 12 2013

XLIFF: desarrollo y futuro de un estándar, por Lucía Morado

Lucía Morado Vázquez

TIM/ISCO/FTI

Cod.eX Research Group

Université de Genève

Tras la incertidumbre y desconcierto que supuso en el campo de los estándares de localización la desaparición de LISA en 2011, uno de los estándares que se mantuvo impertérrito ante dicha situación fue XLIFF (XML Localisation Interchange File Format), que ha continuado a través de su comité técnico su firme y constante desarrollo. En esta entrada abordaremos de forma breve la historia de XLIFF y su desarrollo actual, asimismo anticiparemos algunos de los rasgos de la nueva versión (2.0) que está a punto de oficializarse.

El germen de XLIFF, el denominado en su momento “Data Definition Group” se formó en Dublín en el año 2000 de la mano de tres empresas de software: Novell, Oracle y Sun Microsystems, como respuesta a la necesidad de obtener un formato de archivo que permitiese el intercambio seguro de datos durante el proceso de localización. De aquellos contactos iniciales surgió una propuesta firme de estándar, cuya primera versión (1.0) se presentó oficialmente en abril de 2002 ya bajo el abrigo de la organización internacional de estandarización OASIS (Organization for the Advancement of Structured Information Standards) (Jewtushenko 2004). La pertenencia a dicha organización permite desde entonces que su desarrollo sea público y que cualquier persona interesada pueda consultarlo. Desde aquel año, se han publicado dos nuevas versiones (1.1 y 1.2) y muchas más empresas de software, empresas desarrolladoras de herramientas de traducción, empresas de traducción y localización y académicos han participado en su desarrollo. Actualmente, XLIFF está ampliamente implementado en las herramientas de traducción y localización más populares (Morado y Filip 2012). Una buena implementación del estándar garantiza la interoperabilidad entre herramientas y minimiza el riesgo de pérdida o daño de los datos, lo que puede resultar beneficioso para todos los agentes involucrados en el proceso de localización (XLIFF 2008). La versión actual de XLIFF es la 1.2, pero la nueva 2.0 está a punto de ver la luz.

¿Cómo se crea un estándar como XLIFF?

XLIFF se desarrolla en el seno de OASIS a través de un comité técnico dedicado en exclusiva a su mantenimiento y desarrollo. A fecha de hoy, el comité está formado por 28 miembros (11 de ellos con derecho a voto) procedentes de diversos ámbitos: grandes empresas de software, empresas desarrolladoras de herramientas de traducción y localización; empresas de traducción y localización y universidades y centros de investigación. El derecho a voto se adquiere tras asistir a tres reuniones consecutivas y se pierde del mismo modo si hay tres ausencias consecutivas. Además, el comité cuenta con dos secretarios y un presidente.

El trabajo por parte de los miembros del comité es voluntario y no está remunerado, al menos por parte de OASIS. El idioma de trabajo es el inglés. El presidente (chair) dirige y modera las diferentes actividades del comité. El trabajo de desarrollo y mantenimiento se lleva a cabo principalmente a través cuatro medios: reuniones telefónicas, lista de correo, wiki para los miembros y reuniones presenciales (face-to-face meetings).

Reuniones telefónicas. Estas reuniones se celebran el primer y tercer martes del mes, a través de un sistema electrónico de teleconferencia que permite visualizar la pantalla de uno de los asistentes (normalmente de la persona encargada de tomar notas, o en su defecto, del presidente), así como ver el nombre de la persona que tiene en ese momento la palabra. Desde hace tres años este sistema sustituye al anterior en el que los asistentes se comunicaban únicamente a través del teléfono, lo que suponía lógicamente una comunicación más dificultosa. El día previo a la celebración de la reunión el presidente hace llegar a todos los miembros mediante correo electrónico el orden del día y tras la reunión los miembros reciben a través del mismo medio las actas de dicho encuentro. Al inicio de cada sesión se propone la aprobación de las actas de la reunión anterior, que de ser secundadas por al menos dos miembros y de no haber objeción alguna se convierten automáticamente en documento oficial del comité. Tanto las actas (meeting minutes) como los correos mencionados pueden consultarse en la siguiente dirección https://lists.oasis-open.org/archives/xliff/.

Listas de correo. El comité técnico cuenta con tres listas de distribución de correo. La principal es la lista de correo de los propios miembros, a través de la cual se lleva a cabo parte del trabajo técnico que requiere una discusión más profunda y mayores explicaciones técnicas. Esta lista es de consulta pública, aunque solo los miembros del comité pueden escribir en ella. Una segunda lista se reserva a los comentarios, que cualquiera persona interesada pueda dirigir al comité técnico, y una tercera se reserva a los usuarios de XLIFF para que puedan comunicarse entre sí.

Wiki. La wiki del comité fue fundamental para el desarrollo de la nueva versión (2.0). En ella se introdujeron y propusieron cambios para su implementación en la nueva especificación. Cada uno de estos cambios estaba dirigido por un miembro que se hacía cargo de su mantenimiento y presentación ante el comité normalmente durante una reunión telefónica o mediante un correo. Tras un debate interno se procedía a modificar la propuesta en la propia wiki. Como el resto del trabajo del comité la wiki es pública, aunque solo los miembros pueden modificar su contenido.

Face-to-face meetings. Las reuniones presenciales se realizan con una frecuencia anual y dependen en gran medida de la disponibilidad de los miembros (que suelen vivir en diferentes continentes y zonas horarias). Normalmente se hacen coincidir con algún evento de localización al que la mayoría de ellos pueda asistir. Estas reuniones tienen una agenda muy completa en la que se abordan los temas más importantes que afecten al desarrollo del estándar. La última reunión se celebró en Londres el diez de junio de este año en la sede londinense de Microsoft, el día previo al cuarto simposio sobre XLIFF. Ocho miembros se reunieron en dicho evento en el que se debatieron los temas más candentes relacionados con la inminente publicación de la nueva versión del estándar y se tomaron decisiones importantes que afectan a su futuro. Estas reuniones están obviamente reservadas para los miembros del comité técnico, aunque se suelen asignar una o dos horas dentro de la agenda del día en las que se invita al público interesado a participar.

Subcomités

Además del comité principal de XLIFF existen o han existido subcomités en los que se tratan temas específicos y que ayudan a liberar de esa carga de trabajo al comité principal. Actualmente el único subcomité en activo es el subcomité de Promoción y Enlace (OASIS XLIFF Promotion and Liaison Subcommittee). Los dos objetivos básicos de este subcomité son la promoción del estándar y la conexión con otros organismos de estandarización. La actividad principal de promoción que realiza el subcomité es la celebración anual de un simposio internacional sobre XLIFF. El primer simposio se celebró en Limerick en el año 2010 como actividad principal de la preconferencia del LRC; en 2011 se celebró en Varsovia como preconferencia de la conferencia MTEurope; en el 2012 en Seatle como preconferencia de Localisation World; y en 2013 se celebró en Londres como preconferencia de nuevo de Localisation World. Esta serie de simposios han conseguido atraer una mayor atención sobre el estándar, han permitido un gran intercambio de ideas y conocimientos entre desarrolladores de herramientas TAO y han conseguido también que el comité técnico aumente considerablemente su número de miembros en activo.

Ejemplo de uso de XLIFF

El formato XLIFF es un formato que algunos denominan de “transición”, pues se utiliza generalmente solo durante el proceso de localización y en él se incluyen los datos “localizables” que se han extraído de otro formato (el denominado “formato original”). Por ejemplo, si queremos traducir un archivo html, podríamos aplicar una herramienta (filtro) que transformase el HTML a XLIFF. Ese archivo XLIFF resultante se entregaría al traductor/localizador que podría abrirlo y modificarlo en la herramienta de su elección. Una vez acabado el proceso de traducción, habría que transformar mediante otro filtro el archivo XLIFF al formato original. La clave en todo este proceso es contar con una herramienta con un potente filtro que sepa extraer el texto localizable del formato original y “colocarlo” en el lugar preciso en un archivo XLIFF válido, asimismo la herramienta debe ser capaz de invertir el proceso una vez que el texto localizable haya sido traducido/localizado.

Por ejemplo, si queremos traducir un documento de texto simple (.txt) que contenga la frase “Hello World!”. Nuestro filtro convertiría ese archivo txt en el siguiente xliff 2.0:

<xliff version=”2.0″ srcLang=”en”>

<file>

<unit id=”1″>

<segment>

<source> Hello World! </source>

</segment>

</unit>

</file>

</xliff>

Que al traducirse añadiría la siguiente información en rojo:

<xliff version=”2.0″ srcLang=”en” trgLang=”es”>

<file>

<unit id=”1″>

<segment>

<source> Hello World! </source>

<target>Hola, mundo.</target>

</segment>

</unit>

</file>

</xliff>

Nótese que en el anterior ejemplo solo hemos utilizado los elementos y atributos mínimos necesarios para crear un archivo XLIFF 2.0 válido.

XLIFF 2.0

Tras cinco años de trabajo técnico, debates internos y reuniones presenciales, la nueva versión de XLIFF está a punto de hacerse oficial. Si los cálculos del comité no sufren contratiempos, la nueva versión saldrá a principios de diciembre, el mejor regalo de Navidad para los miembros del comité.

La gran novedad que presenta la versión 2.0 es el nuevo paradigma núcleo-módulos. El núcleo (core) de un documento XLIFF 2.0 está formado por el conjunto mínimo de elementos y atributos necesarios que permiten formar un documento XLIFF y su modificación durante un proceso de localización. Algo similar a lo que en la especificación 1.2 se denominaba “minimal XLIFF”. Si fuese necesario, a dicho módulo se le podrían añadir complementos (módulos) con información o instrucciones adicionales para llevar a cabo procesos específicos de localización. Según reza el borrador de la especificación XLIFF 2.0 un módulo es un conjunto opcional de elementos y atributos XML que almacenan información sobre un proceso que se aplica al documento XLIFF y a los datos incorporados al documento como resultado de dicho proceso.

Así, el nuevo estándar cuenta con un núcleo (core) compuesto por doce elementos: <xliff>, <file>, <skeleton>, <group>, <unit>, <segment>, <ignorable>, <notes>, <note>, <originalData>, <data>, <source>, y <target>. Con respecto a la anterior versión, además del cambio de nombre de alguno de los elementos y la aparición de otros, la gran novedad en este nivel es la estructura de la unidad de traducción:

En la versión 1.2 se englobaba en el elemento <trans-unit> que contenía los elementos <source> (obligatorio), <seg-source>, <target>, <context-group>, <count-group>, <prop-group>, <note> y <alt-trans> (que podía contener propuestas de traducción).

En la versión 2.0 la unidad de traducción se engloba en el elemento <unit> que puede contener uno o varios elementos <segment>, que a su vez pueden contener los elementos <source>, <target>, <note> y <notes>, así como elementos de módulos específicos (<mtc:matches>, <mda: metadata>, <ctr:changeTrack> y <val:validation>). Las propuestas de traducción, como explicaremos más adelante ya no forman parte del núcleo de XLIFF y se incluyen mediante uno de los módulos. El elemento <unit> también puede contener los elementos <ignorable>, <notes>, <originalData> y otros elementos de módulos específicos.

Los módulos que ya aparecen documentados en el borrador de la nueva versión son: Translation Candidate, Glossary, Format Style, Metadata, Resource Data, Change Tracking y Size Restriction. El módulo “Translation Candidate” se utiliza para almacenar propuestas de traducción y sus correspondientes metadatos. Este módulo viene a sustituir al elemento <alt-trans> presente en la versión 1.2. Está compuesto por un elemento principal <matches> que puede contener uno o más elementos <match>, que a su vez han de albergar un elemento de origen <xlf:source> y de llegada <xlf:target>. Asimismo, puede contener información de otros módulos (elementos internos y metadatos).

Para obtener más información sobre la nueva versión les remitimos a la sección de la página web del comité técnico que alberga los documentos técnicos creados por el propio comité. En dicha sección se puede encontrar el último borrador actualizado de la especificación XLIFF 2.0.

Futuro

Actualmente dentro del comité técnico se están debatiendo y respondiendo a los comentarios externos que la primera exposición pública oficial ha obtenido. Algunos de los miembros del comité también están trabajando en crear “declaraciones de uso”, es decir, demostrar que la nueva versión puede reproducirse en una herramienta o prototipo adaptados a ella. Tras estos necesarios trámites que ocuparán gran parte del trabajo del comité técnico en los próximos meses, se propondrá la versión final de la especificación para su aprobación.

Con más de diez años de existencia, el estándar XLIFF goza de una salud envidiable dentro del mundo de los estándares de localización: un buen soporte por parte de las herramientas de traducción y localización, un comité técnico robusto y con experiencia que se ocupa de su mantenimiento y desarrollo y una prometedora nueva versión que pretende cubrir las crecientes necesidades de la industria de la localización. Los meses venideros serán claves para medir el pulso del interés que suscita la nueva versión, su grado de implementación en las herramientas de traducción y localización y la acogida que obtendrá por parte de los agentes implicados. Les mantendremos informados.

Referencias

Jewtushenko, T. (2004) An Introduction to XLIFF. In IV International LRC Localisation Summer School 2004, 2/6/2004, pp. N/A. LRC, University of Limerick, Ireland.

Morado Vázquez, L., Filip, D. (2012) ‘XLIFF Support in CAT Tools’, XLIFF Promotion and Liaison Subcommittee, OASIS.

XLIFF TC (2008) ‘XLIFF 1.2 White Paper’, available: http://www.oasis-open.org/committees/download.php/26817/xliff-core-whitepaper-1.2-cs.pdf [accessed 29 July 2013].


No hi ha comentaris