Converter .csv to .tbx. Creación dunha terminoloxía a partir dun ficheiro en Calc (.ods)

De Proxecto trasno

A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos.

Índice

Introdución

Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas:

Polo tanto os pasos a seguir son:

  • Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis.
  • Seguir as instrucións da páxina de referencia da ferramenta escollida.
  • Tamén pode resultar de interese empregar TBXcheck para comprobar que o TBX é válido.

Exemplo con csv2tbx

A documentación de csv2tbx é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados:

Notas sobre o ficheiro resultante

Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que csv2tbx proporciona unha cabeceira demasiado básica que pode dar problemas.


Nota: O ficheiro TBX resultante emprega <langSet xml:lang="xx"> para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo <langSet xml:lang="gl"> para o galego.

Exemplo con odstotbx

Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.


EN-US GL
SQL statement Posición SQL
Application Aplicativo
Not supplied Non fornecido


Instalación

  • Descargar o XML Filter Package ODStoTBX.jar e gardalo localmente no seu equipo
  • Iniciar Calc de LibreOffice (ou de OpenOffice)
  • Seleccionar Ferramentas → Configuración de filtros XML...
  • Premer no botón Abrir paquete...
  • Buscar o ficheiro ODStoTBX.jar no navegador e seleccionalo
  • Aparecerá un novo filtro chamado TermBase eXchange na lista dos filtros dispoñíbeis
  • Pechar o cadro de diálogo Configuración de filtros XML

Exportar

  • Abrir o ficheiro Calc que conterá dúas columnas
  • Seleccionar Ficheiro → Exportar...
  • Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel
  • Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro

Notas sobre o ficheiro resultante

Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que ODStoTBX proporciona unha cabeceira demasiado básica que pode dar problemas.


Cambiar a cabeceira do TBX

Pode ser necesario editar manualmente a cabeceira do ficheiro TBX xa que a veces a cabeceira é demasiado básica e pode dar problemas coa importación en determinadas ferramentas, por exemplo Terminator, ou ao pasarlle a ferramenta TBXcheck para comprobar que o esquema do TBX é válido. Pode empregarse a seguinte cabeceira como exemplo:


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd">
<martif type="TBX" xml:lang="en">
  <martifHeader>
    <fileDesc>
      <titleStmt>
        <title>Terminoloxía de MyPaint</title>
      </titleStmt>
      <sourceDesc>
        <p>Creado por Antón Méixome, 2012 con http://www.qa-distiller.com/files/ODStoTBX.jar
           Cabeceira modificada á man para poder validar empregando TBXcheck.</p>
      </sourceDesc>
    </fileDesc>
    <encodingDesc>
      <p type="XCSURI">http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p>
    </encodingDesc>
  </martifHeader>
  <text>

Ferramentas persoais