Difference between revisions of "Converter .csv to .tbx. Creación dunha terminoloxía a partir dun ficheiro en Calc (.ods)"

From Proxecto Trasno
(Engado notas sobre csv2tbx)
m (Cabeceira recomendada: Actualizar ligazón do XCS)
Line 86: Line 86:
 
         </fileDesc>
 
         </fileDesc>
 
         <encodingDesc>
 
         <encodingDesc>
             <p type='XCSURI'>http://www.lisa.org/fileadmin/standards/tbx/TBXXCSV02.xcs</p>
+
             <p type='XCSURI'>http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p>
 
         </encodingDesc>
 
         </encodingDesc>
 
     </martifHeader>
 
     </martifHeader>

Revision as of 13:11, 20 July 2013

A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos.

Introdución

Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas:

Polo tanto os pasos a seguir son:

  • Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis.
  • Seguir as instrucións da páxina de referencia da ferramenta escollida.
  • Tamén pode resultar de interese empregar TBXcheck para comprobar que o TBX é válido.

Exemplo con csv2tbx

A documentación de csv2tbx é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados:


Nota: O ficheiro TBX resultante emprega <langSet xml:lang="xx"> para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo <langSet xml:lang="gl"> para o galego.


Exemplo con odstotbx

Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.


EN-US GL
SQL statement Posición SQL
Application Aplicativo
Not supplied Non fornecido


Instalación

  • Descargar o XML Filter Package ODStoTBX.jar e gardalo localmente no seu equipo
  • Iniciar Calc de LibreOffice (ou de OpenOffice)
  • Seleccionar Ferramentas → Configuración de filtros XML...
  • Premer no botón Abrir paquete...
  • Buscar o ficheiro ODStoTBX.jar no navegador e seleccionalo
  • Aparecerá un novo filtro chamado TermBase eXchange na lista dos filtros dispoñíbeis
  • Pechar o cadro de diálogo Configuración de filtros XML

Exportar

  • Abrir o ficheiro Calc que conterá dúas columnas
  • Seleccionar Ficheiro → Exportar...
  • Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel
  • Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro

Cabeceira recomendada

Pode ser necesario editar manualmente a cabeceira do ficheiro resultado xa que odstotbx proporciona unha demasiado básica que pode dar problemas coa importación en segundo que ferramentas como Terminator. Tamén pode resultar de interese pasarlle unha ferramenta para comprobar que o esquema do TBX é válido: TBXcheck


<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE martif SYSTEM 'TBXcoreStructV02.dtd'>
<martif type='TBX' xml:lang='en'>
    <martifHeader>
        <fileDesc>
            <titleStmt>
                <title>MyPaint TerminoloxiaL</title>
            </titleStmt>
            <sourceDesc>
                <p>Creado por Antón Méixome, 2012 con
http://www.qa-distiller.com/files/ODStoTBX.jar e cabeceira á man</p>
            </sourceDesc>
        </fileDesc>
        <encodingDesc>
            <p type='XCSURI'>http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p>
        </encodingDesc>
    </martifHeader>
    <text>