Difference between revisions of "Converter .csv to .tbx. Creación dunha terminoloxía a partir dun ficheiro en Calc (.ods)"

From Proxecto Trasno
(Instalación)
m (Cambiar a cabeceira do TBX)
 
(19 intermediate revisions by 2 users not shown)
Line 1: Line 1:
Se queremos crear un ficheiro de terminoloxía en formato TBX resulta moi laborioso facelo á man. Para automatizalo da maneira máis práctica temos dúas ferramentas:
+
A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos.
  
1- csv2tbx ferramenta de TTK [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/formats/tbx.html]
+
== Introdución ==
2- odstotbx ferramenta de QA-Distiller [http://www.qa-distiller.com/support/How_To_Use_QA_Distiller/How_to_check_for_terminology_mistakes/Create_a_dictionary.htm#Excel]
+
Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas:
  
----
+
* [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html csv2tbx] do Translate Toolkit
1.
+
* [http://www.qa-distiller.com/support/How_To_Use_QA_Distiller/How_to_check_for_terminology_mistakes/Create_a_dictionary.htm#Excel odstotbx] de QA-Distiller
Siga as instrucións da páxina de referencia
 
2.
 
Creación dunha folla de cálculo con dúas columnas (ou máis). Unha para cada idioma
 
  
 +
Polo tanto os pasos a seguir son:
  
== Exemplo ==
+
* Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis.
 +
* Seguir as instrucións da páxina de referencia da ferramenta escollida.
 +
* Tamén pode resultar de interese empregar [http://sourceforge.net/projects/tbxutil/ TBXcheck] para comprobar que o TBX é válido.
 +
 
 +
== Exemplo con csv2tbx ==
 +
 
 +
A [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html documentación de csv2tbx] é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados:
 +
 
 +
* [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#csv-file-layout Formato de ficheiro CSV aceptado]
 +
* [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#examples Diversos exemplos de uso]
 +
* [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#two-column-csv Como converter un CSV de terminoloxía con dúas columnas]
 +
 
 +
=== Notas sobre o ficheiro resultante ===
 +
 
 +
Pode ser necesario [[#Cambiar a cabeceira do TBX | cambiar a cabeceira do ficheiro resultado]]  xa que csv2tbx proporciona unha cabeceira demasiado básica que pode dar problemas.
 +
 
 +
{{Nota|O ficheiro TBX resultante emprega '''<langSet xml:lang="xx">''' para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo '''<langSet xml:lang="gl">''' para o galego.}}
 +
 
 +
== Exemplo con odstotbx ==
 
Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.
 
Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.
  
{| class="wikitable"
 
! EN-US
 
! GL
 
|-
 
|SQL statement||Posición SQL
 
|-
 
|Application||Aplicativo
 
|-
 
|Not supplied||Non fornecido
 
|-
 
|Not supplied||Non fornecido
 
|}
 
  
== Instalación ==
+
<table style="border-collapse: collapse; border: 1px solid black;">
 +
    <tr>
 +
        <th style="border: 1px solid black; padding: 0.5em 1.5em; background-color: #ccc;">EN-US</th>
 +
        <th style="border: 1px solid black; padding: 0.5em 1.5em; background-color: #ccc;">GL</th>
 +
    </tr>
 +
    <tr>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">SQL statement</td>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">Posición SQL</td>
 +
    </tr>
 +
    <tr>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">Application</td>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">Aplicativo</td>
 +
    </tr>
 +
    <tr>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">Not supplied</td>
 +
        <td style="border: 1px solid black; padding: 0.5em 1.5em;">Non fornecido</td>
 +
    </tr>
 +
</table>
  
*Descargar o XML Filter Package [http://www.qa-distiller.com/files/ODStoTBX.jar ODStoTBX.jar]e gardalo localmente no seu equipo
 
*Iniciar Calc de LibreOffice ou OpenOffice
 
*Seleccionar Ferramentas > Configuración de filtros XML...
 
*Seleccionar Abrir paquete (botón á dereita)...
 
*Buscar o ficheiro ODStoTBX.jar no navegador e seleccionalo
 
*Aparecerá un novo filtro chamado TermBase eXchange na lista dos dispoñíbeis
 
*Pechar o cadro de diálogo Configuración de filtros XML
 
  
== Exportar ==
+
=== Instalación ===
 +
 
 +
*Descargar o ''XML Filter Package'' [http://www.qa-distiller.com/files/ODStoTBX.jar ODStoTBX.jar] e gardalo localmente no seu equipo
 +
*Iniciar Calc de LibreOffice (ou de OpenOffice)
 +
*Seleccionar '''Ferramentas &rarr; Configuración de filtros XML...'''
 +
*Premer no botón '''Abrir paquete...'''
 +
*Buscar o ficheiro ''ODStoTBX.jar'' no navegador e seleccionalo
 +
*Aparecerá un novo filtro chamado '''TermBase eXchange''' na lista dos filtros dispoñíbeis
 +
*Pechar o cadro de diálogo '''Configuración de filtros XML'''
 +
 
 +
=== Exportar ===
  
 
*Abrir o ficheiro Calc que conterá dúas columnas
 
*Abrir o ficheiro Calc que conterá dúas columnas
*Seleccionar Ficheiro > Exportar...
+
*Seleccionar '''Ficheiro &rarr; Exportar...'''
*Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel
+
*Seleccionar '''TBX - Termbase eXchange''' da caixa de opcións despregábel
 
*Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro
 
*Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro
  
Nota: Pode ser necesario editar manualmente a cabeceira do ficheiro resultado xa que odstotbx proporciona unha demasiado básica que pode dar problemas coa importación en segundo que ferramentas como Terminator
+
=== Notas sobre o ficheiro resultante ===
 +
 
 +
Pode ser necesario [[#Cambiar a cabeceira do TBX | cambiar a cabeceira do ficheiro resultado]]  xa que ODStoTBX proporciona unha cabeceira demasiado básica que pode dar problemas.
 +
 
 +
 
 +
== Cambiar a cabeceira do TBX ==
 +
 
 +
Pode ser necesario editar manualmente a cabeceira do ficheiro TBX xa que a veces a cabeceira é demasiado básica e pode dar problemas coa importación en determinadas ferramentas, por exemplo Terminator, ou ao [[Uso_de_TBXcheck_para_comprobar_se_un_ficheiro_.tbx_é_válido | pasarlle a ferramenta TBXcheck]] para comprobar que o esquema do TBX é válido. Pode empregarse a seguinte cabeceira como exemplo: 
  
== Cabeceira recomendada ==
+
<pre>
<code>
 
  
<?xml version='1.0' encoding='UTF-8'?>
+
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE martif SYSTEM 'TBXcoreStructV02.dtd'>
+
<!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd">
<martif type='TBX' xml:lang='en'>
+
<martif type="TBX" xml:lang="en">
    <martifHeader>
+
  <martifHeader>
        <fileDesc>
+
    <fileDesc>
            <titleStmt>
+
      <titleStmt>
                <title>MyPaint TerminoloxiaL</title>
+
        <title>Terminoloxía de MyPaint</title>
            </titleStmt>
+
      </titleStmt>
            <sourceDesc>
+
      <sourceDesc>
                <p>Creado por Antón Méixome, 2012 con
+
        <p>Creado por Antón Méixome, 2012 con http://www.qa-distiller.com/files/ODStoTBX.jar
http://www.qa-distiller.com/files/ODStoTBX.jar e cabeceira á man</p>
+
          Cabeceira modificada á man para poder validar empregando TBXcheck.</p>
            </sourceDesc>
+
      </sourceDesc>
        </fileDesc>
+
    </fileDesc>
        <encodingDesc>
+
    <encodingDesc>
            <p type='XCSURI'>http://www.lisa.org/fileadmin/standards/tbx/TBXXCSV02.xcs</p>
+
      <p type="XCSURI">http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p>
        </encodingDesc>
+
    </encodingDesc>
    </martifHeader>
+
  </martifHeader>
    <text>
+
  <text>
  
<code/>
+
</pre>

Latest revision as of 16:32, 20 July 2013

A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos.

Introdución[edit]

Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas:

Polo tanto os pasos a seguir son:

  • Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis.
  • Seguir as instrucións da páxina de referencia da ferramenta escollida.
  • Tamén pode resultar de interese empregar TBXcheck para comprobar que o TBX é válido.

Exemplo con csv2tbx[edit]

A documentación de csv2tbx é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados:

Notas sobre o ficheiro resultante[edit]

Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que csv2tbx proporciona unha cabeceira demasiado básica que pode dar problemas.


Nota: O ficheiro TBX resultante emprega <langSet xml:lang="xx"> para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo <langSet xml:lang="gl"> para o galego.

Exemplo con odstotbx[edit]

Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.


EN-US GL
SQL statement Posición SQL
Application Aplicativo
Not supplied Non fornecido


Instalación[edit]

  • Descargar o XML Filter Package ODStoTBX.jar e gardalo localmente no seu equipo
  • Iniciar Calc de LibreOffice (ou de OpenOffice)
  • Seleccionar Ferramentas → Configuración de filtros XML...
  • Premer no botón Abrir paquete...
  • Buscar o ficheiro ODStoTBX.jar no navegador e seleccionalo
  • Aparecerá un novo filtro chamado TermBase eXchange na lista dos filtros dispoñíbeis
  • Pechar o cadro de diálogo Configuración de filtros XML

Exportar[edit]

  • Abrir o ficheiro Calc que conterá dúas columnas
  • Seleccionar Ficheiro → Exportar...
  • Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel
  • Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro

Notas sobre o ficheiro resultante[edit]

Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que ODStoTBX proporciona unha cabeceira demasiado básica que pode dar problemas.


Cambiar a cabeceira do TBX[edit]

Pode ser necesario editar manualmente a cabeceira do ficheiro TBX xa que a veces a cabeceira é demasiado básica e pode dar problemas coa importación en determinadas ferramentas, por exemplo Terminator, ou ao pasarlle a ferramenta TBXcheck para comprobar que o esquema do TBX é válido. Pode empregarse a seguinte cabeceira como exemplo:


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd">
<martif type="TBX" xml:lang="en">
  <martifHeader>
    <fileDesc>
      <titleStmt>
        <title>Terminoloxía de MyPaint</title>
      </titleStmt>
      <sourceDesc>
        <p>Creado por Antón Méixome, 2012 con http://www.qa-distiller.com/files/ODStoTBX.jar
           Cabeceira modificada á man para poder validar empregando TBXcheck.</p>
      </sourceDesc>
    </fileDesc>
    <encodingDesc>
      <p type="XCSURI">http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p>
    </encodingDesc>
  </martifHeader>
  <text>