Difference between revisions of "Converter .csv to .tbx. Creación dunha terminoloxía a partir dun ficheiro en Calc (.ods)"
m (→Cambiar a cabeceira do TBX) |
|||
(17 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
− | + | A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos. | |
− | + | == Introdución == | |
− | + | Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas: | |
− | - | + | * [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html csv2tbx] do Translate Toolkit |
− | * | + | * [http://www.qa-distiller.com/support/How_To_Use_QA_Distiller/How_to_check_for_terminology_mistakes/Create_a_dictionary.htm#Excel odstotbx] de QA-Distiller |
− | |||
− | |||
− | |||
+ | Polo tanto os pasos a seguir son: | ||
− | == Exemplo == | + | * Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis. |
+ | * Seguir as instrucións da páxina de referencia da ferramenta escollida. | ||
+ | * Tamén pode resultar de interese empregar [http://sourceforge.net/projects/tbxutil/ TBXcheck] para comprobar que o TBX é válido. | ||
+ | |||
+ | == Exemplo con csv2tbx == | ||
+ | |||
+ | A [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html documentación de csv2tbx] é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados: | ||
+ | |||
+ | * [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#csv-file-layout Formato de ficheiro CSV aceptado] | ||
+ | * [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#examples Diversos exemplos de uso] | ||
+ | * [http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/csv2tbx.html#two-column-csv Como converter un CSV de terminoloxía con dúas columnas] | ||
+ | |||
+ | === Notas sobre o ficheiro resultante === | ||
+ | |||
+ | Pode ser necesario [[#Cambiar a cabeceira do TBX | cambiar a cabeceira do ficheiro resultado]] xa que csv2tbx proporciona unha cabeceira demasiado básica que pode dar problemas. | ||
+ | |||
+ | {{Nota|O ficheiro TBX resultante emprega '''<langSet xml:lang="xx">''' para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo '''<langSet xml:lang="gl">''' para o galego.}} | ||
+ | |||
+ | == Exemplo con odstotbx == | ||
Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente. | Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente. | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | == | + | <table style="border-collapse: collapse; border: 1px solid black;"> |
+ | <tr> | ||
+ | <th style="border: 1px solid black; padding: 0.5em 1.5em; background-color: #ccc;">EN-US</th> | ||
+ | <th style="border: 1px solid black; padding: 0.5em 1.5em; background-color: #ccc;">GL</th> | ||
+ | </tr> | ||
+ | <tr> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">SQL statement</td> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">Posición SQL</td> | ||
+ | </tr> | ||
+ | <tr> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">Application</td> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">Aplicativo</td> | ||
+ | </tr> | ||
+ | <tr> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">Not supplied</td> | ||
+ | <td style="border: 1px solid black; padding: 0.5em 1.5em;">Non fornecido</td> | ||
+ | </tr> | ||
+ | </table> | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | == Exportar == | + | === Instalación === |
+ | |||
+ | *Descargar o ''XML Filter Package'' [http://www.qa-distiller.com/files/ODStoTBX.jar ODStoTBX.jar] e gardalo localmente no seu equipo | ||
+ | *Iniciar Calc de LibreOffice (ou de OpenOffice) | ||
+ | *Seleccionar '''Ferramentas → Configuración de filtros XML...''' | ||
+ | *Premer no botón '''Abrir paquete...''' | ||
+ | *Buscar o ficheiro ''ODStoTBX.jar'' no navegador e seleccionalo | ||
+ | *Aparecerá un novo filtro chamado '''TermBase eXchange''' na lista dos filtros dispoñíbeis | ||
+ | *Pechar o cadro de diálogo '''Configuración de filtros XML''' | ||
+ | |||
+ | === Exportar === | ||
*Abrir o ficheiro Calc que conterá dúas columnas | *Abrir o ficheiro Calc que conterá dúas columnas | ||
− | *Seleccionar Ficheiro | + | *Seleccionar '''Ficheiro → Exportar...''' |
− | *Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel | + | *Seleccionar '''TBX - Termbase eXchange''' da caixa de opcións despregábel |
*Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro | *Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro | ||
− | + | === Notas sobre o ficheiro resultante === | |
+ | |||
+ | Pode ser necesario [[#Cambiar a cabeceira do TBX | cambiar a cabeceira do ficheiro resultado]] xa que ODStoTBX proporciona unha cabeceira demasiado básica que pode dar problemas. | ||
+ | |||
+ | |||
+ | == Cambiar a cabeceira do TBX == | ||
+ | |||
+ | Pode ser necesario editar manualmente a cabeceira do ficheiro TBX xa que a veces a cabeceira é demasiado básica e pode dar problemas coa importación en determinadas ferramentas, por exemplo Terminator, ou ao [[Uso_de_TBXcheck_para_comprobar_se_un_ficheiro_.tbx_é_válido | pasarlle a ferramenta TBXcheck]] para comprobar que o esquema do TBX é válido. Pode empregarse a seguinte cabeceira como exemplo: | ||
− | |||
<pre> | <pre> | ||
− | <?xml version= | + | <?xml version="1.0" encoding="UTF-8"?> |
− | <!DOCTYPE martif SYSTEM | + | <!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd"> |
− | <martif type= | + | <martif type="TBX" xml:lang="en"> |
− | + | <martifHeader> | |
− | + | <fileDesc> | |
− | + | <titleStmt> | |
− | + | <title>Terminoloxía de MyPaint</title> | |
− | + | </titleStmt> | |
− | + | <sourceDesc> | |
− | + | <p>Creado por Antón Méixome, 2012 con http://www.qa-distiller.com/files/ODStoTBX.jar | |
− | http://www.qa-distiller.com/files/ODStoTBX.jar | + | Cabeceira modificada á man para poder validar empregando TBXcheck.</p> |
− | + | </sourceDesc> | |
− | + | </fileDesc> | |
− | + | <encodingDesc> | |
− | + | <p type="XCSURI">http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p> | |
− | + | </encodingDesc> | |
− | + | </martifHeader> | |
− | + | <text> | |
</pre> | </pre> |
Latest revision as of 16:32, 20 July 2013
A creación manual de ficheiros de terminoloxía en formato TBX é moi laboriosa. Debido a isto normalmente a creación de terminoloxía realízase mediante outros métodos.
Contents
Introdución[edit]
Para simplificar o proceso de creación de terminoloxía adóitanse empregar follas de cálculo para rexistrar a terminoloxía, e posteriormente convértense as follas de cálculo a formato TBX empregando unha destas dúas ferramentas:
Polo tanto os pasos a seguir son:
- Crear unha folla de cálculo con unha columna para cada idioma. Normalmente dúas ou máis.
- Seguir as instrucións da páxina de referencia da ferramenta escollida.
- Tamén pode resultar de interese empregar TBXcheck para comprobar que o TBX é válido.
Exemplo con csv2tbx[edit]
A documentación de csv2tbx é suficientemente boa, así que en vez de escribir unhas notas sobre o seu uso recomendamos ir directamente á documentación orixinal. En particular pode que sexan de interese os seguintes apartados:
- Formato de ficheiro CSV aceptado
- Diversos exemplos de uso
- Como converter un CSV de terminoloxía con dúas columnas
Notas sobre o ficheiro resultante[edit]
Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que csv2tbx proporciona unha cabeceira demasiado básica que pode dar problemas.
Nota: O ficheiro TBX resultante emprega <langSet xml:lang="xx"> para indicar o idioma destino. Terá que modificarse o ficheiro resultante para substituír ditas etiquetas por outras que indiquen o idioma destino, por exemplo <langSet xml:lang="gl"> para o galego. |
Exemplo con odstotbx[edit]
Debemos partir dun ficheiro en Calc que conteña dúas columnas, unha para cada idioma. A primeira fila debe conter o identificador do idioma correspondente.
EN-US | GL |
---|---|
SQL statement | Posición SQL |
Application | Aplicativo |
Not supplied | Non fornecido |
Instalación[edit]
- Descargar o XML Filter Package ODStoTBX.jar e gardalo localmente no seu equipo
- Iniciar Calc de LibreOffice (ou de OpenOffice)
- Seleccionar Ferramentas → Configuración de filtros XML...
- Premer no botón Abrir paquete...
- Buscar o ficheiro ODStoTBX.jar no navegador e seleccionalo
- Aparecerá un novo filtro chamado TermBase eXchange na lista dos filtros dispoñíbeis
- Pechar o cadro de diálogo Configuración de filtros XML
Exportar[edit]
- Abrir o ficheiro Calc que conterá dúas columnas
- Seleccionar Ficheiro → Exportar...
- Seleccionar TBX - Termbase eXchange da caixa de opcións despregábel
- Activar o nome de ficheiro con extensión automática e gardar o seu ficheiro
Notas sobre o ficheiro resultante[edit]
Pode ser necesario cambiar a cabeceira do ficheiro resultado xa que ODStoTBX proporciona unha cabeceira demasiado básica que pode dar problemas.
Cambiar a cabeceira do TBX[edit]
Pode ser necesario editar manualmente a cabeceira do ficheiro TBX xa que a veces a cabeceira é demasiado básica e pode dar problemas coa importación en determinadas ferramentas, por exemplo Terminator, ou ao pasarlle a ferramenta TBXcheck para comprobar que o esquema do TBX é válido. Pode empregarse a seguinte cabeceira como exemplo:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE martif SYSTEM "TBXcoreStructV02.dtd"> <martif type="TBX" xml:lang="en"> <martifHeader> <fileDesc> <titleStmt> <title>Terminoloxía de MyPaint</title> </titleStmt> <sourceDesc> <p>Creado por Antón Méixome, 2012 con http://www.qa-distiller.com/files/ODStoTBX.jar Cabeceira modificada á man para poder validar empregando TBXcheck.</p> </sourceDesc> </fileDesc> <encodingDesc> <p type="XCSURI">http://www.gala-global.org/oscarStandards/tbx/TBXXCSV02.xcs</p> </encodingDesc> </martifHeader> <text>