Coordinación do desenvolvemento do corrector Hunspell de galego

From Proxecto Trasno
Revision as of 22:08, 4 March 2013 by Gallaecio (talk | contribs) (Irían xa está listado entre as correccións.)

Licenza

Estas notas, con data de maio de 2008, herdadas de Mancomun.org, distribúense baixo unha Licenza Creative Commons: Recoñecemento-CompartirIgual 3.0.

Desenvolvemento

O repositorio (almacén de código) para o desenvolvemento dos distintos compoñentes será a partir de agora: https://github.com/meixome

O corrector é en realidade un conxunto complexo de ferramentas que se combinan para ofrecer recursos de revisión lingüística.

  • Regras e dicionario ortográfico (distinguimos a corrección académica, volga, e a de galego común, xeral).
  • Dicionario de sinónimos.
  • Regras gramaticais e de estilo.
  • Lista de autocorrección (erros frecuentes).
  • Paquetes para os distintos aplicativos.
  • Listas de termos de especialidade.

Colabora enviándonos listas de palabras, comparte o teu dicionario, erros, comentarios!

Versión actual

A versión "volga" http://extensions.openoffice.org/en/project/Trasno-volga

A versión "xeral"

(pendente de publicación)

Informar de erros

Se detectas algún erro no corrector podes envialo ao seguinte enderezo de correo electrónico: meixome[no-spam]@[no-spam]certima.net ou á lista de correo e Trasno (proxecto@trasno.net) coa etiqueta [Hunspell] na liña do asunto.

Erros e propostas pendentes

Nota: aquí calquera que queira anotará erros detectados ou propostas de mellora do corrector. Unha vez valorado polos desenvolvedores, anotaranse noutro espazo da folla ou aplicaranse e indicarase.

Palabras correctas marcadas coma incorrectas

Palabras incorrectas marcadas coma correctas

A lista de erros a considerar está baleira. Se atopa algún erro que non estea listado xa nesta páxina (noutra sección, por exemplo), engádao aquí.
Nota: antes de engadir un erro deste tipo, asegúrese de que de verdade é un erro. Unha palabra pode non ser correcta como adxectivo ou substantivo pero si ser unha forma válida dun verbo. Por exemplo: diferencia- verbo, diferenza - substantivo.

Suxestións

  • acarrear → carrexar; acarretar → carretar; acarreto → carretada; aceituna → oliva; aclimar → aclimatar; adormiñar → adormecer, adurmiñar; afadigar → fatigar; afeizoado → afeccionado; afeizoar → afeccionar; afixar → fixar; afición, afección → afección; afrentar → afrontar; agá → agás; agarimeiro → agarimoso; agavear → gabear; aislado → illado; alemana → alemá; almea → amea; alquilar → alugar; alquiler → alugueiro, alugamento, renda; alxibeira → faltriqueira; amaldizoar → maldicir; amargurar → amargar; amenal → ameneiral; amenedo → ameneiral; amial → ameneiral; amigallar → esmigallar; amiúde → a miúdo; amoreira → moreira; anceio → arela; anchor → ancho, anchura; anseio → arela; aplastamento → esmagamento; aplastar → esmagar; apiedar → apiadar; apito → chifre; apodar → alcumar; apodo → alcume; apousar → repousar; apouso → repouso; apreto → aperto, apuro; arraizar → enraizar; arrañar → rañar; arrapiñar → rapinar; arreglar → arranxar; arreigar → arraigar; arreigo → arraigo; arrempuxón → empuxón; arrente, arrentes → a rentes; arrumar → arrombrar; asinalar → sinalar; asqueroso → noxento; ateitiñar → atoutiñar; atirar → tirar; atorado → atoado; atorar → atoar; avanear → abanear, abalar; avantaxe → vantaxe; avóvada → bóveda; azúcar → azucre;
  • balbor → balbordo; berisca → brisca; bimbán → bambán; bloco → bloque; boiar → aboiar; borcar → envorcar; bosnia → bosníaca, Bosnia (xa está); bosnio → bosníaco; breu → brea; buchelo → botelo; burrumbiada, burrumbio → rebumbio; bursatil, bursátil → bolsista; cálice → cáliz; calivera → caveira; caliza → calcaria, calcario; capitana → capitá; casaco → casaca; certar → acertar; cipaio, ciapio → sipaio; ciste → quiste; concluente → concluínte; concretizar → concretar; confradía → confraría; contenido → contido; contributo → contribución; corruncho → curruncho; cotidiano → cotián; couve → verza; cuio/a→ cuxo/a; cuota → cota; cutis → cute; dacordo → de acordo; danzal → lanzal; debalde → de balde; deborcar → envorcar; depresa → a présa; desaglutinar → separar; descontra → contra; desenvoca → desembocar (que tamén aparece esta); desinterés → desinterese; desmascarar → desenmascarar; detin, detín → detiven, deteron → detiveron; decimoprimeiro → décimo primeiro; decimosegundo → décimo segundo; decimoterceiro → décimo terceiro; decimocuarto → décimo cuarto; decimoquinto → décimo quinto; decimosexto → décimo sexto; decimosétimo, decimoséptimo → décimo sétimo; decimoctavo, decimooctavo → décimo octavo; decimonoveno → décimo noveno; diciembre → decembro; disfraz → disfrace; dolorido → dorido; domadura → doma; elle → ele dobre; embalde, enbalde → en balde; embarallar → barallar; embigal → umbilical; emporrancho → espido; empréstimo → empréstito; encender → acender, prender; enchemento → enchedura; encosta → costa; encurtadoiro → atallo; enero → xaneiro; engrova → engroba; ensoso → insulso; entretenemento → entretemento; enxofre → xofre; esbarballar → esbardallar; esbranquecer → branquear; esbranquizado → esbrancuxado; escadería → escalinata; escasez → escaseza; escoria → escoura; esfrega → frega; esfregamento → frega; esfregar → fregar; eso → iso; espalda → costas; esto → isto; estos → estes, estaos; esvaciar → baleirar; euskera, eusquera → éuscaro, vasco; evaluar → avaliar; evaluacion, evaluación → avaliación;
  • falopear → folerpar; feria → feira; flema → flegma; floresta → foresta; follame → follaxe; frenar → frear; fúlxedo → fúlxido; fumarada → fumareda, fumazo; galeira → galera; gandeiría → gandería; gatuñar → agatuñar; gatuxa → garatuxa; gavián → gabián; gazo → garzo; gazúa → ganzúa; grasoso → graxento; grudo → engrudo; herencia → herdanza; hostelería → hostalaría, hostalería; iglesia → igrexa; inquedar → inquietar; jueves → xoves; julio → xulio (xa está), xullo; junio → xuño; interés, interes → interese; isolado → illado; isolar → illar; inversionista → investidor/a; lavavaixelas → lavalouza; loubanza, louvanza → loanza; maestro → mestre; mapoula → papoula; marfín → margarida; medoñento, medoso → medorento; menudo/a → miúdo/a; miercoles (sen til, con til xa está) → mércores; minusvalido, minusválido → discapacitado; morcela → morcilla; morralla → borralla; musulmana → musulmá; muxeriego → mullereiro; nervo → nervio; nomada, nómada → nómade; nombrar → nomear; noruega (en minúscula) → Noruega (xa está), norueguesa; noruego → noruegués; nuboso → nubrado; octubre → outubro; olvido → esquecemento (substantivo), esquezo (verbo; xa está); ordear → ordenar; ordeñar → muxir; pamplina → parvada; paragüeiro → paraugueiro; personales → persoais; picor → proído; plancha → ferro de pasar, prancha; plantexar, plantear → presentar, propoñer, suxerir, formular, expresar, realizar, propor, preguntar(se), planificar, idear; postre → sobremesa (que apareza antes que «prostre»); recife → arrecife; reemprazar → substituír; reflectaba → reflectía; reflexar → reflectir; resgate → rescate; respetar → respectar; respeto → respecto; respostar → responder; retábulo → retablo;
  • sanguesuga → samesuga; secta → seita; seique → seica; seiturar → segar; semear → sementar; semen → seme; septiembre → setembro; sique → psique; sob → so; sobreiro → sobreira; soledade → soidade; soluzar → saloucar; soluzo → salouco; sondeo → sondaxe; soneira → somnolencia; sonicar → adormecerse, adurmiñarse; sucre → azucre; sugar → zugar; sugo → zume; suino, suíno → porcino; suiza → suíza, Suíza; sumiso → submiso; surleste → sueste; surro → xurro; surxir → xurdir; suxo → sucio; tabolete → tallo; templado/a → morno/a; temprano/a → temperán/temperá; tencion, tención → intención, intento; tencionar → intentar; terrapleno → terraplén; tibio → morno, tépedo; tifus → tifo; tiritar → bracuñar, tremelicar, tremer; tos → tose; traicionar → traizoar; traicioneiro → traizoeiro; trecho → treito; trombada → trompada; vaciar → baleirar; veneno → veleno; verxa → enreixado; viernes → venres; virollo → birollo; voltar → volver; xabali, xabalí → xabaril; xarron, xarrón → floreiro, vaso; vorcallás → vorcalladas; xelado → xeado; xelar → xear; xelo → xeo; xemeo → xemelgo; xunio → xuño, xenio, xonio; zumo → zume.

Módulos

Digalego

Módulo que incluirá o vocabulario do Digalego que non forme parte do DRAG. Listado aquí porque en caso de crearse, o recurso seguinte sería de gran utilidade. Pero non hai actualmente plans de crear este módulo.

  • Esta mensaxe, do 08-01-2009, leva anexa unha lista de palabras do Digalego.

Trasno

Módulo que incluirá o vocabulario aprobado nas Trasnadas.

Wesnoth

Módulo que incluirá vocabulario exclusivo do videoxogo A batalla polo Noroeste.

Erros en aplicativos que usan o corrector

Firefox

Na páxina de descarga do corrector ortográfico en Firefox, o apartado Sitio de asistencia está ligado a http://galician.mozdev.org/. Eu creo e suxiro que debería aparecer esta páxina (http://wiki.trasno.net/Corrector_Hunspell), xa que agora é aquí onde se fan as suxestións.

Erros e propostas pendentes de cambios en Hunspell

Permitir o uso de $ na cadea de substitución

  • *bucear → nadar a somorgullo.
  • *enemigar → poñer a mal.
  • *planchar, pranchar → pasar o ferro.

Erros e propostas en discusión

Sen decisión actualmente.

Criterios

  • Non incluír algunhas siglas de cortesía (RIP, QEPD,... que deben ir en minúsculas).

Vocabulario

En xeral habería que revisar a construción de derivados con sufixos e prefixos habituais (bi-, auto-, semi-, pro-, des- ). En todo caso, de introducirse debe facerse en conxunto, non ao socaire do que vaia aparecendo porque son variantes sistémicas de lingua.

Os prefixos máis frecuentes e relevantes para compoñer unha regra serían:

  • a-, ab-, aero-, afro-, alo-, an-, anfi-, anglo-, ante-, anti-, anti-, antropo-, arbori-, archi-, arqui-, auto-, bi-, bio-, bis-, carbo-, cardi-, centro-, ciclo-, cinema-, circun-, contra-, cosmo-, crio-, cuadr-, cuadri-, curvi-, dactilo-, deca-, deci-, demo-, dermato-, des-, di-, dia-, duo-, e-, eco-, endo-, enter-, entre-, epi-, equi-, estereo-, eu-, euro-, ex-, exo-, extra-, farmaco-, ferro-, fibro-, filo-, fisi-, fon-, grafo-, greco-, hemi-, hept-, heter-, hetero-, hex-, hidr-, hip-, hiper-, hipo-, homo-, i-, indo-, infra-, inter-, intra-, intro-, kilo-, lact-, loco-, logo-, lonxi-, luso-, macro-, magneto-, maxi-, mecano-, medico-, medio-, meso-, meta-, micr-, mini-, mio-, miso-, mono-, nano-, narco-, necro-, neo-, neur-, norte-, octo-, odont-, ofic-, ole-, omni-, onoco-, oo-, organo-, ornito-, orto-, oto-, ovo-, paleo-, pan-, penta-, per-, peri-, petro-, pielo-, piro-, pluvio-, podo-, poli-, porta-, pos-, post-, pre-, preter-, pro-, proto-, pseudo-, psic-, re-, rect-, retro-, semi-, servo-, seudo-, sin-, sismo-, so-, sobre-, socio-, sono-, sub-, super-, supra-, sur-, tecno-, tele-, teo-, topo-, toxico-, traqueo-, tri-, trombo-, turbo-, ultra-, uni-, uro-, vaso-, vice-, video-, xeo-, xero-, zoo-.

Erros e propostas sen fontes

Os seguintes erros e propostas aínda non se corrixiron ou aplicaron no corrector, a falta dunha fonte que os apoie, dado que non están contemplados no dicionario da Real Academia Galega.

Debe achegarse unha fonte para eliminalos da lista:

  • Ou ben unha fonte que apoie a súa validez; nese caso o termo engadirase ao corrector, xeralmente nun módulo para termos da fonte en cuestión que o valida.
  • Ou ben unha fonte que condene a súa validez; nese caso, o corrector actualizarase para fornecer suxestións para o termo.

Se coñece algunha fonte pro-RAG que apoie ou condene a validez de algún destes termos, non dubide en facérnolo saber.

Series léxicas

  • Abreviaturas de materias e disciplinas científicas habituais.
  • Abreviaturas latinas (ab init. cf. ibid. id., …).
  • Abreviaturas frecuentes: n.f., n.m., …
    • etc., fig., nº, núm.

Léxico xeral

Aumentativos, diminutivos e despectivos

Aumentativos (e despectivos), diminutivos: dado que son variacións morfolóxicas sistémicas, será mellor facer ou ben unha recollida sistemática ou non introducilos de momento. Actualmente están introducidos os que non son sistémicos (pulquérrimo, paupérrrimo, etc.)

  • elevadísimo
  • homón
  • mullerona
  • cantarín/cantarina

Léxico específico

Adverbios

  • atresadamente, bianualmente, bienalmente, despazo, disciplinariamente, electronicamente, exponencialmente, futbolisticamente, meteoroloxicamente, mitoloxicamente, morbidamente, nomeadamente, normativamente, paseniñamente, penalmente, porosamente, potestativamente, secuencialmente, vocalmente.

Adxectivos

  • acrítico, activábel/beis, activable/s, adaptativo, aeróbico, anaeróbico, argumentativo, autótrofo, bidimensional, boolenao/a/s, canalizador/a/es/as, cohesionado, conexionado/a/s, despregábel/beis, despregable/s, dialogante, disruptivo, editable, expedientado/a, extraescolar -es, fotocopiábel, grupal/grupais, hexadecimal, impredicíbel, incentivador, indesexado, iniciábel, iniciable, intercultural -ais, interdisciplinar, interpersoal -ais, interrelacionado, inusual, invasivo, lésbico, ligábel, lonxano, mediático/a, minusvalorado, multimedia, multiplataforma, multipunto, orzamentado/a, participativo, percusivo, poboacional, postural / posturais, reprografado/a/s, revitalizante, semidestruído, sobresdrúxulo/a/os/as, sumativo, sumatorio, supraterritorial, tacaño, tímbrico, vencellado, xudicializado/a/s.

Nomes propios

Antropónimos
  • Ainhoa, Álvarez, Analía, Ángela, Arquímedes, Bisbal, Cyrus, Díaz, Domínguez, Euclides, Euler, Felipe, Fermat, Gabilondo, García, Gutiérrez, Henríquez, Iñaki, Jesús, Juanma, Lorenzo, Márquez, Martínez, Mery, Montiño, Nieves, Novás, Oliver, Pablo, Reyero, Sinde, Sobera, Suárez, Touriñán, Velázquez, Villa, Zúñiga.
Divisas
  • Guyana Dollar.
Eventos, marcas, produtos, servizos
  • Android, BlackBerry, Boing, Dropbox, Eurocopa, Eurovisión, Facebook, Firefox, Gmail, Google, HP, Interviú, iOS, iPad, iPhone, LibreOffice, Mozilla, Neox, OpenOffice, Orange, Panoramio, Picasa, Skype, Spotify, Telecinco, Tuenti, Twitter, Vodafone, Wikipedia, Windows.
Personaxes de ficción
  • Doraemon, Nobita.
Topónimos
  • Galápagos, Güiana, Kosovo.
Varios
  • Marzán, Sangriña, Tabagón.
  • Nesta mensaxe hai 3000 palabras, moitas delas non contempladas no DRAG.

Substantivos

  • apampamento, aporofobia, audio, autoconfianza, autocorrección, autoestima, azafato, badén, balaventos/as, brigadista, búfer/s, cabullaría, caché/s, cartelaría/s, cián (invar.), cianobacteria, clúster/s, conectividade, contextualización, conversor/a/es, descodificador/a/es/as, desinstalar, desmotivación, dietista, documentador/a/es/as, discrecionalidade (invar.), drogodependencia, emprendemento, enchemento, etcéteras (en plural), etnocentrismo, expansor/a/es/as, glandulación, graneiro, heteroclamídea/s, hiperligazón, homofobia, impostación, infografía, islamofobia, internauta, marxinalidade, maxenta (invar.), medianoite/s, menaxe, miniaplicativo/s, monifante, monologuista, multiculturalidade, navegador -es, pantaloneta, paxinador, percance, percusionista -as, perianto, personalización, pervivencia (invar.), píxel -es, platelminto, plus, polinizador, portapapeis (invar.), preditor/a/es/as, privacidade, profesionalización/s, profundamento/s, redirección, renormativización, retroalimentación, salvidade, secuenciación, siniestralidade, sobrepasar, sostibilidade/s, subhasta/s, subpáxina/s, sumatorio, sustentabilidade, tecnotrónica, tedor/es, teletexto, temporalización, temporización, titorización, tóner, tríada, tubería, tweet/s, varapau/s, vial, visualizador, web, wikipedista, xemente/s, xentalla, xenxiva, xeosfera, xiria, xudicialización/s, zarcillo.

Verbos

  • adicionar, amordiscar, ampampar, autopropagar, consensuar, desetiquetar, desmotivar, formatar, implementar, impostar, interactuar, interconectar, interrelacionar, minusvalorar, monitorizar, orzamentar, posicionar, potabilizar, predefinir, priorizar, profesionalizar, protagonizar, recalcular, redenominar, redirixir, reprografar, resintonizar, respaldar, reutilizar, tosquear, vencellar, xudicializar, zarpar.

Erros corrixidos e propostas aplicadas

02-02-2013

01-02-2013

  • Jerusalén.
    • Sen cambios: a forma correcta é «Xerusalén», e xa aparece entre as suxestións.
  • Guadalajara.
    • Sen cambios: a forma correcta é «Guadalaxara», e xa aparece entre as suxestións.
  • Gerona.
  • Badajoz.
    • Sen cambios: a forma correcta é «Badaxoz», e xa aparece entre as suxestións.
  • estonio.
  • psicomotora.
    • Sen cambios: a forma correcta é «psicomotriz», e xa aparece entre as suxestións.
  • síncopa.
    • Sen cambios: a forma correcta é «síncope», e xa aparece entre as suxestións.
  • *estiben - estiven (do verbo «estar»).
    • Sen cambios: «estiben» é correcto, é unha forma do verbo «estibar»: estibe estibes estibe estibemos estibedes estiben.

31-01-2013

27-01-2013 - 28-01-2013

Vocabulario engadido

  • Símbolos internacionais das linguas (ISO 639).
  • Símbolos de moedas (ISO 4217).

Erros corrixidos

10-11-2012

Nomes

  • * dia (día)
  • * auxiliár, aparece como suxestión válida cando non o é.
  • * exercinte (exercente)
  • * astrinxente (adstrinxente)
  • * vinteún, *vintedous, *vintetrés, *vintecatro, *vintecinco, *vinteseis, *vintesete, *vinteoito, *vintenove. Débense escribir sempre desaglutinados: vinte e un, vinte e dous,...
  • * currículum (curriculum)
  • * vademécum (vademecum)
  • * estabelecemento0 (estabelecemento)


Verbos

  • hainas
  • continuei
  • elexir (elixir, ver toda a conxugación, CIII)


Revisar e introducir a casuística dos verbos irregulares cos pronomes: haino(PTE), óao (IMP), faino(PTE, IMP), ... que son consideradas formas incorrectas

Revisar a conxugación dos verbos que teñen dous posíbeis paradigmas (aínda que tenden á conxugación regular, especialmente nalgunhas persoas do PTO. e PS

dicir, ver, vir e todos os seus derivados motivados:

  • interviron
  • interviu
  • intervistes
  • maldixen
  • bendixen


  • éche
  • liches
  • leron
  • lera
  • leras
  • lerades
  • leran
  • lésemos
  • rísemos
  • lésedes
  • rísedes
  • lesen
  • leres
  • lermos
  • lerdes
  • leren
  • sirve
  • fuxe
  • iamos
  • iades
  • ide

Interxeccións (VOLG)

  • abur
  • ah
  • ai
  • arre
  • benia
  • canté
  • carafio
  • caramba
  • cataplún
  • coriño
  • dodemo
  • ea
  • eh
  • ei
  • eiramá
  • epa
  • gache
  • ho
  • hum
  • hurra
  • madeus
  • mícaro
  • múcaro
  • oh
  • oi
  • olé
  • paf
  • pam
  • pataplaf
  • pataplún
  • plof
  • pum
  • pumba
  • recoiro
  • to
  • uf
  • vaites
  • xo
  • guau (non VOLG)

Participios fortes e truncados

  • ido
  • absolto
  • acolleito
  • aflito
  • colleito
  • comesto
  • contradicido
  • controverso
  • desenvolto
  • desprovido
  • desprovisto
  • econlleito
  • envolto
  • desprover
  • desprovido
  • desprovisto
  • ergueito
  • inserto
  • limpado
  • refritir
  • volto
  • refritido
  • desdito
  • anisosilábico
  • antidóping
  • autoservizo
  • cableado ?

Series léxicas

  • abecedario ...
  • símbolos químicos ...
  • unidades do SI ...

18-12-2008

[Aínda non propagados ás versións estables/oficiais]

  • Dá como erro "célebre".. suxire "celebre" do verbo celebrar.
  • Non a dá como válida "consensuada"
  • Non a dá como válida "paseniñamente"
  • Non a dá como válida "inquedanza"
  • Non da como válida 'vogalía'.
  • Non ten o verbo LIMPAR mais conxuga un inexistente *IMPAR. Debe faltarlle o "l" ao principio do verbo.
  • Non inclúe o vbo. EXIXIR
  • Non inclúe o adxectivo pregable, nin pregábel como tampouco os plurais correspondentes.
  • Non inclúe o adx. promocional
  • Non ofrece "prexudicial" ao corrixir "prexuiciosa"
  • Non inclúe "dialogantes"
  • Non inclúe "indesexada"
  • Non inclúe descodificador pero si descodificar
  • Non inclúe o subs. conectividade.
  • Non inclúe o adx. derradeiro.
  • Non ofrece "sendeiros" ao corrixir "senderos"

Previos

  • Da como erro "Austria" e suxire cambialo por "Austria"; cambia "Austria" por "Austria " e volve a dar erro co. Parece unha especie de bucle infinito :p
  • Non inclúe "titorial/titoriais".
  • Non inclúe a preposición "por", "blogue/s", "están"
  • É caracteres e non caractéres
  • É cartafoles e non cartafois
  • Non inclúe vinculada e ademais suxire vinculantea.
  • Dá coma erro "prové"
  • Non inclúe "modular"
  • Se escribo "Búscanse" dame erro e suxírime "Buscanse".
  • Contén "robot" pero non "robots".
  • Non inclúe "xove" (de mozo)

Véxase tamén