Coordinación do desenvolvemento do corrector Hunspell de galego

From Proxecto Trasno
Revision as of 14:53, 2 June 2013 by Meixome (talk | contribs) (Países)

Esta páxina ten por obxectivo servir de punto de encontro para os contribuidores do corrector Hunspell de galego. Para información xeral sobre o corrector, véxase a páxina en trasno.net.

O código fonte do corrector Hunspell de galego está aloxado en GitHub.

Erros e propostas pendentes

Nota: aquí calquera que queira anotará erros detectados ou propostas de mellora do corrector. Unha vez valorado polos desenvolvedores, anotaranse noutro espazo da folla ou aplicaranse e indicarase.

Palabras correctas marcadas coma incorrectas

A lista de erros a considerar está baleira. Se atopa algún erro que non estea listado xa nesta páxina (noutra sección, por exemplo), engádao aquí.

Palabras incorrectas marcadas coma correctas

A lista de erros a considerar está baleira. Se atopa algún erro que non estea listado xa nesta páxina (noutra sección, por exemplo), engádao aquí.
Nota: antes de engadir un erro deste tipo, asegúrese de que de verdade é un erro. Unha palabra pode non ser correcta como adxectivo ou substantivo pero si ser unha forma válida dun verbo. Por exemplo: diferencia- verbo, diferenza - substantivo.

Suxestións

Nota: Este espazo é para suxestións xenéricas e xerais. Engada as suxestións de parellas de palabras á lista da Galipedia en vez de a esta páxina (por exemplo: «árbol → árbore»).
  • Nas palabras incorrectas engadide con e sen til. Por exemplo: confradía, confradia → confraría, convirtíu → converteu.
  • Nas palabras en maiúscula, darlle certa prioridade aos cambios de tiles sobre outras palabras. Por exemplo: Ainda → Aínda, Dí → Di
  • As palabras que rematan no prefixo -ana/o (como humano, marciano) cambiádelle o prefixo por estoutro -á/án (humán, marcián), e que nestes erros se suxira a palabra rematada en -ano (e viceversa).
  • -iles → ís; por exemplo: barriles → barrís, carriles → carrís.
  • -íles → ís; por exemplo: raíles → raís.
  • -xo → -ciu (polo castelán -jo); por exemplo: produxo → produciu.
  • -aba → -ía; por exemplo: reflectaba → reflectía.
  • -ubo → -ivo; por exemplo: estubo → estivo.

Módulos

DRAG

Existen algunhas diferenzas entre o dicionario da Real Academia Galega e o VOLGa. Actualmente o corrector usa o VOLGa como fonte principal, pero cómpre fornecer tamén un módulo co vocabulario do DRAG, e que o corrector inclúa de maneira predeterminada ambos os dous recursos.

A seguinte é unha lista das diferenzas do DRAG con respecto do VOLGa (engádense a medida que alguén as detecta, non dubide en completar a lista de detecta vostede algunha destas diferenzas):

  • Palabras que están no DRAG e non no VOLGa:
  • Palabras que non están no DRAG que si que están no VOLGa:
    • anque
    • columpio
  • Palabras que aparecen de xeito distinto en cada un dos dous recursos:
    • «delirium tremens» no VOLGa, «delírium tremens» no DRAG.

Digalego

Módulo que incluirá o vocabulario do Digalego que non forme parte do DRAG. Listado aquí porque en caso de crearse, o recurso seguinte sería de gran utilidade. Pero non hai actualmente plans de crear este módulo.

  • Esta mensaxe, do 08-01-2009, leva anexa unha lista de palabras do Digalego.

Países

Cómpre engadir un módulo, «galipedia/toponimia/países», que inclúa todos os países da Galipedia. Estes son algúns dos países que o corrector marca como incorrectos actualmente e que deberán aparecer no módulo:

  • Sudáfrica (DRAG Suráfrica)

Erros en aplicativos que usan o corrector

Firefox

Na páxina de descarga do corrector ortográfico en Firefox, o apartado Sitio de asistencia está ligado a http://galician.mozdev.org/. Eu creo e suxiro que debería aparecer esta páxina (http://wiki.trasno.net/Corrector_Hunspell), xa que agora é aquí onde se fan as suxestións.

Erros e propostas pendentes de cambios en Hunspell

Permitir o uso de $ na cadea de substitución

  • *bucear → nadar a somorgullo.
  • *enemigar → poñer a mal.
  • *planchar, pranchar → pasar o ferro.

Erros e propostas en discusión

Sen decisión actualmente.

Criterios

  • Non incluír algunhas siglas de cortesía (RIP, QEPD,... que deben ir en minúsculas).

Vocabulario

En xeral habería que revisar a construción de derivados con sufixos e prefixos habituais (bi-, auto-, semi-, pro-, des- ). En todo caso, de introducirse debe facerse en conxunto, non ao socaire do que vaia aparecendo porque son variantes sistémicas de lingua.

Os prefixos máis frecuentes e relevantes para compoñer unha regra serían:

  • a-, ab-, aero-, afro-, alo-, an-, anfi-, anglo-, ante-, anti-, anti-, antropo-, arbori-, archi-, arqui-, auto-, bi-, bio-, bis-, carbo-, cardi-, centro-, ciclo-, cinema-, circun-, contra-, cosmo-, crio-, cuadr-, cuadri-, curvi-, dactilo-, deca-, deci-, demo-, dermato-, des-, di-, dia-, duo-, e-, eco-, endo-, enter-, entre-, epi-, equi-, estereo-, eu-, euro-, ex-, exo-, extra-, farmaco-, ferro-, fibro-, filo-, fisi-, fon-, grafo-, greco-, hemi-, hept-, heter-, hetero-, hex-, hidr-, hip-, hiper-, hipo-, homo-, i-, indo-, infra-, inter-, intra-, intro-, kilo-, lact-, loco-, logo-, lonxi-, luso-, macro-, magneto-, maxi-, mecano-, medico-, medio-, meso-, meta-, micr-, mini-, mio-, miso-, mono-, nano-, narco-, necro-, neo-, neur-, norte-, octo-, odont-, ofic-, ole-, omni-, onoco-, oo-, organo-, ornito-, orto-, oto-, ovo-, paleo-, pan-, penta-, per-, peri-, petro-, pielo-, piro-, pluvio-, podo-, poli-, porta-, pos-, post-, pre-, preter-, pro-, proto-, pseudo-, psic-, re-, rect-, retro-, semi-, servo-, seudo-, sin-, sismo-, so-, sobre-, socio-, sono-, sub-, super-, supra-, sur-, tecno-, tele-, teo-, topo-, toxico-, traqueo-, tri-, trombo-, turbo-, ultra-, uni-, uro-, vaso-, vice-, video-, xeo-, xero-, zoo-.

Erros e propostas sen fontes

Os seguintes erros e propostas aínda non se corrixiron ou aplicaron no corrector, a falta dunha fonte que os apoie, dado que non están contemplados no dicionario da Real Academia Galega.

Debe achegarse unha fonte para eliminalos da lista:

  • Ou ben unha fonte que apoie a súa validez; nese caso o termo engadirase ao corrector, xeralmente nun módulo para termos da fonte en cuestión que o valida.
  • Ou ben unha fonte que condene a súa validez; nese caso, o corrector actualizarase para fornecer suxestións para o termo.

Se coñece algunha fonte pro-RAG que apoie ou condene a validez de algún destes termos, non dubide en facérnolo saber.

Series léxicas

  • Abreviaturas de materias e disciplinas científicas habituais.
  • Abreviaturas latinas (ab init. cf. ibid. id., …).
  • Abreviaturas frecuentes: n.f., n.m., …
    • etc., fig., nº, núm.

Léxico xeral

Aumentativos, diminutivos e despectivos

Aumentativos (e despectivos), diminutivos: dado que son variacións morfolóxicas sistémicas, será mellor facer ou ben unha recollida sistemática ou non introducilos de momento. Actualmente están introducidos os que non son sistémicos (pulquérrimo, paupérrrimo, etc.)

  • elevadísimo
  • homón
  • mullerona
  • cantarín/cantarina

Léxico específico

Adverbios

  • atresadamente, bianualmente, bienalmente, despazo, disciplinariamente, electronicamente, exponencialmente, futbolisticamente, meteoroloxicamente, mitoloxicamente, morbidamente, nomeadamente, normativamente, paseniñamente, penalmente, porosamente, potestativamente, secuencialmente, vocalmente.

Adxectivos

  • acrítico, activábel/beis, activable/s, adaptativo, aeróbico, anaeróbico, argumentativo, autótrofo, bidimensional, boolenao/a/s, canalizador/a/es/as, cohesionado, conexionado/a/s, despregábel/beis, despregable/s, dialogante, disruptivo, editable, expedientado/a, extraescolar -es, fotocopiábel, grupal/grupais, hexadecimal, impredicíbel, incentivador, indesexado, iniciábel, iniciable, intercultural -ais, interdisciplinar, interpersoal -ais, interrelacionado, inusual, invasivo, lésbico, ligábel, lonxano, mediático/a, minusvalorado, multimedia, multiplataforma, multipunto, orzamentado/a, participativo, percusivo, poboacional, postural / posturais, reprografado/a/s, revitalizante, semidestruído, sobresdrúxulo/a/os/as, sumativo, sumatorio, supraterritorial, tacaño, tímbrico, vencellado, xudicializado/a/s.

Nomes propios

Antropónimos
  • Ainhoa, Álvarez, Analía, Ángela, Arquímedes, Bisbal, Cyrus, Díaz, Domínguez, Euclides, Euler, Felipe, Fermat, Gabilondo, García, Gutiérrez, Henríquez, Iñaki, Jesús, Juanma, Lorenzo, Márquez, Martínez, Mery, Montiño, Nieves, Novás, Oliver, Pablo, Reyero, Sinde, Sobera, Suárez, Touriñán, Velázquez, Villa, Zúñiga.
Divisas
  • Guyana Dollar.
Eventos, marcas, produtos, servizos
  • Android, BlackBerry, Boing, Dropbox, Eurocopa, Eurovisión, Facebook, Firefox, Gmail, Google, HP, Interviú, iOS, iPad, iPhone, LibreOffice, Mozilla, Neox, OpenOffice, Orange, Panoramio, Picasa, Skype, Spotify, Telecinco, Tuenti, Twitter, Vodafone, Wikipedia, Windows.
Personaxes de ficción
  • Doraemon, Nobita.
Topónimos
  • Galápagos, Güiana, Kosovo.
Varios
  • Marzán, Sangriña, Tabagón.
  • Nesta mensaxe hai 3000 palabras, moitas delas non contempladas no DRAG.

Substantivos

  • apampamento, aporofobia, audio, autoconfianza, autocorrección, autoestima, azafato, badén, balaventos/as, brigadista, búfer/s, cabullaría, caché/s, cartelaría/s, cián (invar.), cianobacteria, clúster/s, conectividade, contextualización, conversor/a/es, descodificador/a/es/as, desinstalar, desmotivación, dietista, documentador/a/es/as, discrecionalidade (invar.), drogodependencia, emprendemento, enchemento, etcéteras (en plural), etnocentrismo, expansor/a/es/as, glandulación, graneiro, heteroclamídea/s, hiperligazón, homofobia, impostación, infografía, islamofobia, internauta, marxinalidade, maxenta (invar.), medianoite/s, menaxe, miniaplicativo/s, monifante, monologuista, multiculturalidade, navegador -es, pantaloneta, paxinador, percance, percusionista -as, perianto, personalización, pervivencia (invar.), píxel -es, platelminto, plus, polinizador, portapapeis (invar.), preditor/a/es/as, privacidade, profesionalización/s, profundamento/s, redirección, renormativización, retroalimentación, salvidade, secuenciación, siniestralidade, sobrepasar, sostibilidade/s, subhasta/s, subpáxina/s, sumatorio, sustentabilidade, tecnotrónica, tedor/es, teletexto, temporalización, temporización, titorización, tóner, tríada, tubería, tweet/s, varapau/s, vial, visualizador, web, wikipedista, xemente/s, xentalla, xenxiva, xeosfera, xiria, xudicialización/s, zarcillo.

Verbos

  • adicionar, amordiscar, ampampar, autopropagar, consensuar, desetiquetar, desmotivar, formatar, implementar, impostar, interactuar, interconectar, interrelacionar, minusvalorar, monitorizar, orzamentar, posicionar, potabilizar, predefinir, priorizar, profesionalizar, protagonizar, recalcular, redenominar, redirixir, reprografar, resintonizar, respaldar, reutilizar, tosquear, vencellar, xudicializar, zarpar.

Véxase tamén

Categoría:Corrector Hunspell de galego