Difference between revisions of "Coordinación do desenvolvemento do corrector Hunspell de galego"

From Proxecto Trasno
(Desenvolvemento)
(Desenvolvemento)
Line 10: Line 10:
 
O corrector é en realidade un conxunto complexo de ferramentas que se combinan para ofrecer recursos de revisión lingüistica
 
O corrector é en realidade un conxunto complexo de ferramentas que se combinan para ofrecer recursos de revisión lingüistica
  
*- ortográfica (distinguimos a corrección académica, volga, e a de galego común, xeral)
+
*- regras e dicionario ortográfico (distinguimos a corrección académica, volga, e a de galego común, xeral)
*- sinónimos
+
*- dicionario de sinónimos
*- autocorrección
+
*- regras gramaticais e de estilo
*- gramatical e de estilo
+
*- lista de autocorrección (erros frecuentes)
*- autocorrección (erros frecuentes)
 
 
*- paquetes para os distintos programas
 
*- paquetes para os distintos programas
*- listas de termos
+
*- listas de termos de especialidade
  
Colabora enviándonos listas de palabras, erros, comentarios!
+
Colabora enviándonos listas de palabras, comparte o teu dicionario, erros, comentarios!
  
 
== Versión actual ==
 
== Versión actual ==

Revision as of 13:58, 21 October 2012

Licenza

Estas notas con data de maio de 2008, herdadas de Mancomun.org, distribúense baixo unha Licenza Creative Commons: Recoñecemento-CompartirIgual 3.0

Desenvolvemento

O repositorio (almacén de código) para o desenvolvemento dos distintos compoñentes será a partir de agora

https://github.com/meixome

O corrector é en realidade un conxunto complexo de ferramentas que se combinan para ofrecer recursos de revisión lingüistica

  • - regras e dicionario ortográfico (distinguimos a corrección académica, volga, e a de galego común, xeral)
  • - dicionario de sinónimos
  • - regras gramaticais e de estilo
  • - lista de autocorrección (erros frecuentes)
  • - paquetes para os distintos programas
  • - listas de termos de especialidade

Colabora enviándonos listas de palabras, comparte o teu dicionario, erros, comentarios!

Versión actual

A versión "volga" http://extensions.openoffice.org/en/project/Trasno-volga

A versión "xeral"

(pendente de publicación)

Erros detectados e en revisión

Se detectas algún erro no corrector podes envialo ao seguinte enderezo de correo electrónico: meixome[no-spam]@[no-spam]certima.net ou á lista de correo e Trasno (proxecto@trasno.net) coa etiqueta [Hunspell] na liña do asunto.

Erros pendentes

Nomes

- *dia (día)
- *auxiliár, aparece como suxestión válida cando non o é.
- *exercinte (exercente)
- *astrinxente (adstrinxente)
- *vinteún, *vintedous, *vintetrés, *vintecatro, *vintecinco, *vinteseis, *vintesete, *vinteoito, - *vintenove. Débense escribir sempre desaglutinados: vinte e un, vinte e dous,...
- *currículum (curriculum) - *vademécum (vademecum)


Verbos

  • hainas
  • continuei
  • elexir (elixir, ver toda a conxugación, CIII)


Revisar e introducir a casuística dos verbos irregulares cos pronomes: haino(PTE), óao (IMP), faino(PTE, IMP), ... que son consideradas formas incorrectas

Revisar a conxugación dos verbos que teñen dous posíbeis paradigmas (aínda que tenden á conxugación regular, especialmente nalgunhas persoas do PTO. e PS

dicir, ver, vir e todos os seus derivados motivados:

  • interviron
  • interviu
  • intervistes
  • maldixen
  • bendixen


  • éche
  • liches
  • leron
  • lera
  • leras
  • lerades
  • leran
  • lésemos
  • rísemos
  • lésedes
  • rísedes
  • lesen
  • leres
  • lermos
  • lerdes
  • leren
  • sirve
  • fuxe
  • iamos
  • iades
  • ide

Eivas pendentes

Interxeccións (VOLG)

  • abur
  • ah
  • ai
  • arre
  • benia
  • canté
  • carafio
  • caramba
  • cataplún
  • coriño
  • dodemo
  • ea
  • eh
  • ei
  • eiramá
  • epa
  • gache
  • ho
  • hum
  • hurra
  • madeus
  • mícaro
  • múcaro
  • oh
  • oi
  • olé
  • paf
  • pam
  • pataplaf
  • pataplún
  • plof
  • pum
  • pumba
  • recoiro
  • to
  • uf
  • vaites
  • xo
  • guau (non VOLG)

Participios fortes e truncados

  • ido
  • absolto
  • acolleito
  • aflito
  • colleito
  • comesto
  • contradicido
  • controverso
  • desenvolto
  • desprovido
  • desprovisto
  • econlleito
  • envolto
  • desprover
  • desprovido
  • desprovisto
  • ergueito
  • inserto
  • limpado
  • refritir
  • volto
  • refritido
  • desdito
  • anisosilábico
  • antidóping
  • autoservizo
  • cableado ?

Series léxicas

  • abecedario ...
  • símbolos químicos ...
  • unidades do SI ...
  • símbolos internacionais das linguas ...
  • símbolos de moedas (ISO) ...
  • abreviaturas de materias e disciplinas científicas habituais ...
  • abreviaturas latinas (ab init. cf. ibid. id. ...)
  • abrevituras frecuentes que faltan : n.f., n.m., ...

Léxico xeral

Criterios

Aumentativos (e despectivos), diminutivos: dado que son variacións morfolóxicas sistémicas, será mellor facer ou ben unha recollida sistemática ou non introducilos de momento. Actualmente están introducidos os que non son sistémicos (pulquérrimo, paupérrrimo, etc.)

  • elevadísimo
  • homón
  • mullerona
  • cantarín/cantarina

Léxico específico (conxuntos non integrábeis no corrector xeral)


Vocabulario

Verbos

  • minusvalorar
  • orzamentar
  • reprografar
  • xudicializar
  • limpar
  • profesionalizar
  • formatar
  • monitorizar
  • vencellar
  • artellar
  • desdicir
  • sobrepoñer
  • sobrepor
  • recalcular
  • respaldar
  • anozcar
  • amordiscar
  • amosegar
  • amozcar
  • ataniscar
  • adicionar
  • acoplar



Nomes (subs. e adx.)

  • mediático/a
  • conexionado/a/s
  • conectividade
  • discrecionalidade (invar.)
  • expedientado/a
  • inquedanza/s
  • orzamentado/a
  • pervivencia (invar.)
  • reprografado/a/s
  • expedientado/a/s
  • xudicialización/s
  • xudicializado/a/s
  • profesionalización/s
  • profundamento/s
  • puntualización/s
  • sostibilidade/s
  • varapau/s
  • cartelaría/s
  • bacallau/s
  • remudista/s
  • canalizador/a/es/as
  • conector/a/es/as
  • xemente/s
  • exixente/s
  • arbotante/s
  • barroquizante/s
  • calcante/s
  • castelanfalante/s
  • desoxixenante/s
  • escintilante/s
  • ligante/s
  • munificiente/s
  • ourilucente/s
  • mesturador/a/es/as
  • portapapeis (invar.)
  • caché/s
  • clúster/s
  • activábel/beis
  • activable/s
  • miniaplicativo/s
  • dispoñible/s
  • dispoñíbel/beis
  • despregábel/beis
  • despregable/s
  • boolenao/a/s
  • búfer/s
  • conversor/a/es
  • cián (invar.)
  • maxenta (invar.)
  • descodificador/a/es/as
  • documentador/a/es/as
  • expansor/a/es/as
  • enchemento
  • escintilante/s
  • preditor/a/es/as
  • anelamento/s
  • anemone/s
  • artellamento/s
  • bacallau/s
  • bel/es
  • capricornio/s
  • carallada/s
  • crack/s
  • cru/s
  • fervellasverzas
  • fono/s
  • inquedanza/s
  • kibbutz
  • leu/lei
  • paolo
  • pregravado/a/os/as
  • preacordo/s
  • preaviso/s
  • pro/s
  • rally
  • sendeirismo/s
  • sendeiro/s
  • sonar/es
  • stradivarius
  • striptease/s
  • subhasta/s
  • suroeste/s
  • tedor/es
  • xacemento/s
  • guionización/s
  • vacúa
  • euscalduna
  • cru/crúa
  • mao/má
  • derradeiro/a
  • devolto/a
  • promedio/s
  • estonio/a
  • biés
  • bisilábico/a/os/as
  • medianoite/s
  • tóner
  • tina/s


Adverbios

-mente

  • exponencialmente
  • disciplinariamente
  • electronicamente
  • financeiramente
  • nomeadamente
  • normativamente
  • penalmente
  • potestativamente
  • bianualmente
  • bienalmente
  • atresadamente
  • certeiramente
  • cinematograficamente
  • cobardemente
  • colexiadamente
  • culturalmente
  • deficitariamente
  • densamente
  • desasosegadamente
  • desdeixadamente
  • despectivamente
  • desprevenidamente
  • disimuladamente
  • ecoloxicamente
  • educadamente
  • exaxeradamente
  • espaciadamente
  • estilisticamente
  • ferreamente
  • financeiramente
  • fiscalmente
  • funcionalmente
  • gostosamente
  • igualitariamente
  • inadecuadamente
  • lúcidamente
  • operativamente
  • porosamente
  • poeticamente
  • ponderadamente
  • previsibelmente
  • prioritariamente
  • psiquicamente
  • semanticamente
  • traizoeiramente
  • tremendamente
  • secuencialmente

Vocabularios especializados:

Son correctas pero non se considera oportuna a súa inclusión porque ou ben son moi específicas, ou ben poden producir confusión (exemplo: relatorio/ponencia).

A partir de agora pasan á páxina de Glosarios.

En discusión

Sen decisión actualmente

Xerais

Criterios

-Non incluír algunhas siglas de cortesía (RIP, QEPD,... que deben ir en minúsculas)


Vocabulario

En xeral habería que revisar a construción de derivados con sufixos e prefixos habituais (bi-, auto-, semi-, pro-, des- ). En todo caso, de introducirse debe facerse en conxunto, non ao socaire do que vaia aparecendo porque son variantes sistémicas de lingua.

Os prefixos máis frecuentes e relevantes para compoñer unha regra serían:

a-
ab-
aero-
afro-
alo-
an-
anfi-
anglo-
ante-
anti-
anti-
antropo-
arbori-
archi-
arqui-
auto-
bi-
bio-
bis-
carbo-
cardi-
centro-
ciclo-
cinema-
circun-
contra-
cosmo-
crio-
cuadr-
cuadri-
curvi-
dactilo-
deca-
deci-
demo-
dermato-
des-
di-
dia-
duo-
e-
eco-
endo-
enter-
entre-
epi-
equi-
estereo-
eu-
euro-
ex-
exo-
extra-
farmaco-
ferro-
fibro-
filo-
fisi-
fon-
grafo-
greco-
hemi-
hept-
heter-
hetero-
hex-
hidr-
hip-
hiper-
hipo-
homo-
i-
indo-
infra-
inter-
intra-
intro-
kilo-
lact-
loco-
logo-
lonxi-
luso-
macro-
magneto-
maxi-
mecano-
medico-
medio-
meso-
meta-
micr-
mini-
mio-
miso-
mono-
nano-
narco-
necro-
neo-
neur-
norte-
octo-
odont-
ofic-
ole-
omni-
onoco-
oo-
organo-
ornito-
orto-
oto-
ovo-
paleo-
pan-
penta-
per-
peri-
petro-
pielo-
piro-
pluvio-
podo-
poli-
porta-
pos-
post-
pre-
preter-
pro-
proto-
pseudo-
psic-
re-
rect-
retro-
semi-
servo-
seudo-
sin-
sismo-
so-
sobre-
socio-
sono-
sub-
super-
supra-
sur-
tecno-
tele-
teo-
topo-
toxico-
traqueo-
tri-
trombo-
turbo-
ultra-
uni-
uro-
vaso-
vice-
video-
xeo-
xero-
zoo-


	interactuar
	interpersoal
	supraterritorial
	autopropagar
	redenominar
	sobrepasar
	priorizar
	renormativización
	sobrepor
	desaglutinado/a
	sobrepoñer 
	multiplataforma
	reutilizar
	minusvalorada
	retroalimentación
	superíndice
        internauta
        interconectar
        multipunto
        tecnotrónica 
  • grupal/is
  • off
  • xentalla
  • canté
  • nefas (por)
  • ? ende (por)

Erros corrixidos

[18-12-2008] [Aínda non propagados ás versións estables/oficiais]

  • Dá como erro "célebre".. suxire "celebre" do verbo celebrar.
  • Non a dá como válida "consensuada"
  • Non a dá como válida "paseniñamente"
  • Non a dá como válida "inquedanza"
  • Non da como válida 'vogalía'.
  • Non ten o verbo LIMPAR mais conxuga un inexistente *IMPAR. Debe faltarlle o "l" ao principio do verbo.
  • Non inclúe o vbo. EXIXIR
  • Non inclúe o adxectivo pregable, nin pregábel como tampouco os plurais correspondentes.
  • Non inclúe o adx. promocional
  • Non ofrece "prexudicial" ao corrixir "prexuiciosa"
  • Non inclúe "dialogantes"
  • Non inclúe "indesexada"
  • Non inclúe descodificador pero si descodificar
  • Non inclúe o subs. conectividade.
  • Non inclúe o adx. derradeiro.
  • Non ofrece "sendeiros" ao corrixir "senderos"

Previos

  • Da como erro "Austria" e suxire cambialo por "Austria"; cambia "Austria" por "Austria " e volve a dar erro co. Parece unha especie de bucle infinito :p
  • Non inclúe "titorial/titoriais".
  • Non inclúe a preposición "por", "blogue/s", "están"
  • É caracteres e non caractéres
  • É cartafoles e non cartafois
  • Non inclúe vinculada e ademais suxire vinculantea.
  • Dá coma erro "prové"
  • Non inclúe "modular"
  • Se escribo "Búscanse" dame erro e suxírime "Buscanse".
  • Contén "robot" pero non "robots".
  • Non inclúe "xove" (de mozo)