Vamos a usar el formato de hunspell para la corrección ortográfica de quechua desde que es el formato usado por OpenOffice,
Mozilla y cualquier programa como AbiWord que utiliza Enchant
para su interfaz de la corrección ortográfica. Diferente de ispell, aspell,
y el viejo myspell, hunspell es designado para lenguas aglutinantes con
algunos opciones especiales para construir palabras compuestas y dos
niveles de sufijos.
Sin embargo, será un desafio técnico implementar un
corrector de la ortografía quechua. Probablemente
tendramos que escribir un programa especial para crear las
combinaciones de sufijos y infijos en el formato de hunspell.
Además queremos ver la adición de una función de
"sonido como" en hunspell, porque los consonantes glotalizados y
aspirados son tan confundibles y a menudo mal-deletreados en el alfabet
español.
Si quiere aprender más sobre el formato de hunspell, va a
entenderlo mejor si primero lee las páginas man de ispell.
Si tiene ispell instalado en GNU/Linux, UNIX, o Cygwin,
puede leerlas con los mandatos:
man 1 ispell
man 4 ispell
(man 5 ispell en algunas maquinas)
Entonces, lea esas instrucciones para convertir de ispell a myspell (o en inglés). Hunspell es una versión modificada del formato myspell. También leyendo la documentación de aspell puede ayudar porque aspell tiene un formato muy aparecido a myspell.
Después de entender cómo los formatos de
corrección ortográfica funcionan generalmente, lea las
páginas man de hunspell, que es un formato mucho más
complicado. Puede leerlas en la página web de hunspell en sourceforge o con el comando de man:
man 1 hunspell
man 4 hunspell
Acá es una traducción en español de la página man 4 y el archivo README de hunspell.
Además, lea esta carta explicando cómo vayamos a implementar la correción ortográfica de quechua en Hunspell (o en inglés).