[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Vill einhver hjálpa til við að búa til alvöru íslenskt villuleiðréttingarkerfi fyrir Hunspell og OpenOffice.org?



Sæll Stefán (og aðrir nerðir)

Mér leiddist einmitt líka eitthvað sunnudagskvöldið fyrir c.a. fjórum
árum og bjó til affix-lista fyrir ispell. Það er enganvegin eins
öflugt eins og Hunspell enda var ég fljótur að reka mig á að ispell
ræður enganvegin við íslensku.

Ég dundaði svolítið við þetta og var líka byrjaður að skoða Hunspell
... en svo nennti ég því ekki lengur (og hafði heldur engan tíma fyrir
þetta).

Allavega, þá skal ég senda þér ispell og Hunspell vinnuna sem ég ennþá
núna á eftir. Ég vil ekki senda viðhengi á allann listann, en ef
einhver annar vill skoða þetta er bara að senda mér línu.

kv. Einar



2010/2/16 Stefán Vignir Skarphéðinsson <stebbiv ( at ) gmail ( dot ) com>:
> Sælir nördar!
>
> Mér leiddist eitthvað á sunnudagskvöldið og fór að lesa mig til um
> hvernig menn gera villuleiðréttingarkerfi fyrir OpenOffice og byrjaði
> að slá inn kóða eftir smá lestur. Þetta er núna orðið að verkefni á
> Github og það væri gaman að fá fleiri hendur í þetta verk. Verkefnið
> er hýst á http://github.com/stebbiv/OpenOffice-Spelling-is/.
>
> Öll hjálp, spurningar og athugasemdir vel þegnar!
>
>    ===Nördaskapur hefst===
>
> Markmiðið er að búa til frjálsa orðabók sem virkar beint úr kassanum á
> OpenOffice og öðrum kerfum sem nota Hunspell-kerfið fyrir
> leiðréttingar en þar má m.a. nefna Firefox, Opera, Cocoa-forritin í OS
> X (undir 10.5 og nýrra) ásamt heilum helling af forritum sem ganga á
> Xorg. –Þannig kæmu öll önnur hugbúnaðarverkefni (bæði opin og lokuð)
> til með að græða á verkefninu.
>
> Planið er að byggja orðabókina upp á einföldum "grunnorðum"; s.s.
> nafnorðum í eintölu nefnifalli, sagnorðum í 1. pers. et. sem kerfið
> kemur svo til með að búa til samsett orð úr og finna út föll.
> (Hunspell er t.d. ansi sniðugt að því leyti að það styður föll, greina
> og samsett orð). Þannig þarf ekki að díla við heljarlangan orðalista
> (http://elias.rhi.hi.is/pub/is/ordalisti) eins og flest frjáls
> leiðréttingakerfi sem díla við íslensku (aspell/ispell) vinna með.
> –Orðabókin er ekki stór eins og er, en það er bara til að auðvelda
> þróunina á málfræðikerfinu sem keyrir á bakvið.
>
>    ==Nördaskapur endar==
>
> Málið er að þetta er örugglega ekki eins manns verk og kemur til með
> að taka ansi langan tíma og mun valda ansi miklum höfuðverkjum fyrir
> þá sem koma til með að taka þátt m.a. vegna þess að svona verk hefur
> ekki verið unnið fyrir íslensku áður (fyrir utan Púka) og að það er
> ekki beinlínis allt fljótandi í handbókum og hjálp á netinu um þessi
> mál (opinberi póstlistinn fyrir Hunspell er t.d. dauður en
> tungumálahópurinn hjá OpenOffice.org er sem betur fer lifandi.
>
> Hvar mælir fólk með því að maður sæki um styrki og slíkt í svona verk?
> Ég veit t.d. að Tungutæknisetur (http://www.tungutaekni.is/) er til
> staðar þó þeir hafi ekki uppfært vefinn sinn í meir en ár og virðast
> aðallega verið að hjálpa til með að þróa commercial hugbúnað.
>
> (Ég reikna með því að flestir hér séu skráðir á openoffice.is listann
> og aðra íslenska póstlista sem koma þessu við, en fólki er frjálst að
> áframsenda þetta ef það vill.)
>
> --
> Stefán Vignir Skarphéðinsson
> stebbiv ( at ) gmail ( dot ) com
>