Framlag í samkeppnina Þú átt orðið

Stefán Ingi Valdimarsson

Í stuttu máli

Dragðu eftirfarandi hlekk í bókamerkjaslána: Orðaleit
Smelltu á þetta bókamerki hvenær sem þú vilt leita að orði á vefsíðu.

Vandamál

Oft kemur fyrir að maður er kominn inn á vefsíðu með miklum texta en maður vill leita að tilteknu orði. Til þess eru leitargluggar í öllum vöfrum. Á þessum leitargluggum er sá galli að það er ekki hægt að leita að orði og öllum orðmyndum þess. Hér er komin tilraun til þess að sigrast á því.

Útfærsla

Gögn sem innihalda upplýsingar um beygingar allra íslenskra orða og sem eru þannig að það sé auðvelt að fletta upp í þeim eru það fyrirferðarmikil að ekki er hægt að ætlast til þess að notendur hlaði þeim niður á tölvuna hjá sér. Þess í stað er farin sú leið að setja upp vefslóð þar sem hægt er að biðja um upplýsingar um ákveðið orð með http-beiðni. Á vefslóðinni er php-skrifta sem sækir upplýsingar um orð með tiltekna beygingarmynd í gagnagrunn og sendir þær til baka. Nánar tiltekið þá sendir notandinn beiðni um orðmynd og skriftan sendir til baka lista með öllum uppflettiorðum sem geta haft þessa orðmynd og jafnframt regex streng sem hægt er að nota til að leita að öllum orðmyndum sem þetta uppflettiorð getur haft. Notandinn fær þennan lista til baka og getur valið hvaða uppflettiorð hann vill taka með í leitina. Ekki er gerður greinarmunur á stórum og litlum staf í leitinni.

Til þess að ræsa forritið er notað bókamerki. Notandinn setur bókamerkið í bókamerkjaslána í vafranum hjá sér og þegar hann er á síðu sem hann vill leita að orði á þá smellir hann á bókamerkið og leitarspjaldið opnast.

Dragðu eftirfarandi hlekk í bókamerkjaslána: Orðaleit

Þetta bókamerki virkar bæði í nýjum útgáfum af Internet Explorer og Mozilla Firefox sem eru tveir algengustu vafrarnir. Í Internet Explorer kemur reyndar viðvörun þegar bókamerkið er sett inn en bókamerkið virkar ef það er samþykkt að setja það inn. Meginprófanir fóru fram í Firefox, útgáfu 3.5.7. Forritið hefur verið prófað á algengum íslenskum vefsíðum, svo sem mbl.is, visir.is og blog.is en það virkar víðar.

Leitarspjaldið má draga fram og til baka um gluggann, það ferðast með þegar farið er upp og niður á vefsíðu og jafnframt eru takkar eftir í hægra horninu á því, annar sem minnkar spjaldið og hinn sem lokar því. Athugið að þótt hökin séu tekin af öllum uppflettiorðunum sem finnast þá er samt framkvæmd leit en nú einungis að þeirri orðmynd sem var slegin inn. Þetta á líka við ef ekkert uppflettiorð finnst með þessa beygingarmynd, til dæmis ef slegið er inn óbeygjanlegt orð.

Sem stendur er gagnagrunnurinn sem forritið notar til að fletta upp á uppflettiorðum hýstur á mínu eigin vefsvæði, samlagning.org. Ég taldi nauðsynlegt að gera það til þess dómnefnd geti metið verkefnið. Mín vegna má auglýsa, til dæmis á spjallsvæðinu á googlegroups, að þetta forrit sé til. Hins vegar finnst mér trúlegt að þessi notkun á gagnagrunninum sé ekki í samræmi við notendaskilmála. Þetta fyrirkomulag gengur því ekki til frambúðar. Hugmynd mín er sú að kóðinn sem býr til regex strengina sé settur með kóðanum fyrir beygingarlýsinguna sjálfa og php-skriftan sem leitarspjaldið þarf á að halda verði gerð aðgengileg á heimasíðu beygingarlýsingarinnar. Þessa kóða þarf væntanlega að aðlaga að þeirri töflugerð og gagnagrunnsgerð sem notuð er á síðu beyginarlýsingarinnar en ég er viss um að það er ekki mikið mál.

Kóðinn sem þetta verkefni notar er gefinn út með svokölluðu MIT-leyfi sem er opið leyfi. Kóðann má nálgast sem zip-skrá.

Reykjavík, 9 febrúar 2010
Stefán Ingi Valdimarsson