Stava rätt med LIBRIS
På BibCamp tidigare i vår berättade Henrik på LIBRIS om bi-, tri-och n-grammodeller så att till och med jag förstod!Stavningsprogrammet bygger (som beskrivet i tidigare inlägg) på statistik över dels innehållet i LIBRIS och dels sökfrågor som ställs till LIBRIS webbsök. Baserat på detta försöker programmet att hitta en i någon mening mer "sannolik" stavning av en sökfråga. Endast i de fall då programmet hittar en sådan med en viss marginal i "sannolikhet" presenteras ett stavningsförslag.
API:et är mycket enkelt: man skickar in en sökfråga som en parameter i ett HTTP-anrop och får ett eventuellt stavningsförslag tillbaka i xml. Exempelvis ger sökfrågan "Bahctin Rabelais" svaret:
Det man kan utläsa av detta är att sökfrågan normaliserats som "BAHCTIN RABELAIS" och resulterade i stavningsförslaget "Bachtin Rabelais".
<bibspell>
<query>BAHCTIN RABELAIS</query>
<suggestion>
<term changed='true'>Bachtin</term>
<term>Rabelais</term>
</suggestion>
</bibspell>
kommentar(er)
www.flickr.com |
Jag heter Erik Stattin och det här är min blogg. Jag skriver om digital kultur, ungefär. Du får gärna tipsa mig om saker. Kontakta mig på erik.stattin@gmail.com. Jag är mymarkup på Twitter och Delicious.