Maskiner lär sig av Wikipedia

10 May 2008 | Kommentarer ()

Det är ju inte meningen att tjata så mycket om Wikipedia, men jag hittade två papper från HP Labs som kanske kan vara av intresse för den specialintresserade:

"Clustering Short Texts using Wikipedia". Fattar inte så mycket av det här, men det verkar handla om hur Wikipedia kan användas för att förbättra träningsalgoritmer för att klassificera textmängder, men jag kan ha fel.
"Boosting Inductive Transfer for Text Classification using Wikipedia". Tanken att artiklar i RSS-flöden kunde klustras i din nyhetsaggregator är lite intressant. Lite som Google News klustrar nyheter. Problemet är att de inlägg som syndikeras ofta innehåller väldigt lite text (kanske bara rubrik och ingress). Därför skulle man kunna använda t.ex. Wikipedia för att berika texten och därmed öka pricksäkerheten i klustringen.

Här har man lyckats bra med just detta, jämfört med en traditionell metod av att klustra utifrån en "påse med ord". Nu vill man se detta implementerat i Google Reader.

Lite roligt med båda dessa papper att man använder Wikipedia som en gigantisk kunskapsbank som kan användas för att förbättra andra automatiseringsprocesser. Och det är egentligen resultatet av mänsklig aktivitet.

Hitta mer om:

hp labs , wikipedia

kommentar(er)

www.flickr.com

Jag heter Erik Stattin och det här är min blogg. Jag skriver om digital kultur, ungefär. Du får gärna tipsa mig om saker. Kontakta mig på erik.stattin@gmail.com. Jag är mymarkup på Twitter och Delicious.

Maskiner lär sig av Wikipedia

Hitta mer om:

kommentar(er)

Senaste kommentaren

Twitter Updates