I Wikipedia, långa artiklar=kvalitet
Om en artikel har lyfts upp på Wikipedias startsida kan den kanske sägas vara av god kvalitet (kanske har den granskats extra mycket). Går det att förutspå vilka artiklar som kommer att bli "featured"? Det frågade sig Joshua E. Blumenstock vid University of California i Berkeley, och gjorde en undersökning (1).
Utifrån en lista med 100 variabler (t.ex. artikellängd, läsbarhet, antal referenser, osv) kunde han med 97.99 % säkerhet förutspå om en artikel skulle lyftas upp. Det lustiga är att han med 97 % säkerhet kunde räkna ut det endast baserat på antalet ord i artiklarna.
Wired Campus skriver:
(1) Joshua E. Blumenstock, "Automatically Assessing the Quality of Wikipedia Articles" (April 1, 2008). School of Information. Paper 2008-021.
Utifrån en lista med 100 variabler (t.ex. artikellängd, läsbarhet, antal referenser, osv) kunde han med 97.99 % säkerhet förutspå om en artikel skulle lyftas upp. Det lustiga är att han med 97 % säkerhet kunde räkna ut det endast baserat på antalet ord i artiklarna.
Wired Campus skriver:
The magic word-count cut-off seemed to be 1,830 words, above which articles were likely to be higher-quality, featured entries. Mr. Blumenstock speculated that the collaborative nature of Wikipedia may force longer articles to be higher quality.
(1) Joshua E. Blumenstock, "Automatically Assessing the Quality of Wikipedia Articles" (April 1, 2008). School of Information. Paper 2008-021.
kommentar(er)
www.flickr.com |
Jag heter Erik Stattin och det här är min blogg. Jag skriver om digital kultur, ungefär. Du får gärna tipsa mig om saker. Kontakta mig på erik.stattin@gmail.com. Jag är mymarkup på Twitter och Delicious.