New York Times, bla, bla, bla

| Kommentarer ()
För det facila priset av $300 kan man köpa 20 års New York Times-artiklar (1.8 miljoner stycken), åtminstone om man har som syfte att använda det för icke-kommersiell forskning (lingvistisk sådan är väl det första man kommer att tänka på). Allt kommer i XML-formatet News Industry Text Format, för maskinläsbarhet - The New York Times Annotated Corpus. (Läs mer i Open-bloggen).

Riktigt roligt för en annan som bibliotekarie är när man läser mer om vad man får: 650 000 artikelsammanfattningar skrivna av "library scientists" och 1.5 miljoner etiketterade artiklar av "library scientists", enligt en kontrollerad vokabulär för personer, platser, organisationer och ämnen. Aldrig har man sett tydligare nyttan med traditionellt biblioteksarbete. En hel del av den nyttan ser man också i de API:er som tidningen (är det en tidning längre?) tillhandhåller (se TimesTags t.ex.).

"Library scientist" låter så jävla bra! Vill vara en.

I New York Magazine kan man också läsa om förnyarna på tidningen, som använder webben för att skriva om vad journalistik är. 

The Atlantic blåste i undergångshornet och förkunnade att New York Times skulle sluta att tryckas i maj ca, tidningen svarar: no such thing.

kommentar(er)

Senaste kommentaren

www.flickr.com


Jag heter Erik Stattin och det här är min blogg. Jag skriver om digital kultur, ungefär. Du får gärna tipsa mig om saker. Kontakta mig på erik.stattin@gmail.com. Jag är mymarkupTwitter och Delicious.


Twitter Updates