2008-09-08

Google News Archive - gamle aviser

Jeg vet at det har vært store nyheter å rapportere om Google den foregående uken. Jeg har ikke gått glipp av at de har fylt 10 år og lansert Google Chrome, som for øvrig er en svært bra nettleser (og jeg holdt på å skrive en artikkel om den da det viste seg at de fleste profesjonelle journalister hadde gjort det samme), men har ikke skrevet om det.

I dag annonserte nemlig Google-bloggen at de lanserer Google News Archive. Google News er et nettsted for nyheter der de bruker Googles sorteringsmetode for søk (PageRank, etter Larry Page; en av grunnleggerne) for å bestemme hvilke nyheter som skal øverst. De nyhetene som flest linker til som får forsideplass. Google News Archive er en samling skanninger av gamle amerikanske aviser, og resultatene er forbløffende bra. Jeg har brukt Wayback Machine, som tar kopi av nettsteder, og News Archive kan minne litt om den. Forskjellen er at dette er digitalisering av tiden før nettet kom.

Jeg søkte raskt på noen hendelser, som Elvis Presleys død, Charlie Chaplins farskapsrettssak og nyheter om senator McCarthys heksejakt på kommunister på femtitallet, og ble overrasket over hvor gode resultater jeg fikk. Det var interessant lesing, og en smule nostalgisk. I tillegg går det an å få resultatene servert på en tidslinje, slik at man kan se når en person eller sak var i vinden eller lettere plukke ut saker fra en viss tid. Søk for eksempel på "chernobyl", og bli overrasket over hvor mye plass det fikk i 1986.

Jeg har fortsatt noe å klage på: artikler fra blant annet New York Times ikke er gratis å lese. Disse må man betale rundt fire dollar for. Disse resultatene havner også skrekkelig langt opp på resultatene når jeg søker. Heldigvis går det an å velge "related stories" under, der man som oftest finner en artikkel fra en mindre kjent avis med likt innhold, men det er fortsatt irriterende. Åndsverksbeskyttelsen har gått ut på noe av det eldre materialet, så dersom det er nærmere 100 år gammelt materiale du leter etter vil det gå greit om det er fra disse avisene. Jeg synes uansett at New York Times heller burde få en andel av annonseinntektene fra siden enn å sperre det sånn.

Siden det er skrevet i javascript tar det nok seg bra ut i Google Chrome (nettleseren er overlegen på slikt), men fungerer i alle nettlesere (til og med IE). Jeg håper også at de tar seg tiden til å skanne eller låne aviser fra utlandet, som blant annet Nasjonalbibliotekets samling av norske aviser.

Illustrasjon: Google News Archive Search av magerleages fra Flickr

Ingen kommentarer: