fredag den 28. januar 2011

Update på forrige post om Google Bogsøgning

Jeg har nu prøvet at gennemse mine to lister for dobbeltposter. Og luget dem væk. Ligeledes har jeg prøvet at gentage mine søgninger, og ikke fundet større mængder. Så det tyder på at jeg nu er tæt på at finde det "rigtige" tal på hvor mange danske titler der er indekseret i Google Bogsøgning:

  • 1431 titler (opdatering 31. januar: 1527) kan findes med begrænset visning. Begrænset skal tages med et positivt forbehold. Det er faktisk ikke særlig begrænset, og vist nok endnu mindre begrænset, hvis du er logget på din Google-konto. Disse omfatter fortrinsvis nyere titler, altså titler fra omkring 1990 og frem.
  • 1252 titler (opdatering 31. januar: 2.335) findes gratis, kvit og frit og i fuld visning. Disse titler er typisk ikke underlagt ophavsretsregler og er fra 1800-tallet (til omkring 1870). Så vidt jeg kan se stammer mange af dem fra New York Public Library.
  • Ud over dette eksisterer der et ukendt antal danske bøger som du kun kan søge i uden at finde mere end enkelt ord og sætninger (slag på tasken, mindst 1.000 yderligere titler, opdatering 31. januar: mindst 1781). Jeg er i gang med at registrere dem. Udvalget er fortrinsvis bøger fra o. 1870 til 1980'erne. Dog også en bemærkelsesværdig stor mængde fra 2010.
Der ligger altså en samling på knap 3.000 (opdatering 31. januar: 5.500) danske titler i Google Bogsøgning som du kan læse helt eller delvist. Hvilket gør den til den største gratis kilde til digitaliseret dansk litteratur på internettet.
I den kommende tid vil jeg prøve at undersøge hvad vi kan bruge denne bogmasse til i bibliotekssammenhæng, og om linkene fra fx bibliotek.dk også virker. Dette er imidlertid ret tidskrævende. Så forvent ikke resultater lige med det samme.

Ingen kommentarer: