onsdag den 23. februar 2011

Hvad findes i Google Books på dansk?

Selv om jeg ikke har noget præcist tal på hvad der findes af danske bøger i Google Bogsøgning, så er her et bud:
  • 2.500 Bøger i fuldtekst. Fortrinsvist skannede bøger fra universitetsbiblioteker i USA ældre end ca. 1870. Men der er også en betydelig mængde fra Bayerische Staatsbibliothek.
  • Bøger i uddrag. Fortrinsvis skannede bøger fra biblioteker i USA nyere end 1870.
  • Bøger i eksempelvisning. Fortrinsvis nyere bøger som i forvejen eksisterer elektronisk fra enkelte danske forlag. Hvor meget de viser afhænger typisk af forlaget. Bøger fra Forlaget Musculanum, vises typisk de første 40-50 sider, med enkelte udeladte sider.
Der findes også bøger fra før og hen i det 18. århundrede, som ikke er registreret i Dansk Bogfortegnelse (den danske nationalbibliografi), se fx denne bog om borgerkrigen i Nordamerika, som du kan finde på Bibliotek.dk. Problemet er, at hvis du bruger faciliteten med at søge videre på internettet, bliver du aldrig ledt frem til titlen i Google Books.

En anden bog befinder sig som mange øvrige bøger kun på Det Kongelige Bibliotek, og de fleste af dem kan ikke hjemlånes. Mange gamle bøger er trykt i fraktur (gotisk). Men der er også meget gamle bøger der kan læses fordi de er trykt med "almindelig" skrift, her fra 1851. Gamle skrifttyper er dog ikke længere et problem, idet Google Bogsøgning kan omskrive teksten til moderne skrifttyper.

Men eksempler på bøger som ganske almindelige internetbrugere nu har fået adgang til er ganske mange. Prøv selv. Norge hørte jo i perioden til Danmark, så mange bøger udgivet i Norge kan du sagtens læse, fx dette flerbindsværk. Lige som dette flerbindsværk.

Af fuldtekstbøgerne er omkring 500 monografier, dvs. etbindsværker. Derudover er der en del ældre tidskrifter, vel omkring 30 titler med et varierende antal bind. Resten er flerbindsværker.

Jeg er ved at være færdig med linkningen fra monografierne og tidsskrifterne i biblioteksbasen til Bogsøgning. Men foreløbig ligger posterne altså kun i Københavns Bibliotekers database. Her kan du kun se de poster som København har i forvejen (pt er det 158 titler). De udgør omkring 1/3 af linkene. Resten, altså 2/3 af linkene er foreløbig kun synlige for bibliotekarerne i Københavns kopi af basen. Jeg er endnu usikker på om det har national interesse, og oplysningerne skal overføres til DBC, hvor de så vil være synlige i Bibliotek.dk.

Med henvisningerne til tidsskriftårgange får vi pludselig mulighed for at artikelsøge i enkelnumre. Og derudover, alle bøger med gotisk skrift, eller andre læserfjendtlige typografier er nu også læsbare. I Bogsøgning er der nemlig en funktion så du kan se teksten i ganske almindelig nutidig typografi. Disse to meget funktionelle faciliteter tror jeg kun er toppen af isbjerget over de mange muligheder med digital tilgang til litteraturen.

Her er et eksempel fra Københavns Bibliotekers søgebase (feltsøgningen). Jovist findes Annaler for Nordisk Oldkyndighed i papirform 1836-1863, men mange af årgangene findes også i Google Bogsøgning. (Der kan i øvrigt være flere, jeg er ikke helt færdig). Til forskel fra papirudgaverne, så kan vi altid komme til de digitale udgaver. Vi kan søge i enkeltnumrene, og vi kan få eventuel gotisk tekst omskrevet til almindelig nutidig skrift. Det kan da ikke blive meget bedre!  Jeg skal dog skynde mig at sige, at dette eksempel langt fra er typisk for alle tidsskrifter i Google Bogsøgning. Men det illustrerer ganske godt potentialet.

Hvorfor ikke bare løse dette teknisk? Ja, det kan jeg jo sådan set heller ikke selv forstå at det ikke kan. Men efter 2-3 år hvor der har været afprøvet forskellige løsninger fra DBC og Google, så må jeg som menig bruger af systemerne konstatere at de ikke fungerer. Googles Bogsøgning fungerer ikke optimalt hvad angår søgning (se tidligere indslag her på blokken). Jeg skal undlade at forsøge at finde "skyldige". Det kan være DBC, det kan være Google. Lige meget for mig.

Link er en enkel omend tidskrævende løsning. Ålborg Universitet har peget på maskingenererede løsninger hvad angår bøger med ISBN-numre. Det er for mig at se også vejen frem. Men hvis manuelle løsninger skal til, så lad os ikke skræmme. Hvornår kommer nogen med en tilsvarende løsning for bøger uden ISBN-numre? Og hvornår giver de danske forlag os mulighed for at søge inde i bøgerne?

Jeg håber at mit noget kluntede, men velmente forsøg på at vise mulighederne i digitalisering vil blive brugt. Hvis brugerne begynder at kunne se "lyset", vil det måske endeligt få forlagene, forfatterne og biblioteksverdenen til at sænke paraderne. Og i stedet for de evindelige forbehold, forholdsregler og slet skjult kritik lade publikum få adgang til den danske litteraturskat som de selv så højt besynger, men knuger til sig og gemmer, så ingen kan få øje på den.

Ingen kommentarer: