onsdag den 21. november 2012

Hvorfor Bogsøgning ikke er så ligetil

Det er et velkendt fænomen på internettet at gode databaser ikke nødvendigvis er nemme at søge i. Et eksempel er Infomedia som indeholder en guldgrube af artikler fra de seneste ca. 20 år. Men de er bare svære at søge i pga. brugergrænsefladen. Desuden hæmmet af langsomme svartider (selv om de er blevet bedre end for bare 2 år siden). Som Infomedia indeholder Google Bogsøgning et tocifret antal millioner skannede og digitaliserede bøger. Her går det superhurtigt, men søgemekanikken fungerer ikke optimalt.

Mangler ved flerbindsværker

Du kan prøve efter. Hvis du fx gerne vil finde alle årgange af Videnskabelige Meddelelser fra Den Naturhistoriske Forening (og de findes i fuldtekst 1849-1871), så er det ikke så enkelt. Oftest vil du finde 2-3 i søgeoversigten. hvor du så vil få mulighed for at kigge på "flere udgaver" (more editions). Hvis du klikker her, vil du typisk få 7-10 årgange af bladet. Men altså langt fra de 22 årgange som bevisligt findes. Jeg har fundet dem.

Hvis du har en mistanke om at noget findes i Google Bogsøgning, fx alle bind af flerbindsværker, tidsskriftårgange mm. er du nødt til at lave forskellige krumspring for at tvinge posterne frem i søgeresultaterne. Et krumspring er allerede nævnt: Det med flere udgaver. Men som sagt er det ikke nødvendigvis nok. I tilfældet med tidsskriftet, kan du notere hvilke årgange der mangler. Da jeg gjorde det, var det i første omgang 14 årgange.

Jeg gentog derfor en søgning på tidsskriftets titel, men satte et manglende årstal bagved. Og så kiggede jeg søgelisten igennem, klikkede på flere udgaver, og fik 9 nye årgange med. Men manglede stadig 5. Ved at gentage søgningen, nu med et årstal fra en af de fem manglende årgange, fik jeg fremtvunget flere årgange. Stadig mangler jeg dog tre. Her er kun et at gøre: Vente et par uger. For jeg ved af erfaring, at der kommer andre resultater frem.

Hvis du ikke orker at lave alle disse krumspring, kan du søge dem på Bibliotek.kk.dk, Københavns Bibliotekers hjemmeside. Ad åre, og hvis bevillinger gives, vil de vel også være at finde på Bibliotek.dk. Men sådanne opgaver har absolut laveste prioritet i biblioteksvæsnet.

Mangler ved bogtitler

Det gælder ikke kun for flerbindsværker. Jeg har tidligere fundet "Det menneskelige øie" i en fuldtekstversion, så jeg ved den eksisterer. I dag prøver jeg at efterkontrollere den. Først med en generel søgning på titlen. Det giver nedenstående resultat: To versioner, som ikke er i fuldtekst, og med andre adresser.


Her er resultatet af onsdagens efterprøvning af om jeg kan genfinde fuldtekstudgaven. Som det ses, er der tale om to "No preview"-udgaver. Forgæves prøver jeg at finde fuldtekstudgaven.

Jeg forsøger med de kneb som Google stiller til rådighed at få fuldtekstudgaven frem: Afgrænser på forskellig vis, således som man nu kan gøre det med venstremenuen eller i den avancerede søgning. Men Bogsøgning vil her til morgen ikke ud med udgaven.

Med andre ord. Hvis jeg ikke på forhånd vidste at den fandtes, ville jeg i god tro mene at den ikke var med i Google Bogsøgning. Men det er den altså. Hvis jeg prøver linket fra Københavns Biblioteker, så kommer den frem, nok så nydeligt. Og dette er noget som jeg har erfaring med er mere reglen end undtagelsen.

Her er forsiden på fuldtekstudgaven. Den kan downloades i PDF eller EPUB. Eller ses på skærmen. Den kommer bare ikke frem når du søger på den - i dag. Måske finder du den når du søger?

Mulige årsager til manglerne


Irriterende? Ja i den grad. Det er meget utilfredsstillende at Google Bogsøgning ikke er mere præcis. Og det gælder især for ældre litteratur. Jeg ved ikke om det er en børnesygdom som bliver rettet i fremtiden. Indtil videre vil du kunne finde dem som bibliografiske poster i Københavns Bibliotekers base. Og de bliver overført med sneglefart til Danbib. (Vi er nu engang hverken nationalbibliografer eller har uanet katalogafdelingskapacitet).

Min fornemmelse er at Google hver gang du søger på noget, lynhurtigt finder de første 6-700 passende hits, og dernæst stopper søgningen. Det er så ikke de 6-700 samme hits du finder hver gang. Men dette er ren fornemmelse. Jeg har ingen som helst dokumentation, anden end min erfaring med tusindvis af bogsøgninger, at bygge det på.

Der kan også være fejl hvad angår læsningen af det indskannede billede. De indskannede billeder bliver jo nemlig omsat til tekst, og her er fejlene, især for gotiske bogstaver (fraktur) ret stor, især på dansk. Og søgning foregår i disse tekstfiler, ikke i det skannede billede. Hvis fx ordet Øie ikke er korrekt 'oversat' i fuldtekstudgaven, vil Google ikke finde den.

Sammenfatning

I punktform kunne denne utilfredsstillende fremgangsmåde sammenfattes sådan:
  1. Foretage en søgning.
  2. Klik på Flere udgaver.
  3. Undersøg om noget måske mangler. Lav en ny målrettet søgning på det du mangler.
  4. Klik i Flere Udgaver.
  5. Gentag punkt 3-4 nogle gange, indtil mulighederne er udtømt.
  6. Vent et par uger og gentag søgningen.

Ingen kommentarer: