onsdag den 10. oktober 2007

BookSearch tips

Inside Google Books Search foreslår nogle forskellige måder at bruge Google Books. Søgemaskinens venstremenu er opdelt i forskellige kategorier og underkategorier: Fiction, Non-fiction og Random Subject. Hver med sine underopdelinger, fx Science Fiction, Fantasy, Philosophy, Political Science, Magic og Horror stories.
Phil Bradley (Search Engine Land) har gennemgået nogle af Google Books øvrige faciliteter, og er bestemt ikke imponeret. Han kan godt lide ideerne, men mener ikke at Google har løst de basale problemer som ville have gjort ideerne brugbare i praksis.
Det gælder fx 'Interesting books', som ifølge hans eksempel er totalt tidsspilde. Det samme gælder forsidens "Classics," "Highly Cited," og "Random Subject." Han foreslår i stedet at bruge Library Thing. Han er moderat imødekommende over for den nye venstremenu.
Jeg har tidligere ikke dykket så dybt ned i Google Books, men Phils kritiske artikel fik mig til at efterprøve omfanget af Google Books med nogle søgninger, hvad angår angivelse af fund. Det var lidt nedslående. Jeg laved 6 forskellige søgninger. Fire af dem var for at finde ikke-engelsk sproget litteratur (og det, ock att, von das og las los que). Søgninger som går på ord som garanteret vil optræde i det pågældende sprogs bøger, uden at gøre det i andre sprogs.
Dernæst noterede jeg antallet af angivne hit for hhv. alle bøger, bøger med begrænset adgang og fuldtekstbøger. Søgemaskinens første antal er vildt overdrevne. Jeg nåede ikke at undersøge forAll books. Men for de øvrige kategoriers vedkommende var resultatet som følger, med det reelle antal fund angivet i parentes (dette sidste tal er fremkommet ved at gennemgå hele listen):
Limited preview: 5.898 (485), 4.784 (96), 50.500 (?), 25.622 (400), 2.597 (47) og 1.299 (91)
Full view: 2.769 (33), 2.484 (94), 15.000 (?), 15.296 (226), 205 (13) og 342 (91)
Det var nedslående. Godt nok er der mange tusinder ikke-engelske bøger indskannet. Men slet ikke i det antal som Google Books angiver ved første øjekast.
Hvad værre er. Forholdet mellem angivne og reelt fundne hits er så forskellig (fra faktor 3 til faktor 100) at det er umuligt at give noget skøn over hvor stor Google Books reelt er idag. Det ville ellers have været brugbart hvis man kunne sjusse sig frem til via en søgning på et almindeligt ord som all. Det giver 4.5 mio. hits (limited preview) eller godt 1 mio. (full text). men som vi lige har set, skulle det så altså divideres med en faktor for at få det reelle tal. Ved at bruge 3 eller 80 giver det hhv. 333.333 eller 12.000 bøger i fuldtekst. Immervæk en forskel.
Det er da lidt nedslående. Google har nu heller aldrig pralet med omfanget af Google Books, så her er måske noget af forklaringen. Selv søgegiganten har åbenbart svært ved at præstere mirakler.
Der er derfor stadig grund til at eksperimentere med nye søgestrenge til at finde ebøger på internettet. En af de nyeste er denne:
-inurl:(htm|html|php) intitle:”index of” +”last modified” +”parent directory” +description +size +(pdf|doc) “forfatter/titel″
hvor du altså skal tilføje forfatter og/eller titel (fx "herman melville"). Denne søgestreng eftersporer de indeks som producenter af ebogssider normalt vil lave.
Besværligt? Jovist, det er da også derfor det ville være dejligt om Google Books var et alternativ.
Link
Inside Google Book Search.
Search Engine Land.

Ingen kommentarer: