fredag den 10. juni 2005

Sommertemaer 1:
Google Scholar under lup
Debatten om Google Scholar er tonet kraftigt ned. Skyldes det mon skuffelse eller en afventende holdning, eller fordi den nu bruges ganske selvfølgeligt? Alle synes Scholar er en god ide, men at den har store mangler. Og både Det Kongelige Bibliotek og Danmarks Pædagogiske Bibliotek gjort det muligt for deres studerende at søge i egne licensbetalte databaser via Scholar. Flere følger formentligt efter.
Der skulle i teorien være to grunde til at bruge Scholar. Den ene set overfor Google websøgning: man skulle slippe for at gennemtrawle uendeligt lange resultatlister med "almindelige" fund, for i stedet straks at finde videnskabeligt orienterede materialer: bøger, artikler, henvisninger osv. Den anden at Scholar skulle kunne søge i mange forskellige databaser på en gang, og derfor afhjælpe besværet ved at gentage søgninger i alle disse på skift.
Det er dette sidste som nedenstående artikler stiller spørgsmålstegn ved. Den ene artikel er fra Péter's Digital Reference Shelf fra juni.
Her nævnes først de mange andre kæmpedatabaser, bl.a. Scopus, eller mindre som PsycInfo, CiteSeer og andre. (Jeg kunne også tilføje engelske Ressource Discovery Network).
Googles software kritiseres for ikke kan kunne lave effektive søgninger: Man kan ikke browse i Scholar, dvs. man kan fx ikke slå varianter af forfatter og tidsskriftnavne op. I den avancerede søgning er det kun muligt at afgrænse til publikation, forfatternavn og udgivelsesår. Men navne skrives på forskellig vis, forkortes på forskellige måder eller skrives fuldt ud. Så man er nødt til at lave gentagne søgninger - og tilmed have brug for lidt held til at finde den rigtige stavemåde.
Helt galt er det når tidsskrifterne indeholder enstavelsesord, som forekommer i utallige tidsskriftsnavne. (Bibliotekarer vil vide at det i bibliotekskataloger kan stoppes med @@). Det samme gælder navne. Fornavne kan være forkortet, eller bare være initialer.
Det synes også som om de boolske operatorer ikke fungerer optimalt, i hvert fald OR-operatoren. Hvilket sikkert vil få mange undervisere til at rive sig i håret: nu havde vi endelig lært brugerne hvordan de skal bruge disse.
Resultaterne kan ikke blive sorteret på andre måder end Scholar bestemmer. Hertil kommer nogle mærkværdigheder. En artikel fra 2004 stod således noteret til at være citeret hele 13.791 gange.
Endelig oplyser Google ikke om indholdet i Scholar. Men sammenligninger mellem søgninger i de ovennævnte databaser og Scholar viser, at Scholar finder langt færre, selv om man påstår at søge i disse. I artiklen er en gennemgang af nogle af disse databaser.
Denne artikel har inspireret Jim Henderson fra McGill Universitetsbibliotek i Montreal til at skrive en artikel om hvad læger og klinikere kan få ud af Scholar. Især om den er bedre end fx Web of Science og Elseviers Scopus. Han har fx søgt på Vioxx. Han fandt ingen oplysninger om at det blev trukket tilbage fra markedet. Dog fandt Scholar en vigtig artikel fra år 2000, men mellem de 100 hits var der ellers kun 9 artikler fra 2003 og 2004. Tre andre søgninger gav ikke entydigt gode resultater.
Henderson er ikke tilfreds med sortering af materialerne, altså dette med at materialer med mange citater prioriteres øverst. Han finder det kritisabelt at kun ca. 1 mio. ud af PubMeds 15 mio. indførsler er med.
Og understøtter noget af den samme kritik, som allerede beskrevet: Der er ingen mulighed for "lignende sider" eller "mente du" for at finde alternative stavemåder. Som læge vil han kun anse Scholar for supplerende andre medicinske databaser. Han forudser, at Scholar vil blive udkonkurreret af allerede eksisterende eller kommende specialsøgemaskiner, som nævnes i artiklen. Og som den ser ud nu, mener han ikke den kan bruges.
Hårde ord om Scholar. Disse to artikler er ikke enkeltstående. Mon Google har tænkt sig at tage kritikken alvorligt? Kritikken kommer især fra eksperter. Men hvad mener de studerende og andre, mindre professionelle? For dem er det en fordel, at de kan samsøge i mange forskellige databaser på en gang. Hvis det vitterligt er sandt at der mangler så meget, vil Scholar-brugere gå glip af en masse. Men betyder det noget i praksis? Det ved vi ikke noget om.
Erfaringen fra webben viser at størrelse ikke altid er lig kvalitet. Søgemaskiner som Exalead og Teoma er betydeligt mindre end Google, kun ca. 1/10. Men deres højstrangerende resultater er ofte mindst lige så gode som Googles. På samme måde kan vi ikke vide om det manglende materiale i Scholar er relevant eller ej.
Jeg har før gjort opmærksom på at vi har mistet overblikket over internettet. Og hvad værre er: at det dels ikke længere er muligt at undersøge hvad vi går glip af og dels om det vi går glip af er relevant eller ej. Denne konstatering kan være særdeles frustrerende for bibliotekarer, der er vant til at arbejde med bibliotekskataloger som er næsten fuldstændige fortegnelser over trykt materiale. Men forhåbentligt vil det ikke få os til at holde op med at bruge internettet, i tiltro til at "problemet engang bliver løst". For det gør det ikke. I stedet må vi udforske det med de betingelser der nu engang er.

Ingen kommentarer: