torsdag den 2. december 2004

Problemer med Google Scholar
Search Engine Watch og Gary Price har nogle vigtige betragtninger om Google Scholar. Altså den søgemaskine som Google er ved at udvikle til at søge specielt efter forskningsmateriale.
Price peger på at Google ikke angiver hvem det er de har hentet oplysningerne fra, hvor meget der er fuldtekst og hvor meget der er henvisninger og citater. Mange af fundene stammer fra det åbne web uden at Google fortæller hvordan disse er udvalgt. Fx er der citater fra pressemeddelelser og andet som ikke kan anses for akademisk. Endelig er det alment kendt at Google ikke indekserer mere end 101 kb af html-dokumenter og pdf-filer. Et alvorligt problem for forskermateriale, som jo ofte er oppe i større størrelser end det.
Google bruger andre søgemaskiner. Men kan man så ikke ligeså godt bruge dem? Det tyder i hvert fald undersøgelser af en vis Peter Jacso. Han har sammenlignet hvad Google Scholar finder og hvad primærsøgemaskinerne finder. Hans konklusion at Scholar finder væsentligt mindre. Lige som Scholar åbenbart har genoplivet problemet fra søgemaskinernes barndom med dobbelt- og tripleposter. Jacso ser det som et plus at Scholar også viser anmeldelser, så brugeren er i stand til at vurdere materialet. (Dette sidste er Amazon i øvrigt også begyndt på. Jeg arbejder pt. med et indslag om dette).
Price gør dog også opmærksom på at Scholar endnu er i beta-version. Og alle disse fejl måske hen ad vejen bliver rettet. Men mon ikke at Google får styr på det? Når de har lanceret den på denne måde, så må man vel gå ud fra at de har været opmærksom på alle disse problemer.
Modsat fx MSN er Google et mere ”åbent” foretagende. Og netop ved at kaste Scholar for ”løverne” vil Google meget tidligt kunne indhente kritik og gode forslag til forbedringer. Jeg ser frem til at det sker….
Link
blog.searchenginewatch.com/blog/041201-105511

Ingen kommentarer: