søndag den 6. marts 2005

Kreativ søgning (1 - indledning)

Dette og følgende 6-7 indslag vil beskæftige sig med kreativ søgning. Et er nemlig at kende de forskellige avancerede søgemuligheder, et andet at bruge disse kreativt.

Som optakt her lidt om begrænsninger i de redskaber vi har, dvs. ordsøgemaskiner som Google, Yahoo og Teoma. Internetsøgere har et dilemma: Databaser som fx bibliotekernes materialedatabaser er bibliografiske værktøjer med menneskeligt bearbejdede data (emneord, værkoplysninger osv.). Men sådanne findes ikke til at søge på internettet, fordi internettets enorme omfang og ekspansion gør noget sådant umuligt. Bibliografisk indeksering af internettet er en menneskelig umulighed. Vi er derfor blevet helt afhængige af en maskinel bearbejdning af fuldtekstdokumenter fra internettet. Med andre ord: afhængige af søgemaskiner.

Det skaber nogle alvorlige søgeproblemer. Søren Brier opridser i sin bog Informationsvidenskabsteori (Samfundslitteratur, 2005, s.200) en række problematikker som de fleste internetsøgere kan nikke genkendende til. Her til lejligheden omskrevet til følgende:

- Undersøgelser af om søgninger i fuldtekstdatabaser (fx søgemaskiernes) er effektive er arbejdskrævende, langvarige og dyre, hvis de blot skal overholde et minimum af metodologiske krav.

- Det menneskelige sprogs muligheder for at beskrive er så mangfoldige, at det er uhyre vanskeligt at finde alle de nødvendige ord, der skal til for at hente alle de nødvendige dokumenter frem. Og frembringer som regel resultater med umådelig megen støj.

- Forsøg på at mindske denne støj ved hjælp af kombinatoriske søgninger fører til gengæld til et drastisk fald i "recall" (recall=de fundne dokumenters procentdel af alle basens relevante dokumenter). Med andre ord: Kombinatoriske søgninger risikerer at udelukke essentielle nøgledokumenter fra søgningen.

- Hvad værre er: baserne er så uoverskueligt store at internetsøgeren ikke har en jordisk chance for at få en realistisk vurdering af, hvor stor en del af de relevante dokumenter, man har fundet. Dvs. hvis ens succeskriterium fx er at finde 90% af alle relevante dokumenter, er man ikke i stand til at afgøre om det er sket.

- Endelig er der en stor fare for at internetsøgeren overvurderer det faktiske recall, fordi der altid vil være et meget stort antal brugbare fund.

Disse forbehold er det vigtigt at holde i baghovedet, når du læser de kommende indslag om kreativ internetsøgning. Når det så er sagt, skal du ikke lade dig totallamme af sådanne overvejelser. Det afhænger alt sammen af ambitionerne med din søgning! Ambitionen for de følgende artikler er at udnytte de avancerede søgeteknikker, vi nu engang har, til det yderste. De hviler på daglige erfaringer fra Københavns Hovedbibliotek med at finde egnet materiale. Så fortsat god læsning….

Ingen kommentarer: