onsdag den 4. september 2002

Teoma – hvis du er til specialiserede søgninger
Et af de allerstørste problemer med store søgemaskiner som Google er når de ikke viser det du søger blandt de første 20-30 hits. Ud af måske 15.000. Heldigvis er Google god til at sortere og Wisenut og Alltheweb gode til at underinddele fundene. Med internettets vækst er det klart at det ikke holder.
Derfor kan det godt betale sig at holde øje med nye søgemaskiner som prøver at foregribe denne udvikling. En af dem er Teoma. For øjeblikket er den stadig en hel del mindre end Alltheweb og Google. Teoma oplyser ikke hvor stor den er, men en stikprøve med 5 spørgsmål i både Google og Teoma varierede fra 1:2 til 1:5, med et snit omkring 1:4. Dvs. Google er måske fire gange så stor som Teoma. Men kvantitet er ikke altid lig kvalitet, et hurtigt vue over de første sider i stikprøverne viste faktisk at Teoma havde lige så mange relevante hits som Google.
Teoma har nye ideer i sig: Den har forbedret Googles sorteringsprincip, dvs. princippet om at en side rangerer højt hvis der er mange andre sider som linker til den. Teoma undersøger maskinelt de sider som linker til en funden side og finder ud af om disse sider også indeholder samme emne. Dette kalder Teoma ”subject-specific popularity”. Groft sagt svarer det til at man i ”Vil du være millionær” får muligheden for at spørge enten publikum eller en ekspert på spørgsmålet. De fleste ville sikkert vælge eksperten (kvalitet) på trods af at publikum numerisk er flere (kvantitet).
Derudover er der to muligheder for afgrænsning: ”Refine” og ”Resources”.
Refine er en mulighed for at indsnævre sin søgning. Teoma er indrettet således at den kan kigge på emnekredse om dit søgeord. Jeg har ikke helt forstået hvad det går ud på. Men læs vejledningen.
Resources søger i websteder hvor amatører, entusiaster eller andre har lavet sider med mange link-henvisninger. Hvis du fx søger på biblioteker, angiver ”Resources” forskellige steder hvor der er lister med biblioteker.
Det er ikke altid det virker. Og sprog spiller en stor rolle her. Det virker klart bedre på engelske søgeord end på danske. Hvis du fx søger på ”den kolde krig” foreslår Teoma ikke nogen afgrænsninger, men fundene er dog eminent sorteret: Kvalitetssider fra Danmarks Radio, Leksikon.org, gymfag og andre figurer allerede på side 1. Hvis du derimod søger på engelsk på ”cold war” finder Teoma over 600.000 fund, hvoraf de første ser godt ud. Og denne gang får de afgrænsninerne: Refine giver bl.a. CNN, cold war history og cold war museum. Resources giver nogle linksamlinger om den kolde krig fra forskellige universiteter.
Til sammenligning giver Google mere end dobbelt så mange hits på ”cold war”, men unægtelig meget mere rodet og uoverskueligt end Teomas inddelinger. Google skelner fx ikke mellem tekst og linksamlinger.
Mit umiddelbare indtryk af forskellen på Teoma og Google er: Teoma er god til bredere emner hvor antallet af hits er meget stort (dvs. flere tusinder). Google er derimod bedst til søgninger hvor antallet af hits holder sig på nogle hundreder. Det skyldes måske at ved små søgninger kommer Googles størrelse mere til sin ret.
Også en anden af Googles gode sider, nemlig at man ved at trykke på Cached kan få highlighted søgeordene, har Teoma forbedret. Man trykker simpelthen på en knap i Teomas menulinje.
Hvad jeg savner hos Teoma er muligheden for at afgrænse på domæner, specielt topdomæner, at søge på websiders titler og flere andre avancerede søgemuligheder. Det håber jeg at Teoma får indbygget snart.
Jeg har for forsøgets skyld haft Teoma liggende som søgemaskine i browseren i august måned. Jeg synes at den virker overraskende god, trods sin størrelse. Her gælder ”hellere mindre men bedre”.

Ingen kommentarer: