torsdag den 26. juni 2003

Store eller små bogstaver?
Som regel er det ligegyldigt om man skriver med små eller store bogstaver i søgemaskinernes søgefelter: søgemaskinerne skelner som hovedregel ikke. En sådan skelnen er ellers hensigtsmæssig når man vil udelukke uønskede fund; det helt oplagte eksempel er navne.
I Research Buzz 236 fra 19. juni 2003 gør Tara Calashain opmærksom på at man godt kan få Altavista til at skelne mellem små og store bogstaver. Hun har fundet ud af at ”” (altså anførselstegn, gåseøjne) om enkelte ord (ikke om sætning) får Altavista til at skelne mellem om ordet er skrevet med stort eller lille.
Inspireret af det har jeg undersøgt om det også gælder i to andre søgemaskiner, Alltheweb og Google.
Prøv fx med navnet Erik Høy. Her kommer der meget støj med fra norske sider, hvor ”høy” opfattes som tillægsordet ”høj” (ikke personnavnet). Her ville det være belejligt at søgemaskinen kunne skelne mellem små og store bogstaver så man kunne udelukke tillægsordet, idet det jo er personnavnet vi ønsker. Mulighederne for at søge på dette er:
1. Quick and Dirty: Erik Høy. Den dårligste måde. Alle søgemaskiner sætter automatisk boolsk ”og” mellem ordene. (Se webloggen om søgesprog 8.12.2002). Det gør ingen forskel om man skriver med stort eller lille i Altavista og Alltheweb. Google halverer Google antallet af fund hvis man skriver navnene med stort begyndelsesbogstav, men dog ikke i afgørende grad. Et kontrolcheck viser at Google som regel ikke skelner mellem små og store bogstaver. Fx giver Sønder Omme og sønder omme samme antal fund. Mig bekendt reagerer Google kun på store bogstaver i den engelske søgesprogskommando OR (eller).
2. Med anførselstegn om enkeltord: ”Erik” ”Høy”. Det virkede kun i Altavista, men der virkede den til gengæld også ganske glimrende: Hvis man skriver enkeltordene med stort begyndelsesbogstav, bliver antallet af fund reduceret til 1/6. Hverken Google eller Alltheweb skelnede mellem små og store bogstaver.
3. Som sætning: ”Erik Høy” Frasesøgning gav som forventet samme resultat i alle tre søgemaskiner. Og det var ligegyldigt om der var store eller små bogstaver i anførselstegnene.
De store fordele ved på flere ord synes jeg nu ikke Altavistas gåseøjne har. Ved de fleste personnavne søger man alligevel på to eller flere ord, og her giver frasesøgning et godt resultat selv om der ikke skelnes mellem små og store bogstaver.
Men der er indlysende fordele hvis man har et søgeord som samtidig kan betyde noget andet, fx Nino (kan både være vejrfænomenet og det spanske ord for dreng), Lærke (kan være pigenavn eller fugl) og Anders (drengenavn eller tysk: andet). Under alle omstændigheder er det altid godt med flere afgrænsningsmuligheder!

Ingen kommentarer: