lørdag den 14. august 2004

Internetsøgning 2 år – del 1.
Den 18. august er dagen hvor det er 2 år siden det første indslag optrådte i denne weblog. Internetsøgning markerer det med denne dobbelt-artikel om hvad vi kan vente inden for søgemaskineverdenen. Artiklen har dels nogle interview med fremtrædende personer fra Yahoo! og fra Ask, dels nogle personlige kommentarer.
ResourceShelf og dets mere grundige vedhæng, ResourceShelf Plus, bragte et interview med lederen af Yahoo! Research Labs, dr. Gary Flake. Altså den afdeling på Yahoo! som arbejder på at udvikle søgemaskinen. Det fulde interview kan læses på ResourceShelf, her blot nogle af de mere almene betragtninger.
Et stykke inde i interviewet kommer Gary Flake ind på hvad visionerne er sammenlignet med hvordan det ser ud i dag:
Han forestiller sig at søgemaskiner er en kunstig intelligens som vil kunne finde det korrekte svar på ethvert spørgsmål, hvis altså det eksisterer. Hvis ikke, vil søgemaskinen give det næstbedste: en tilnærmelse, eller måske endda en forklaring på hvorfor der ikke var et perfekt svar. Sammenlignet med i dag, så har søgemaskiner ikke nogen forståelse af ord eller sprog. De tager kun højde for ords og links statistiske egenskaber, men ikke noget der bare ligner en forståelse. Søgemaskiner kan ikke forstå hvad brugerne vil, de skelner ikke mellem målrettede søgninger og det at browse, de skelner kke skelne mellem trivialiteter og dybde.
En mulighed eksisterer dog i at der ud over de ustrukturerede data også findes nogle delvist strukturerede data på internettet. Dette kan søgemaskinerne udnytte. Om han her hentyder til fx Googles samarbejde med universiteters databaser, skriver han ikke. Men det adskiller sig i hvert fald fra at behandle dokumenter som en sæk af ord som blot bliver indekseret. Han ville gerne have at ustrukturerede databaser var lige så gode som strukturerede, men det er ikke tilfældet i dag. I dag forsøger man dog at lave en mellemting. Han påstår endog at der er mere skjult data end ”rå” data på internettet, og at søgemaskinerne først er begyndt at kradse i overfladen af det, fx i form af enkle søgninger på sprog, lokalitet osv. Han mangler her den sammenkobling som er helt åbenlys for alle mennesker, men ikke for maskinerne. Og som adskiller menneskers visdom fra søgemaskinernes ophobning af data.
Med det mener han, at når mennesker læser et dokument, vil det helt automatisk kunne se om det er skrevet for specialister, om artiklen er forældet, om forfatteren er en autoritet inden for området, osv. Altså alle den slags oplysninger som kun findes i folks hoveder, men som ingen bekymrer sig om at skrive ned.
Mange sætter deres lid til at personaliserede søgninger vil kunne bringe søgemaskinerne videre, men det tror Gary Flake ikke så meget på, og måske med rette: De fleste brugere gider ikke bruge operatorer, og mange html-forfattere gider ikke bruge meta-tags. Kort sagt: alle går ikke i detaljer, og det accepterer Gary Flake. Hertil kommer at metatags bliver misbrugt, så det ikke er muligt at skelne dårlige (fx spammere) fra gode. (Jf. problemerne med at få den såkaldte Dublin Core almengjort).
Derfor er der også i en temmelig lang fremtid brug for formidlere, fx bibliotekarer: Data er ikke information, information er ikke viden, viden er ikke visdom. Søgemaskiner kan i dag give dig flere data end du har brug for, og også en del god information, men de er ikke engang med i konkurrencen når det gælder viden og visdom, så han mener at de forbedringer af søgemaskinerne som sker i dag, blot vil ændre bibliotekarers rolle fra at skulle behandle data til at koncentrere sig om visdom.
Uagtet hans skepsis over for personaliserede søgninger, ser han dog disse som den næste ”store ting” inden for internetsøgning. Dog i en enkel, stilfærdig og intuitiv udgave. Forhåbentlig så god at de fleste brugere i år 2009 vil betragte internetsøgning anno 2004 som latterligt forældet.
Artiklens 2. del kommer onsdag den 18. august.
Link
resourceshelf.com

Ingen kommentarer: