onsdag den 25. januar 2006

Tags og/eller emneord
Er søgemaskiner som Google blevet så avancerede, at de har overflødiggjort manuelt udarbejdede metadata? Ikke ifølge mange forskere, som efterspørger en mere præcis måde at søge den ”kvalitetsprægede” del af internettet, eller de bibliotekarer, som klager over den al for megen støj i resultaterne på fx Google og Yahoo. De efterlyser annoteringer, emneord osv. på sådanne dokumenter. Sådan som vi kender det fra fortidens kortkartoteker.
Google Scholar er Googles svar på det: ingen emneord, men en defineret forskerpræget database med fuldtekstsøgning og ranking. Vivisimo arbejder maskinelt med automatiserede emneordsopstillinger. (Se de "Clustered Results" på billedet, som stammer fra en søgning på "kronprins frederik"). Men altså ikke menneskeligt skabte taxonomier.
Alle internetdokumenter har simple metadata, fx en opdateringsdato, adresse og titel. Disse kan søgemaskinerne i stand til at søge på, fx udskille titlen på et internetdokument. Titlen kan nærmest sidestilles med emneord i en biblioteksdatabase. Men derudover er metadata generelt meget tidskrævende at lave manuelt. Det indebærer klassifikation, beskrivelser og katalogisering.
Men er det nu også nødvendigt, er det så indlysende at jo flere metadata desto bedre resultater? Det mener en talsmænd fra en stor regeringsstyret videnskabelig database i USA (Science.gov) ikke ”søgeteknologien er god nok til at overflødiggøre kategorisering og metadata…”.
Internetentusiaster mener at tagging er løsningen. Fænomenet er indtil videre reserveret til internetentusiaster, fx på Delicious og Flickr. Men intet tyder på at det vil udvikle sig fra et mange-fænomen til et masse-fænomen.
Svaret er ikke entydigt. De efterhånden mange undersøgelser med sammenligninger på søgning i videnskabelige databaser og på Google falder ud til snart den ene, snart den andens fordel. Måske er konklusionen at begge skal bruges. Udviklingen er at Googles resultater vurderes som stadig bedre.
Endelig er der så brugerne af søgemaskiner. Hvis man skal dømme efter deres adfærd, så oplever de ifølge flere og flere undersøgelser ingen behov for emneord eller tags. Google laver på verdensplan 200 mio. søgninger om dagen. Jeg kender ikke tal for Danmark. Men hvis vi tager underkanten (Danmark = 1 promille af verdens befolkning) er det 200.000. Det er lige så mange som den mest brugte biblioteksdatabase, Bibliotek.dk når op på – om måneden! Og så er det endda en travl måned. Google bruges naturligvis til mange ting, men tallene burde vække til eftertanke.
Læs mere
Government Computer News.

Ingen kommentarer: