Internetsøgning: Det semantiske web

Allerede fra søgemaskinernes indtog har det været klart at de ikke egnede sig til at forstå hvad det var brugerne var ude efter. Altså at forstå meningen bag de ord som brugerne anvender. Dette at lave en søgemaskine som kan det, kalder man semantisk søgning. Paradoksalt nok har Googles forskellige matematiske og maskinelle algoritmer været de mest effektive til at 'forstå' brugernes hensigter. Men kun på overfladen forstår Google hvad det er brugerne vil have.
De velkendte problemer er ord med flere betydninger. Tvillinger kan fx optræde i talrige sammenhænge, i biologisk forstand, astronomi, astrologi, osv.
Hvis du har lyst til at prøve hvordan det aktuelt ser ud, så kan du bruge Pandia Posts liste over de fem vigtigste semantiske søgemaskiner i dag.
Hakia opdeler resultaterne i Web results, credible sites, images og news. Et af de mere interessant er Trusted Results from Credible Sites. Det er sider som er anbefalet af professionelle, fx bibliotekarer. Ifølge Hakias egne beskrivelse arbejder disse ud fra nogle ganske bestemte kriterier, bl.a. Peer review, at der ikke er kommercielle interesser og andet.
Jeg er ikke fan af Hakia. Men de testsøgninger jeg har lavet ser alle interesante ud til brug for bl.a. skoleopgaver. Jeg kan ikke rigtig se hvor det semantiske kommer ind i billedet.
SenseBot. bygger bl.a. på at inspirere til afgrænsninger ved search clouds. Dvs. en række emneord some er hyppigt forekommende og tilgrænsende. Andre interessante søgemaskiner er Powerset, DeepDyve og Cognition. Ellers består listen mest af mere specialiserede søgemaskiner.
Listen er nok ikke en til at indlemme i sin daglige søgning. Men den er interessant fordi den giver et indblik i hvor langt (eller måske snarere: Ikke særlig langt) vi er nået i dag med det semantiske web.
Link
Pandia Post.

Internetsøgning

Sider

onsdag den 15. april 2009

Det semantiske web

1 kommentar: