onsdag den 29. august 2007

Hakia

Hakia er (endnu) et bud på en semantisk, meningsbaseret søgemaskine. Præsentationen og udvælgelsen er interessant og der er også noget nyt i den teknologi som ligger bag søgemaskinen.
Det mest interessante er måske at der er mennesker som har forsøgt at sortere fundene. Det ses lettest ved at bruge det eksempel, som ophavsmændene selv oplyser til Pandia post på Johannes Kepler. Her får du fundene delt op i faneblade til Biography and Timetime, billeder, citater osv.Grafikken og layoutet er ganske fint på Hakia. Med faneblade, indholdsfortegnelse og et billede. Selve posterne minder om Googles opsætning.
Der skulle være svar på billeder på omkring 600.000 populære forespørgsler, såsom piano, Hillary Clinton, coffee, India, breast cancer, red sox, Paris Hilton, Pokemon m.fl. Det hele sker i en blanding af meningsbaseret teknologi og redigering af mennesker.
Hakia bruger et gammelt princip, fuzzysøgning. Det betyder groft sagt søgning på beslægtede ord, synonymer osv. Men et temmeligt avanceret udvidet fyzzysøgning, hvilket Hakia ifølge interviewet skulle være de første til at bruge. Jeg er lidt skeptisk over for den slags, fordi de hidtidige resultater blot har sløret. Bl.a. synes jeg ikke Googles synonymsøgning med ~ giver gode resultater. Men måske har Hakia virkeligt fundet de vises sten her. Det ville såmænd blot være dejligt.
Det er muligt at skrive i hverdagsprog, altså stille deciderede spørgsmål. Ikke noget med søgestrenge. På det felt minder den om Brainboost, Ask og andre.
Hvordan det rent teknisk er kommet i stand, fortæller interviewet ikke noget om. Men en talsmand fortæller lidt om filosofien bag. Nemlig en blanding af sprogfilosofi, matematisk logic og kognitiv videnskab. Det går under betegnelselsen ontological semantics, hvilket i min amatøragtige oversættelse vist må betyde noget i retning af ontologisk semantik. Det er en disciplin som fokuserer på at finde meninger ud fra en ontologisk baggrund snarere end en grammatisk-syntaktisk. Eller lidt mere på jorden: Se ordene i deres kontekst. Hvilket vi jo selv som mennesker gør, når vi kommunikerer.
Altsammen lyder meget godt sålænge det foregår på det teoretiske plan. Når det skal konkretiseres, er Hakia mere dunkle. De oplyser at have fundet et system som de kalder for Qdexing. Hvad det så går ud på, er det svært at få fat på.
Men i teorien (igen) går det ud på at analysere en hel webside og så forestille sig alle de spørgsmål som denne webside kan give svar på. Disse spørgsmål bliver så indgange til dokumenterne.
Ok. Nok om snakken. Jeg fandt nogle eksempler, og var ikke helt uimponeret. Prøv fx med who is anders fogh rassmussen. Den gav overraskende godt resultat, nemlig en henvisning til en biografi på Folketingets hjemmeside. Sammenlignet med Google søgning på samme
som giver statsministerens hjemmeside, Wikipedia og dernæst Hakias nummer 1.
Andre sjove forespørgsler er who created the universe, who invented the internet og the symptoms of yellow fever.
Øverst lægger der sig et "how about" eller andre forslag. Dem bryder jeg mig ikke om. At der på spørgsmålet om hvem Anders Fogh Rasmussen er kommer en to år gammel nyhed fra et for mig totalt ukendt websted er ikke brugbart.
Igen: Hvad finder man ved at søge tilsvarende på Google? Næsten det samme. Hoverer jeg over det? Overhovedet ikke. Jeg ville gerne at man endelig fik hul på det problem det er at man ikke kan bruge søgemaskinerne til mere end man kan i dag. Derfor håber jeg også på at Hakia måske kan være et skridt i den rigtige retning.
Link
Pandia News om Hakia.
Hakia.

Ingen kommentarer: