tirsdag den 13. december 2005


Lexxe: 3. generationssøgemaskine?
Søgemaskineeksperter har store forventninger til den næste (3.) generation af søgemaskiner. De bygger i modsætning til fx Google på en forståelse af meningen i ord, i stedet for at se disse som blot ord. For selvfølgelig er meningen i en sætning ikke blot er summen af de enkelte ord. Hidtil har det ikke været muligt at udvikle en søgemaskine der kan ”forstå” hvad ”meningen” er med en søgning.
Nu melder Lexxe sig som et bud. Den bygger på en teknik som kaldes Natural Language Processing (Computational Linguistics) og "Linguistic Computing". Altså en slags kunstig intelligensteknik. Det er ikke første gang en søgemaskine har proklameret at finde en speciel ny teknik til at udføre "3. generationssøgninger". Uden at søgningerne er blevet bedre af den grund.
Lexxe skulle være i stand til at skelne mellem om søgeordene er en eller flere sætninger. Som et eksempel på hvor svært det kan være, angives søgningen "chilly chicken fillet burger". Hvor mange sætninger er der? Er det blot ord, eller hvad.
Korte spørgsmål fører til korte svar. "When is Queen Elizabeth's birthday" vil derfor blot svare med en dato. Søgninger kan højst omfatte 10 ord, men det er hensigten at det tal skal øges. Svarene er ikke præfabrikerede, men hentes fra ustrukturerede tekster i internetdokumenter.
Dette var hensigtserklæringer. Fungerer Lexxe? Målsætningen er: Korte svar på korte spørgsmål. Følgende to er repræsentative for et par testsøgninger:
[ when did thorvald stauning die ]
Sandelig: Lexxe svarer 1942 (ingen dato) i det korte svar. Nedenunder kommer der så de egentlige fund, hvor der kan findes yderligere oplysninger. Disse er ganske gode. Men det kan 2. generationssøgemaskiner som fx Google også godt klare. Altså besvare wh-spørgsmål (what, when osv). Lav samme søgning i Google (brug .com-versionen), og svaret er mere præcist: Date of Death: 3 May 1942.
Hvad så med
[ who killed john f kennedy ]
Her lyder det korte, men kryptiske svar: of adult child in light of crash that killed john f kennedy jr carolyn bessette kennedy and lauren bessette. Googles svar på samme spørgsmål er mere præcist: Lee Harvey Oswald - Accused assassin of John F. Kennedy. I Lexxe må vi igen ned i de øvrige fund og kigge i margenteksterne for at få bid: Lee Harvey Oswald killed John F. Kennedy. (Selv om nogen stadig betvivler det).
Lexxe er i beta-version og lover bedre resultater i fremtiden. Selvfølgelig skal den ikke kasseres på grundlag af en håndfuld testspørgsmål. Indtil videre ligner den blot ikke en Google-killer. Eller en trussel for nogle af de andre. Internetsøgning har tidligere omtalt bl.a. Brainboost og Factbites. Der findes andre.
Når Lexxe er værd at beskæftige sig med, er det fordi den peger på de store søgemaskiners svage punkt. Og prøver at løse det. Hvad alle internetsøgere vel håber på. Helst hurtigt.
Links
Lexxe.

Ingen kommentarer: