torsdag den 7. oktober 2004

Tigerspring i vente på Google?
Internetsøgning har gentagne gange nævnt Googles store svaghed: den kan ikke afgrænse store søgninger med andet end søgesprog og feltsøgninger. Og hidtil har jeg henvist til Teoma som et udmærket alternativ.
Nu er der måske godt nyt i vente, i hvert fald ifølge en artikel i Search Engine Lowdown, som citerer Peter Norvig. Han er ”søgekvalitetsdirektør” på Google.
Han fortæller om tre nye områder, hvor Google Labs forsøger at udlede meningen med folks søgninger, i stedet for blot at behandle ordene matematisk og maskinelt.
Oversættelser. Dette punkt drejer sig om at udvikle de maskinelle oversættelser til oversættelser som også tager hensyn til syntaks og semantik, bl.a. ved at gøre brug at den enorme tekstmængde som ligger i Google.
Udvælge vigtigste steder i dokumenterne. Det går ud på at Google skal prøve at analysere de indekserede dokumenter og udelukke de ord og sætninger som reelt er støj. Google arbejder på at trække nøgleordene ud og fjerne det indhold som er fyld.
Mappeinddeling. Denne teknik er kendt fra Vivisimo og Teoma. Og dette arbejder Google også med. Dette skulle løse problemet med at søgeord kan betyde forskellige ting, hvilket giver en masse fund som man reelt ikke er interesseret i. Ved at give forslag til alternative ord, vil internetsøgeren kunne præcisere søgningen. (Læs i øvrigt artiklens lidt morsomme eksempler med George Bush og John Kerry).
Læs hele artiklen på:
www.searchenginelowdown.com/2004/10/web-20-exclusive-demonstration-of.html

Ingen kommentarer: