tirsdag den 21. august 2012

Googles semantiske søgning

Det kan måske være passende at rekapitulere hvad der er sket med Google siden november 2011. Og Googles kerneydelse: Søgning.

Search Plus Your World er en af Googles nyskabelser. Men grundlæggende bygger den stadigvæk på Googles indeks. Altså groft sagt den database hvor Google opbevarer alle kopier af internetsider. Hvor stor denne er, kan vi kun gisne om, men størrelsen ligger mellem 10 og 100 milliarder internetsider. Som desuden bliver opdateret løbende, idet internetsider jo har det med at ændre sig. Før i tiden kunne det tage en måned at opdatere, men i dag går det så stærkt, at visse sider bliver opdateret hvert minut (eller mindre). Personligt har jeg ikke kunnet se symbolerne endnu. Så jeg går ud fra at det ikke er fuldt udrullet i Danmark endnu. Google+ kan vel nærmest betragtes som Googles svar på Facebooks og Twitters bestræbelser på at give folk hvad de vil have.

Med et så stort indeks, er det nødvendigt med en god sorteringsmekanisme. Det er netop dette som har gjort Google til hvad den er i dag. Groft sagt udvælger den de bedste hits i forhold til en række kriterier, omkring 200, som vægter forskelligt. Mens du skriver, vil Google i øvrigt prøve at gætte sig til hvad du er  i gang med at skrive, og kun 16-20% af forespørgslerne har Google ikke set før. I alt har Google et grundlag på ca. 450 mia. forespørgsler at bygge på siden 2003. Heri er ikke medregnet søgninger som bliver gentaget. Der er tale om unikke søgninger. Google har datacentre overalt på jorden, så du kan aldrig vide hvorfra din forespørgsel bliver besvaret.

Personalisering påvirker forskellige elementer i søgningen. Fx vil autofuldførelsen af forespørgslen afhænge af hvad du har søgt på før, af hvorfra du søger, dine tidligere søgninger, samt hvad du har med i dine personlige sider fx Google+.

Google satser nu for alvor på "maskinintelligens", altså en maskinel måde at fortolke en søgeforespørgsel. Hvorfor mener Google maskinelt skulle være bedre end menneskeligt? Bl.a. fordi der findes en hel industri, SEO som lever af at få betalende til at få deres hjemmesider vist øverst, fx i Google. Det sker ved at manipulere med sdietitler, adresser, tags, tekst osv. Så menneskelig indblanding er som regel lig med SEO indblanding. Kunsten er altså at skabe søgeresultater som er uafhængig af menneskelig manipulation. 

Link
Internetsøgning om Search Plus.
Phil Bradley.
Pandia Post.
Read Write Web.
Read Write web.

Ingen kommentarer: