onsdag den 16. november 2011

Google på koffein....

For over et år siden, august 2010, introducerede Google en helt ny form for webindeksering: Caffein (koffein). Formålet var at give helt dugfriske og opdaterede søgeresultater, og ikke blot for få sider, men for en altovervejende del af webben.

Normalt tænker du måske ikke over det, men når du søger på Google, søger du ikke på internettet, men i kopier af internetsider, lagret i kæmpecomputere. Disse kopier kan være mere eller mindre gamle. Faktisk helt op til flere uger, måske måneder gamle. Ydermere foregik indekseringen ved at Google tog store portioner ad gangen således at det gik en del tid fra siderne blev indekseret, til du kunne finde dem ved søgning i Google.

Caffein indekserer i modsætning hertil små portioner, men til gengæld hele tiden, og det skulle så gå meget stærkt for Google-brugere at finde meget opdaterede sider. Hvis du ikke rigtig forstår det, så er du ikke alene om det. I hvert fald har jeg meget svært ved at begribe dette og se det for mig. Googleblog skriver noget om hvad det er der sker:

Hvert sekund behandler Caffein hundredtusinder af sider. Dette svarer i papirsider til en stak der vokser med næsten 5 km i sekundet. Caffein fylder 100.000.000 GB, og samler hundredtusindvis GB ny information hver dag. Hvad der svarer til 625.000 af de største iPads. Hvis de blev lagt oven på hinanden, ville de række op i 64 km højde. Her er min fatteevne opbrugt, og tager blot til efterretning at: Det lyder af rigtig meget!

I november trykkede Google så yderligere på speederen ved at lade et kriterie for nyeste sider indgå i den generelle søgealgoritme. (Eller måske rettere: Skrue op for dette kriterie). Efter sigende skulle det få betydning for 35% af søgningerne hvad angår opdaterede sider. Dette er målrettet mod højaktuelle emner, regelmæssigt tilbagevendende begivenheder og langtidsholdbare "gamle" nyheder.

Jeg har ikke umiddelbart kunnet se nogen ændring i søgningerne. Det ville jo også kræve at jeg havde lavet nogen søgninger før opdateringen så jeg kunne sammenligne. Når jeg siger det, er det ikke helt rigtigt. Jeg har faktisk undret mig over at når jeg søgte på nærværende blog kort tid efter at have udgivet et nyt indlæg, så viste Google den nye version, med det nye indlæg. Men en svale gør ingen sommer, så jeg har ikke taget dette (og vil heller ikke tage det) som et bevis på at Caffein
virker. 

EDIT 12.33. Jeg har lige set at Google Inside Search har en længere oversigt over ændringer i søgealgoritmen. Jo, tingene går stærkt for tiden. Måske allerede mens jeg sidder og skriver dette.

Link
Googleblog.
Inside Search.
Search Engine Land.

Ingen kommentarer: