For over et år siden, august 2010, introducerede Google en helt ny form for webindeksering: Caffein (koffein).
Formålet var at give helt dugfriske og opdaterede søgeresultater, og
ikke blot for få sider, men for en altovervejende del af webben.
Normalt
tænker du måske ikke over det, men når du søger på Google, søger du
ikke på internettet, men i kopier af internetsider, lagret i
kæmpecomputere. Disse kopier kan være mere eller mindre gamle. Faktisk
helt op til flere uger, måske måneder gamle. Ydermere foregik
indekseringen ved at Google tog store portioner ad gangen således at det
gik en del tid fra siderne blev indekseret, til du kunne finde dem ved
søgning i Google.
Caffein indekserer i modsætning
hertil små portioner, men til gengæld hele tiden, og det skulle så gå
meget stærkt for Google-brugere at finde meget opdaterede sider. Hvis du
ikke rigtig forstår det, så er du ikke alene om det. I hvert fald har
jeg meget svært ved at begribe dette og se det for mig. Googleblog
skriver noget om hvad det er der sker:
Hvert sekund
behandler Caffein hundredtusinder af sider. Dette svarer i papirsider
til en stak der vokser med næsten 5 km i sekundet. Caffein fylder
100.000.000 GB, og samler hundredtusindvis GB ny information hver dag.
Hvad der svarer til 625.000 af de største iPads. Hvis de blev lagt oven
på hinanden, ville de række op i 64 km højde. Her er min fatteevne
opbrugt, og tager blot til efterretning at: Det lyder af rigtig meget!
I
november trykkede Google så yderligere på speederen ved at lade et
kriterie for nyeste sider indgå i den generelle søgealgoritme. (Eller
måske rettere: Skrue op for dette kriterie). Efter sigende skulle det få
betydning for 35% af søgningerne hvad angår opdaterede sider. Dette er
målrettet mod højaktuelle emner, regelmæssigt tilbagevendende
begivenheder og langtidsholdbare "gamle" nyheder.
Jeg
har ikke umiddelbart kunnet se nogen ændring i søgningerne. Det ville jo
også kræve at jeg havde lavet nogen søgninger før opdateringen så jeg
kunne sammenligne. Når jeg siger det, er det ikke helt rigtigt. Jeg har
faktisk undret mig over at når jeg søgte på nærværende blog kort tid
efter at have udgivet et nyt indlæg, så viste Google den nye version,
med det nye indlæg. Men en svale gør ingen sommer, så jeg har ikke taget
dette (og vil heller ikke tage det) som et bevis på at Caffein
virker.
EDIT 12.33. Jeg har lige set at Google Inside Search har en længere oversigt over ændringer i søgealgoritmen. Jo, tingene går stærkt for tiden. Måske allerede mens jeg sidder og skriver dette.
Link
Googleblog.
Inside Search.
Search Engine Land.
Ingen kommentarer:
Send en kommentar