onsdag den 28. februar 2007

Om at undgå Google

Det er god latin at hvis du vil have en internetside med i Google, kræver det at nogen linker til siden. Af en eller anden grund kan webmastere ønske ikke at blive registreret i Google. Det kan de gøre ved at sætte robots.txt på deres website. Det betyder at Google ikke crawler serveren. Og med mindre de ikke har url-adressen, vil internetsøgere heller ikke blive linket over til internetsiden fra søgeresultaterne.
Så enkelt er det imidlertid ikke helt. Selv om du prøver på ikke at blive set ved at opfordre dine læsere til ikke at linke. Google Blogoscoped lavede et lille forsøg med at holde en hjemmeside hemmelig på denne måde, altså ingen link til siden.
Lad os sige at den ’hemmelige’ hjemmeside linker til en ikke-hemmelig hjemmeside. Det bliver registreret hos sidstnævnte. Det gør sådan set heller ikke noget, så længe denne ikke offentliggør det. Men det er der nogen der gør automatisk. Artiklen i Blogoscoped angiver to forskellige søgninger som viser omfanget af sådanne logbøger:
Generated by Webalizer
Created by awstats
Hermed er linket alligevel ’lækket’. På trods af de gode intentioner fra alle parter. Konklusionen af artiklen er bl.a. at hvis man ikke vil være i Googles indeks, kan man beskytte den via password. Eller at lade alle sine udgående link gå gennem en intern henvisning. Og så er det vi er ude i den helt store webmastereksamen.
Link
Google Blogoscoped.

Ingen kommentarer: