søndag den 22. december 2002

Googles moralske og kommercielle udfordringer.
Dette er den sidste længere artikel i 2002. Administratoren ønsker alle læserne en glædelig jul og et godt nytår. Det sidste indlæg vil undtagelsesvis ikke handle så meget om søgeteknik, men om et mere søgemaskine-politisk emne.
I december-nummeret af det elektroniske nyhedsbrev Wired News fra Terra Lycos analyserer Josh McHugh Googles monopollignende rolle på søgemaskine-området. En af de få analyser på andet end hvordan man bruger søgemaskiner. Nedenfor nogle hovedpunkter i artiklen.
Google ledes af et triumvirat. Eric Schmidt som står for økonomi og strategi, Larry Page er den tekniske bagmand, mens Sergey Brin er Googles samvittighed og står for politikken – den moralske side af Google. Hvad Brin beslutter sig for har således vidtgående konsekvenser. Hans og Googles moralkodeks bygger på sætningen ”Don’t be evil”. Og "ondt" er ifølge Schmidt hvad Brin siger er ondt.
Igennem 2002 har dette princip været under pres:
- Efter trusler om sagsanlæg fra Scientology-kirken om copyright-regler fjernede Google en norsk anti-Scientology-side fra sit indeks.
- I efteråret blokerede den kinesiske regering for Google så kineserne ikke kunne søge på formastelige ord. Her stod Brin over for dilemmaet om han skulle indgå en handel med Kinas regering eller helt forsvinde fra det kinesiske marked. Google og Kinas regering har selvfølgelig ikke ført direkte forhandlinger. Men udgangen blev et kompromis: Google blev genåbnet, men uden at kineserne i den kinesiske udgave af Google kan søge på ord som Falun Gong og sætninger som ”Human rights in China”. Disse udløser enten blanke sider eller regeringsgodkendte sider – eller computerne bliver simpelthen blokeret for Googleadgang i et par timer!
- I oktober afslørede en Harvard-forsker at Google i Frankrig, Tyskland og Schweiz frasorterede sider som krænker disse landes racismelovgivning. Brin har ikke kommenteret det.
Hvor Google på disse ømtålelige punkter har måttet indgå kompromisser, har Brin til gengæld været kompromisløs på andre felter:
- Der bliver slået hårdt med de såkaldte link-farme. Altså internetsteder som linker til hinanden med det ene formål at komme til at rangere højere oppe i sorteringen i Google. Dette er en vedvarende krig som det er umuligt at overskue: Når Google opdager link-farme, bliver medlemmer af disse puttet til sidst i fremvisningen af resultaterne. Men ingen har overblik over hvor mange link-farme der eksisterer.
Med den store succes følger også at aktionærer ønsker større udbytte, bl.a. gennem reklamer. Google har hidtil konsekvent afvist pop-up-reklamer. Men hvor længe vil aktionærerne finde sig i det? Yahoo gjorde det samme i begyndelsen. Men det synspunkt forsvandt i samme takt som Yahoo’s aktiekurs røg ned.
Endelig er der så konkurrencen fra andre søgemaskiner. Denne er ikke særlig stor for øjeblikket, jf. denne weblogs artikler om Altavista, Yahoo og Hotbot. Men der er dog en væsentlig konkurrent: Alltheweb. Den matcher Google på stort set alle felter, og er måske bedre til at ”crawle” internettet igennem (hver 7-11 dag mod Googles hver 28. dag). Ligesom Alltheweb er langt fremme med ”intelligente” søgninger, lidt i stil med hvad Ask Jeeves forsøgte sig med for nogle år siden.
Artiklen i Wired News angiver nogle problematiske fremtidsudsigter for Google. Men det er dog stadig skønhedspletter, og det rokker ikke ved at Google i dag stadig er søgemaskinen over dem alle.

Freepint udgiver indeks
Et enkelt link dog til de som ikke kan holde sig fra at fordybe sig i søgemaskiner i juleferien:
www.freepint.com/issues/02indexb.htm
Freepint er en af denne weblogs allerflittigst benyttede kilder. De har et nyhedsbrev som indeholder gode informationer om hvad der sker på søgemaskineområdet, faglige links og meget andet. For de som ikke har tid til at læse dette, har siden lavet et indeks på ovennævnte side. Indekset er delt i forskellige emner som fx Subject Specific Articles og Searching Articles. Absolut et besøg værd!

tirsdag den 17. december 2002

Også Hotbot får ansigtsløftning!
Tidligere har Yahoo og Altavista fået en ansigtsløftning. Nu har en anden af klassikkerne, Hotbot, også moderniseret sig. Og som i de to andre tilfælde på samme måde: Googliseringen er virkelig slået igennem. De positive sider af den er at alle de mange reklamer og features er fjernet fra Hotbots forside. Søgebilledet er mere enkelt opbygget, specielt efter at den avancerede søgning er flyttet over på sin egen side.
En spændende nyhed er at Hotbot tilsyneladende er ved at skifte til meta-søgemaskine, altså en søgemaskine som søger i flere søgemaskiner på en gang: All The Web (Fast), Google, Inktomi og Teoma. Desværre kan man ikke søge i alle på en gang. Det kan man til gengæld på en af de nye søgemaskiner, ez2www.com som tidligere er omtalt her på webloggen.
Hotbot er en søgemaskine som jeg ikke har brugt i adskillige år. Men jeg vil da anbefale internetsøgere også at prøve den. Men som sagt: sammenlign med ez2www.

søndag den 15. december 2002

Sjov på nettet.
Internettet er også sjov og underholdning! Følgende liste med underholdende indhold er udvalgt for at vise internettets lyd- og billedoplevelser. Det kræver programmer som kan afspille musik, billeder og lyd. Heldigvis kan mange flere ting på en gang. Det er en god ide før du går i gang at sikre dig at du har gode medieafspillere som Real Player (se nedenfor), Media Player eller Winamp på din computer. De kan downloades gratis.
www.real.com Real player 1 har tusindvis af gode og gratis radioprogrammer fra hele verden. I samme hug får du en cd/dvd-afspiller og andre sjove ting. Du kan høre fx nyheder, vælge mellem 17 forskellige slags musik fra ”alternative” over ”oldies” og ”rock” til ”world music” Herfra bliver du så ledt over i et varierende antal gratis radiokanaler. Lyt mens du laver andre ting på din computer!
www.ilgradio.com/ibwd The International Broadcasting Web Directory er til dig der er vild med alverdens landes nationale, regionale og lokale radioer. Klik frem til et bestemt land og få et komplet overblik.
www.classicalarchives.com Computerskabte midi-filer. Irriterende for nogen, andre elsker dem! Indeholder ca. 22.000 musikfiler af ca. 1.400 klassiske komponister. Der er kvote på 10 gratis numre du kan lytte til om dagen!
www.singingfish.com er en søgemaskine som udelukkende søger efter mediestrømme med video og musik, (streamboxes). Mediestrømme kan ikke downloades, dem lytter man til/ser her og nu. Maskinen har en avanceret søgning. Det er en god ide at afkrydse ud for ”længere end 3 minutter”. Ellers får man ofte blot et brudstykke.
mp3.about.com/library/weekly/aa030501.htm er en oversigt med 25-20 steder med lovlige MP3-filer. Download uden frygt for hvornår kongens foged dukker op.
www.googlefight.com er en søgemaskine hvor du kan stille to forskellige søgeord op mod hinanden ligesom i en boksering og se hvem der vinder. Skriv fx Bush i den ene og Saddam i den anden. Tryk og find ud af at Bush klart vinder over Saddam med ca. 9 mill. hits mod Saddams kun ca. 1 mill. Absolut kun tilrådelig hvis du keder dig bravt!
www.funnycartoons.dk er en dansk side med ca. 100 små og korte tegnefilm eller animerede sider. Opdelt i 6 kategorier. Her kan du både se parodier på ”Mission Impossible” (du vælger selv skuespiller) og bin Laden som påklædningsdukke. Niveauet er ofte under bæltestedet, men det er vel snart nytårsaften.
Det var det. Med ovennævnte skulle du kunne underholde dig og familien i hele juleferien! Glædelig jul og godt nytår.

tirsdag den 10. december 2002

Nordisk weblog om internetsøgning.
I USA og andre engelsksprogede lande findes adskillige weblog som ligesom denne weblog beskæftiger sig med internetsøgning. Det ser lidt mere sparsomt ud i Skandinavien. Men til interesserede har der faktisk siden 1. februar 2001 eksisteret en svensk, startet af to svenske bibliotekarer fra Sundsvall og Umeå Universitetsbibliotek:
internetbrus.com
Registre og indeks er tilmed langt bedre end det er muligt her på webloggen. Så hvis du er god til svensk...

søndag den 8. december 2002

Søgesprog.
Søgemaskinernes søgefelter bygger på to principper: feltsøgning og søgesprog. (Læs om feltsøgning den 4. november 2002). I teorien to enkle principper, men svære at gennemskue i søgemaskinernes avancerede søgebilleder.
Søgesprog bygger på et matematisk-logisk princip: To eller flere mængder (fx a og b), som indbyrdes overlapper hinanden, kan opdeles i forskellige områder. Oversat til søgemaskine-praksis: En søgning på internetsider efter søgeordene a og b kan have tre udfald: 1. De internetsider hvor både a og b er, 2. de internetsider, hvor a er, men ikke b (og omvendt), og 3. de internetsider hvor enten a eller b er. Forenklet:
Udfald 1: a og b optræder.
Udfald 2: a ikke b optræder.
Udfald 3: a eller b optræder.
Vi har genfundet de tre såkaldte operatorer: og, ikke og eller!
Søgemaskiner som Google og Alltheweb bruger disse operatorer. Når de oplagrer de milliarder af internetsider i deres database, opstiller de alle ordene i lister med henvisning til den internetside hvor de kom fra. Når så du søger på et ord, checker søgemaskinen ordet i listen, kobler det til alle de internetsider hvor ordet optræder og viser dig en resultatliste. Det går hurtigt, under 1 sekund.
Operatoren Og – med tilføjelsen ” ” og stopord.
Operatoren Og behøver man normalt ikke skrive. Søger du på to eller flere ord, opfatter søgemaskinen mellemrummet mellem ordene som et og (udfald 1). Det kan være en fordel: Hvis du fx søger på voodoo haiti, finder søgemaskinen de internetsider hvor både ordet voodoo og ordet haiti optræder, men ikke nødvendigvis ved siden af hinanden.
I andre tilfælde er det en bagdel. Hvis du fx skriver erik høy, finder søgemaskinen som før alle de internetsider hvor erik og ordet høy optræder. Alltheweb finder eksempelvis 377.000 internetsider bl.a. fordi høy på norsk betyder høj. Her er det en bagdel med det automatiske og. Derfor har de fleste søgemaskiner indrettet søgefeltet sådan at anførselstegn (” ”) omkring to eller flere ord ophæver det automatiske og. I eksemplet fra før: søgningen ”erik høy” (med anførselstegn) giver kun 151 internetsider, men nu kun på personnavnet!
Og-operatoren behøver du kun at tænke på hvis et søgeord er et stopord, dvs et småord på to-tre bogstaver og små tal, fx the, a, an, der, die, das, dem, il, le, la osv. Her skal du skrive + foran ordet (uden mellemrum!), med mindre ordet står i anførselstegn.
Generelt om anførselstegn og og-operatoren.
Anførselstegn er gode til at søge navne, citater, (musik)tekster og til at besvare paratvidenspørgsmål: ”palle lauring”, ”med lov skal man land bygge”, ”så er vi færdig med den dag”, ”højeste bjerg i verden”, ”verdens højeste bjerg”.
Operatoren Ikke
Ikke-operatoren udelukker internetsider hvor bestemte ord optræder. Den er praktisk at have i baghånden hvis man får mange hits og gerne vil udelukke ubrugelige hits. En søgning på voodoo giver både et fotoprogram med det navn og den kultiske foreteelse som stammer fra Haiti. Her kan fotoprogrammet udelukkes ved at bruge ikke-operatoren.
Operatoren Eller
Operatoren eller kan bruges til at søge på flere ord på en gang, fx udenrigsministeriet [eller] udenrigsministeren [eller] udenrigsminister.
Så starter forvirringen!
I eksemplerne er og , ikke og eller sat i skarpe parenteser, for det kræver at man har nogle symboler for dem. Og her breder forvirringen sig. Det almindeligste er at bruge +, - og ”or”. Men afhængigt af søgemaskinen vil man også kunne finde and/&, not (and not), or og at de skal angives med store bogstaver. De danske ord, og, ikke og eller bruges sjældent, selv i Danmark. Check vejledningerne før du begynder at bruge operatorerne.
Eller brug din viden om operatorer til at forstå hvad der står i de ofte svært fattelige avancerede søgebilleder. Her er et udvalg af hvordan de tre operatorer og anførselstegn kan optræde:
Og: Must include (Alltheweb), All these words (Altavista), Med alle ordene (Google)
Ikke: Must not include (Alltheweb), And none of these words (Altavista), uden ordene (Google)
Eller: Should include (Alltheweb), Any of these words (Altavista), Med nogle af ordene (Google)
“ “: This exact phrase (Altavista), Med den nøjagtige sætning (Google).
Med viden om de tre operatorer og anførselstegn er det lettere at forstå disse kryptiske formuleringer.

onsdag den 4. december 2002

Vivisimo har nu også nyhedssøgning.
Metasøgemaskinen Vivisimo har nu også meldt sig i rækken af søgemaskiner som søger på nyheder. Vivisimo udmærker sig som søgemaskine ved at opdele resultaterne i forskellige emner (gamle internetsøgere vil erindre Northern Light). Og det er denne opdeling i emner som gør Vivisimos nyhedssøgning ganske god.
Først vælger du hvilken nyhedskilde du vil bruge. Valgmulighederne er: CNN, New York Times, BBC, Yahoo, Wired News, World News, SF Gate og andre. Du gør nu sådan set det samme som hvis du kun søgte i disse nyhedsmediers databaser, men forskellen er at fundene bliver opdelt i emner, lige som når du normalt søger bredt på internettet i Vivisimo.
Der er dog i denne første version nogle skønhedspletter. Jeg prøvesøgte på Denmark i World News. Vivisimo gav 69 fund. Emneopdelingen var her: Chechen Russia (11), Ban European Union (9) og 8 andre emner (heriblandt More!). Jeg var interesseret i Sakajev-sagen og klikkede derfor på den øverste som viste 11 resultater. Desværre virkede linkene ikke, bort set fra den som står nederst i linket (Source:...). Den var til gengæld god. Her fik jeg ikke bare en spritny nyhed, men adskillige nyheder som havde forbindelse til emnet.
Se også denne weblog om nyhedssøgning fra 8. oktober 2002.

søndag den 1. december 2002

Landeoplysninger.
I mange situationer har man brug for at vide noget om et bestemt land ud over hvad man kan finde i emnekatalogernes rejseinformation. Hvis man skal emigrere, skrive en gymnasieopgave, eksportere noget eller bare er alment interesseret. Følgende fire websteder er gode udgangspunkter. Det er en god ide at have flere muligheder pga. opdatering.
De to første steder er overvejende linksider, de to sidste tekstsider med få links. Alle er umiddelbart lette og logiske at finde rundt i da de er geografisk eller alfabetisk opbyggede efter landene.
Linksider til alverdens landes offentlige (og private) sider:
www.gksoft.com/govt/en/ Oversigt over alverdens landes offentlige sider både på nationalt og lokalt plan, ambassader mv., politiske partier, rejseinformation og andet. Også overstatslige organisationer og institutioner. Mange af siderne er ikke opdateret i årevis, men det betyder ikke så meget så længe linkene er det.
www.loc.gov/rr/international/portals.html Library of Congress (USA). Overlapper meget ovenstående. Den indeholder dog mange flere links om emner som historie, regering, litteratur og kultur, medier, biblioteker, telefonbøger og meget mere. Er under opbygning og mangler derfor flere lande.
Tekstsider til alverdens lande
www.leksikon.org Dansk venstredrejet leksikon. Vælg menuen ”lande”. Tekstmængden her er egnet til opgaver fx til 8. klasse og gymnasium. Centrale links (nederst), bl.a. til Udenrigsministeriets landefakta, Lonely Planet (rejseinformation), Amnesty International, Human Rights Watch og politiske ressourcer.
www.infoplease.com Engelsksproget. Kig under World, Countries (www.infoplease.com/countries.html). Infoplease er et virtuelt familieleksikon, og kigger man nederst under hvert land får man yderligere muligheder for at klikke over i en mere uddybende leksikonartikel. Stofmængden svarer nogenlunde til leksikon.org.
Et andet kneb er at bruge de nationale udgaver af emnekataloger som fx Yahoo. På Yahoos forside kan man nederst klikke på disse. Alt efter ens sprogformåen kan man fx vælge: Frankrig, Italien, Norge, Spanien, England, Sverige, Tyskland, Australien, Indien (engelsksproget!) eller USA. Det er klart at en australsk emnekatalog altid vil indeholde bedre stof om Australien end en generel international.