onsdag den 30. april 2003

Flere weblogs om internetsøgning
Det er et stykke tid siden Internetsøgning sidst beskæftigede sig internetsteder hvor man kan holde sig ajour med søgemaskinerne. (Se fx 22. januar 2003 og kilderne). Nedenfor er fem weblogs som af og til bringer gode artikler og tips. De vil dog ikke indgå som faste kilder til Internetsøgning. Jeg lader dem bare stå med deres egen beskrivelse af sig selv. Så kan I selv gå på opdagelse.
www.websearchguide.ca/netblog.html Internet News. Articles and news about internet use. Wil cover search tools, current awareness tools, and general use.
www.microdocs-news.info/newsGoogle Online Magazine about exercising personal power in the Information Age.
huminf.uib.no/~jill/txt/researchblogs.html A weblog about weblogging
www.workingfaster.com/sitelines SiteLines is written by Rita Vine, a professional librarian and web search trainer. The purpose of SiteLines is to help web searchers stay up to date on key search tools and developments.
www.batesinfo.com/tip.html Tip of the month

lørdag den 26. april 2003

Ask Jeeves – et besøg værd!
Ask Jeeves var en af de første maskiner som forsøgte at lave “dagligsprogssøgninger”. Dvs. at man i stedet for at udtænke lange søgestrategier, finde de rigtige søgeord mm. blot skulle skrive et spørgsmål i søgelinjen. Så ville Ask Jeeves finde det ”rigtige” svar. Jeeves bliver afbildet som en smilende engelsk butler, klar til tjeneste! En fantastisk god ide – hvis altså den virkede. Og det gjorde den ikke. Især fordi Ask Jeeves kun forstod engelsk.
I slutningen af april i år fornyedes så Ask Jeeves. Den ansete søgemaskineanalytiker Chris Sherman (Search Engine Watch) er imponeret. Og der er nyt at komme efter.
En af nyskabelserne er at den nu påstår at kunne skelne mellem søgninger efter almindelige websider, nyheder og billeder. Søgefeltet reagerer på søgeord som image, picture, photos og news. I andre søgemaskiner foregår det ved at klikke på et ”faneblad” over søgefeltet. (Det kan man dog også i Ask Jeeves, her står menuerne bare under søgelinjen). Men Jeeves forstår kun engelsk!
Det går altså ikke med: et foto af Virgina Woolf. Næh, man skal skrive: photos of Virgina Woolf eller what does Virgina Woolf look like. Så kommer der billeder frem, over den sædvanlige ørkesløse resultatliste over websider. Billederne stammer fra databasen Picsearch, som rummer 200 millioner billeder.
Visse søgninger udløser automatisk nyhedssøgning. Søg fx på Saddam Hussein. Så kommer der nyheder frem sammen med webresultaterne (Read the latest news on Saddam Hussein).
Ask Jeeves forsøger med andre ord at ”gætte sig til” hvad det er du helst vil have. Det er godt til leksikonlignende spørgsmål (igen formuleret på engelsk), fx the capital of Denmark. Her fremkommer som det første en boks hvori svaret står: The capital of Denmark is Copenhagen. Hvis man spørger: The longest river in the world, bliver du efterfølgende spurgt om: Do you want to know: 1) what is the longest river in the world (hvis man klikker her, får man en oversigtstabel), eller 2) Where can I find information about the body of water (og så kan man vælge mellem en 20-30 forskellige floder, med Nilen øverst).
Man kommer altså også i ”dialog” med Jeeves.
Ask Jeeves påstår at den skelner mellem store og små bogstaver. Men det kunne jeg nu ikke få den til. Resultatet var det samme uanset jeg stavede med stort eller lille i mine tester.
Ask Jeeves er i samarbejde med søgemaskinen Teoma (se webloggen 4.2.2003), og det betyder at den giver underdelinger øverst til højre ved mange resultater. Teoma er en af mine favoritmaskiner: ikke så stor som Google eller Allthweb, men her gælder: hellere mindre, men bedre.
Også hos Jeeves er Googlificeringen slået igennem: Layouten er klart mere enkelt og alle reklamer, bannere m.m. er fjernet. Den er også blevet væsentlig hurtigere. Til gengæld slipper man ikke for de sponserede webresultater. De ligger i en boks over de øvrige resultater. Der er stavekontrol på engelske ord.
Alt i alt er Ask Jeeves blevet mere interessant. Den har i nogen grad forladt ideen med dagligsprogssøgninger, men har så til gengæld givet nogle muligheder for ”dialog” med søgemaskinen. Anbefalelsesværdigt til opslagsspørgsmål, á la Jeopardy og Hvem vil være millionær. Afgjort en facilitet som man kan savne i andre søgemaskiner.
En fyldig test på engelsk artikel findes på webloggen Microdocs-News. Kik under 23. april 2003.
En test af Ask Jeeves lavet af Veri Test kan se på: www.veritest.com/clients/reports/jeeves. Den er fra april 2002.

søndag den 20. april 2003

Alltheweb nu også med ordbog
I Allthewebs søgeresultater kan man nu få forklaret engelske søgeord. Søgemaskinen linker til dictionary.com. Man kan få en ordforklaring og få at vide hvordan et ord skal udtales. Den linker endvidere til Thesaurus, hvor man kan finde synonymer. Dette kan være en fordel hvis man er løbet tør for søgeord.
Linket til Dictionary fra Alltheweb fremkommer efter en søgning til højre for resultatangivelsen. (Linjen umiddelbart under ”fanebladene” for billedsøgning, nyhedssøgning osv.). Bemærk dog at hvis ordet ikke findes i Dictionary eller Thesaurus, er der ikke noget link. Det gælder fx danske ord.
Dictionary trækker på 11 forskellige ordbøger og opslagsværker: The American Heritage Dictionary of the English Language, Webster's Revised Unabridged Dictionary, WordNet, The Free On-line Dictionary of Computing, Jargon File, CIA World Factbook, Easton's 1897 Bible Dictionary, Hitchcock's Bible Names Dictionary, U.S. Gazetteer, Acronym Finder og On-line Medical Dictionary.
Et eksempel: En søgning i Alltheweb på kalashnikov giver 132.000 resultater. Hvis man klikker på ordforklaring ved siden af denne resultatopgørelse, får man at vide at det er ”Any of a series of assault rifles of Soviet design, especially the AK-47. After Mikhail TimofeevichKalashnikov (born 1919), Soviet arms engineer.” Thesaurussen har her ingen forslag til synonymer.
Det har den til gengæld hvis man søger på curriculum vitae. Her får man at vide at det kan betyde to ting: enten record eller resume. Under hver af disse får man 15-20 forskellige synonymer.
Som nævnt i webloggen den 25. marts har Google en lignende funktion på tegnebordet (Google Glossary). Den er dog ikke fuldt udbygget endnu.

mandag den 14. april 2003

Vejrudsigter og andet på Yahoo.
Yahoo har oprettet genveje fra søgefeltet til deres vejviserfaciliteter. Det gælder bykort, vejret, ordbog, nyheder og zip-koder (i USA). Fremgangsmåden er at bestemte ord fremkalder søgninger i vejviserne. Det drejer sig om weather, map, news og define (ordbogen). Det skal dog straks siges at kort, ordbog, nyheder og zipkoder fungerer bedst for USA.
Det som især virker godt også for andre end folk fra USA er vejret. Man skriver i Yahoos søgefelt weather og et bynavn, fx weather Copenhagen, eller København, Hillerød… Herefter får man så et billede af dagens vejr. Med yderligere et klik får man en femdøgnsudsigt. Man kan vælge mellem Fahrenheit og Celsius. Hvis et bynavn findes flere steder, får man mulighed for at vælge (fx Santiago – dem er der over 70 af). Det er bedst at bruge .com-versionen. På den danske Yahoo kommer vejret ikke frem med det samme, men som det første resultat i søgningen. Man vil naturligvis ikke kunne forvente vejrudsigten for småbyer som fx Broager.
For de øvrige faciliteter virker søgekoderne ikke særligt godt. Kortsøgningen foregår ved at skrive map og et geografisk navn. Det virker som sagt bedst for USA, hvor bykortene kommer frem næsten med det samme. For andre lande kan det bedre betale sig at søge i MSN’s kortsøgning (se weblog fra 23. januar 2003).
News søger naturligvis på nyheder.
Define er en slags ordbog. Denne weblog omtalte en lignende funktion i Google-Lab (se webloggen 25.3.2003). Den virker meget ufuldstændig. Jeg fik et godt opslag på reticulum, men danske ord – glem det!
Nyt er at Yahoo har samlet nogle lignende på samme side, se new.search.yahoo.com. Men det er tilsyneladende ikke det samme. Her kan man søge på Web, emnekatalog, nyheder, gule sider, billeder og kort. Denne side er imidlertid helt skruet ind på USA: Ved søgning under kort på Copenhagen får man to valgmuligheder: en i Louisiana, en anden i New York! Det samme gælder de gule sider.

onsdag den 9. april 2003

Daypop: Dagsaktuelle nyheder fra aviser og weblogs
Det er banal viden at nyhedsformidling i krige styres af parternes militær. Et alternativ er de store søgemaskiners nyhedssøgning. Men prøv også Daypop.
Daypop er en søgemaskine som søger i 17.000 aviser, online-magasiner og weblogs verden over (man kan søge i enten det ene eller det andet. Eller begge dele på en gang). Tidsmæssigt synes den at gå ca. 1 uge tilbage. Den påstår at gennemse disse websteder mindst en gang om dagen. (Det holder nu ikke altid stik. Daypop er et enmandsforehavende – Daniel Chan. Hvis han er optaget andetsteds, ja så er der intet at gøre!)
Daypop søger typisk i flygtige resultater: aktuelle nyheder fra avisernes internetsider, hvorfra de forsvinder dagen efter. Daypop opbevarer sådanne nyheder. Hvis linket i et fund (øverst) ikke virker, kan man klikke på Cached (nederst).
Udover flygtige avisnyheder er weblogs en oplagt mulighed. De fleste weblogs er private og uden bred interesse. Ligesom avisnyhederne er indholdet også flygtigt. Et fåtal af dem er imidlertid steder hvor man kan se hvad der rører sig på græsrodsniveau. Ofte i margenen af hvad nyhedsbureauer og aviser formidler. Og Daypop har på forhånd frasorteret de mere private.
Når man søger på Daypop skal man være opmærksom på søgesproget: Daypop sætter automatisk og mellem to eller flere søgeord. Brug + til at søge på stopord. for at udelukke bestemte ord. Frasesøgning med det velkendte ””. Eller med bindestreg, punktum, /, \ eller _ mellem ordene. Disse tegn er særligt velegnede hvis man også vil søge på datoer. Her skal man dog huske datoer har en mangfoldighed af variationsmuligheder. Fx kan 2. april 2003 optræde som: 02-04, 04-02, 04-03-02, 03-02-04 eller 02-03-04 – alle flertydige). I den avancerede søgning er der mulighed for at afgrænse til 16 sprog og 35 lande.
Hvad angår datoer skal man også være opmærksom på at denne ikke hentyder til dato og klokkeslæt for begivenheden, men tidspunktet for offentliggørelsen af nyheden.
Efter søgning kan resultaterne sorteres efter dato eller relevans. Desuden kan man afgrænse til kun at søge i overskrifter.
Hvis man er interesseret i at se hvad andre netsurfere aktuelt synes er spændende nyt, kan man prøve at kigge under ”Top 40”. Her er angivet hvilke weblogs og aviser som mange linker til. Dette er et godt sted at finde gode weblog som alternativ til de etablerede nyhedsbureauer. I det hele taget ligger i menuerne øverst en række målinger i weblogs, som ikke kan findes andre steder.
Husk at overveje søgeord. Ønsker du fx Saddam Husseins syn på krigen, så er søgeordene iraq war ikke godt. Prøv fx at søge på saeed (mohammed saeed al Sahhaf er ham den ”sjove” informationsminister).
Et alvorligt minus ved Daypop er at den af og til viser samme nyhed 10-20 gange – altså megen bladren.

fredag den 4. april 2003

Billedsøgning
(Dette indlæg er en opdateret version af indlægget fra august 2002).
De fleste almindelige søgemaskiner som Google, Alltheweb, Ixquick og Altavista kan søge efter billeder. De kan naturligvis ikke ”se” hvad der er på et billede, men søger efter billedfiler. Langt de fleste af dem ender på .gif eller .jpg, (.jpeg). Dernæst tjekker de teksten om filerne.
Eksempel: på Zoologisk Haves hjemmeside er der et billede af en giraf. Dette billede har adressen:
www.zoo.dk/site/06Zoo_nyheder/01Nyheder/01Pressemeddelelser/40Giraf/Giraf4.gif
Det er altså en .gif-fil. Når søgemaskinen har fundet denne fil i sin database kigger den på hvad der i øvrigt står i filnavnet. Der står ordet giraf to steder. Uheldigvis står der faktisk ”40giraf” og ”giraf4”, så hvis søgemaskinen ikke er i stand til at ignorere tallene finder den ikke dette billede.
Der er også andre faldgruber så gode billeder ikke er med i søgningen. Den berømte Hamburg Zoo har fx nogle særdeles gode billeder af elefanter. Et af dem har denne adresse:
www.zoohamburg.de/bilder/ele2.jpg
En billedsøgning ville finde denne på endelsen .jpg. Men da der ikke står ordet elefant (kun ”ele2”! ) finder man den ikke, hvis man søger med ”elefant” eller ”elephant”.
Til gengæld får man så et billede af en præmieoverrækkelse fra en Karnevalsfest i Gotha med nogle tyske mænd med narrehatte på – uden antydning af elefanter. Titlen på dette billede er nemlig:
www.geschwisterweisheit.de/images/elefant.jpg
Fordi det forestiller Geschwisterweisheit’ens overrækkelse af den lokale elefantorden…
Praksis viser at hvis man ikke er kræsen, så er søgemaskinernes billedsøgning ganske fortrinlige. De findes normalt i ”fanebladene” over søgefeltet i enkel søgning.
Til mere præcise søgninger er det dog sjældent nok. Så er man overladt til at bruge specielle billed-emnekataloger.
Her er et lille udvalg. Generelt gælder om disse at udvalget af billeder er meget, meget mindre end hvad man vil finde på søgemaskiner. Men til gengæld er kvaliteten af billederne meget bedre. Hvis man altså skulle være så heldig at finde hvad man søger efter.
tc2.freefoto.com Freefoto er et emnekatalog over fotografier. De 40.000 fotoer er opdelt i 50 emner med 1.600 underkategorier. Er gratis til ikke-kommercielt brug.
www.ncrtec.org/picture.htm The Amazing Picture Machine. Den er nu ikke er særlig “amazing”. Men der er en søgefunktion (som automatisk bøjer engelske søgeord). Indeholder ca. 30 emner, hvoraf adskillige udelukkende forholder sig til USA, men der er dog nogle mere anvendelige, fx arkitektur, dyr, planter, astronomi, rockmusikere og 2. verdenskrig.
www.aphids.com/susan/imres Er et emnekatalog over billeder som skal bruges på hjemmesider. Altså ikoner, billeder og grafik.
www.artcyclopedia.com Er et slaraffenland for kunstinteresserede. Her er 7.500 kunstnere, over 100.000 malerier, foruden kunstmuseer og en liste over –ismer. Alt sammen til at finde med blot en smule tålmodighed. Den historiske oversigt er desuden en pædagogisk indføring i kunsthistorie.
www.symbols.com er en særpræget symbol-søgemaskine med 2.500 vestlige symboler. Opdelt i 54 grupper og med 1.600 artikler om symbolernes betydning, historie m.v. Finder man et symbol som man ikke kender betydningen af, er det muligt at prøve at afkode det her. Kræver dog en del tålmod.
Husk at generelt gælder at billeder kan ikke uden videre kan bruges (copyright)
Søgestrategi for studerende, forskere, journalister o.a.
(Obs: Dette indlæg er fortrinsvis for ovennævnte internetsøgere!)
De første 10 år med internettet har søgemaskinerne kappedes om at blive størst, hurtigst, bedst. I al hastværket ”glemte” folkene bag søgemaskinerne at langt, langt hovedparten af de folk som søger på internettet har brug for ganske få, men centrale dokumenter. Set i det perspektiv er søgemaskinerne ikke nået særlig langt: Der er meget få søgninger hvor man kan sige at man lige præcis fik de 5-10 dokumenter som man havde brug for.
Det går op for flere og flere af søgemaskineselskaberne. Men endnu er der ikke fundet et columbusæg. Der er dog nogle som prøver på det. RDN (Ressource Discovery Network) er et af verdens bedste emnekataloger med dokumenter af højeste kvalitet udvalgt af fagfolk for de forskellige fagområder. Det er et ”over-emnekatalog” for 7 store kvalitetsemnekataloger som HUMBUL, SOSIG, PSI-gate m.fl., (altså emnekataloger for hhv. humanvidenskaberne, socialvidenskaberne og fysik).
Der er bare en afgørende hage ved det: Det er meget svært at finde rundt i. Kun søgere med god tid, lyst og tålmodighed vil give sig i kast med at finde relevant materiale her. Derfor har RDN nu lavet en vejledning til hvordan man griber en søgning an for et emneområde som man ikke kender noget til. Til hurtige opslag duer disse tutorials dog ikke! Det er til studerende, forskere, journalister eller andre som har behov for at sætte sig ind i et nyt fagområde, men som står mere eller mindre på bar bund: Virtual Training Suite kalder de det.
Emnekataloget for disse ”tutorials” er delt op i en række emneområder. Her indenfor har man mulighed for at få hjælp til søgning på fire punkter: På Tour kan man se hvilke kilder man vil kunne finde inden for fagområdet og hvordan man finder dem. Under Discover kan man se de almindeligste søgemaskiner (ikke så meget nyt her) og emnekataloger som beskæftiger sig med fagområdet. Review er den løftede pegefinger: Pas på hvad du finder – hvordan finder du ud af om det er pålideligt? Under flere af punkter er der en quiz så du kan teste om du har forstået teksten. Man klikker blot på Am I right? For at se om man har svaret rigtigt eller forkert og argumentation for det.
Bibliotekarer vil næppe have nogen glæde af disse værktøjer til eget brug. Men studerende fra de øverste gymnasieklasser og især studerende fra højere læreanstalter kan udmærket henvises til dem.

onsdag den 2. april 2003

Danmark som forskerland – internationalt.
ISI Essential Science Indicators analyserer løbende 8.500 tidsskrifter verden over. Bl.a. ser de på hvilke landes artikler der citeres mest. På den seneste opgørelse – som dækker perioden 1992-2002 – er Danmark på en 16. plads. Sverige ligger på en 11. plads.
At USA er altdominerende, viser sig ved den helt overlegne 1. plads på over 30 mio. citater. Det er mere end de næste 9 pladser (England, Tyskland, Japan, Frankrig, Canada, Italien, Holland, Schweiz og Australien). Tilsammen!
Kigger man nærmere på tallene vil man kunne se at det især er danske artikler om landbrug, rumforskning (!), ingeniørteknik, kemi, økologi og beslægtede emner der citeres mere end forventet. Lidt overraskende citeres danske socialvidenskabelige artikler langt under forventet, mens det måske ikke er så overraskende at artikler om økonomi, immunologi heller ikke citeres så ofte som forventet.
Men tabellerne afslører dog også en svaghed: Der udgives meget få ”papers” i Danmark. Så det er altså kun fordi disse i gennemsnit citeres desto flere gange at Danmark ligger så højt i den tabel. Kigger man på tabellen over hvor mange citater der er pr. ”paper”, så ligger Danmark på en 12. plads.