torsdag den 30. januar 2003

Gamle udgaver af internetsteder.
Mens biblioteker og arkiver opbevarer gamle udgaver af bøger og andet fysisk tilgængeligt materiale, ser det straks anderledes ud for internettets vedkommende. Meget af det som i tidens løb har eksisteret på internettet findes (eller fandtes) kun i virtuel form. Og med nedlæggelsen af disse internetsteder forsvinder de i bogstaveligste forstand ud i cyberspace. Tabt for evigt for omverdenen. Meget er sikkert også ligegyldigt: Meget af internettet består (og bestod) af sider hvor nogen lige skulle prøve hvordan det var at lave en hjemmeside. Men en mængde kvalitetssider kan have historisk interesse og værd at bevare for eftertiden. Problemet er velkendt. Alverdens nationalbiblioteker diskuterer hvordan de skal opfylde deres forpligtelse til at opbevare sådanne dokumenter.
Vi venter på en løsning på dette problem. Som både er af teknisk og udvælgelsesmæssig art. Mens vi venter er det muligt at se nogle af de hedengangne internetsider på:
www.archive.org
Siden er let at bruge. Man skriver simpelthen internetadressen på den side man ønsker at se i søgefeltet. Herefter kommer en lille kronologisk oversigt over hvilke versioner arkivet rummer. Og så er det bare med at vælge. Helt uden problemer går det dog ikke. Jeg kunne fx ikke få den ældste version af Danmarks Statistiks hjemmeside frem (på søgningen www.dst.dk).

fredag den 24. januar 2003

Ny søgemulighed i Alltheweb: RANK
Alltheweb har givet avancerede søgere en hidtil uset søgemulighed udover de almindelige boolske søgeoperatorer og, ikke og eller. Den hedder RANK. Det er en slags søgning-i-søgningen. Nemlig hvis man ønsker at sortere sine fund på en lidt anderledes måde.
Hvis man fx søger på praksislæring (et pædagogisk begreb) og har for mange fund, får man mulighed for at sortere disse fund på en anden måde. En teoretiker som har udviklet praksislæring er Jean lave, så det kunne måske være passende at få de fund hvor hun optræder først i listningen.
I praksis foregår det på denne måde: Brug Allthewebs avancerede søgebillede. Til venstre for søgefeltet foroven afklikker man Boolean expression. Dernæst skriver man i søgefeltet:
Praksislæring RANK ”jean lave”
(Her har jeg altså kombineret den nye operator RANK med en frasesøgning).
Er dette brugbart? Tja, Søger man bare på praksislæring får man i første omgang 307 fund. Det er for meget. Med RANK-søgningen får jeg de samme fund, men nu sorteret så fundene hvor navnet Jean Lave optræder står først.
Kunne jeg så ikke bare have brugt operatoren og (AND)? Nej, for med søgestrengen
Praksislæring AND ”jean lave”
får jeg kun 14 fund. Dvs. jeg har fået sorteret mange relevante fund om praksislæring fra fordi Jean Lave ikke er nævnt.
Søgeoperatoren er som sagt noget hidtil helt uset inden for søgeverdenen. Jeg har ikke selv nået at afprøve den i mit daglige arbejde. Men tror at der er mange muligheder i den for avancerede søgere. Under alle omstændigheder er det godt med flere muligheder for søgning. Så til lykke til Alltheweb. Bliv bare ved med den slags forbedringer!
En mere deltaljeret gennemgang af de øvrige ændringer i Alltheweb kan se i deres pressemeddelse fra 21. januar 2003

Tidligere indslag om Alltheweb, (overført fra 9. december 2002):
Nye søgemuligheder på Alltheweb.
En af de bedste søgemaskiner, Alltheweb, har fået nogle flere afgrænsningsmuligheder i dens avancerede søgebillede:
Søgning på regioner. Ca. halvvejs nede på siden under overskriften Limit to regions kan man nu søge under (dele af) kontinenter (ialt 10 muligheder). Søgningen er en søgning på domæner, så den er ikke helt stikfast. Med landekoderne er den selvfølgelig nogenlunde sikker, men ikke for dokumenttypedomæner som com, edu, gov og org. De blive brugt i USA, og derfor skal man altså afgrænse til North America. Også hvis man vil søge på europæiske selskaber som bruger topdomænet com!
Dokumentdybde. Man kan afgrænse hvortil i dokumentet man vil afgrænse søgningen. Der er 10 forskellige niveauer at vælge imellem. Er det anvendeligt? Måske. Der er vel ingen garanti for kvalitet hvis ens søgeord forekommer først i dokumentet. Men man har altså mulighed for at afskære fx litteraturhenvisninger nederst i et langt dokument.
Dokumentstørrelse. Man kan også vælge at dokumentet skal være over en vis størrelse i bytes. Dette er anvendeligt hvis man har brug for længere dokumenter. Her kan man selv udfylde antallet af bytes.
Søgning i personlige hjemmesider. Man kan afgrænse søgningen til disse. Det kan jeg ikke umiddelbart se hvad fx bibliotekarer og journalister skal bruge til. Jeg ville egentlig hellere udelukke sådanne sider. Men for privatinteresserede kan det måske friste.

Find bykort med gader og seværdigheder
Resourceshelf fra den 23. januar gør opmærksom på MSN’s nyeste kortsøgning. Kvaliteten af søgningerne står mål med de almindelige danske bykortsøgninger fx i Krak. Og så er den hurtig, enkel og leder hele tiden på ret vej.
Prøv først med afklikning i Adress in. Vælg land mellem: hele verden, Nordamerika (USA, Mexico og Canada) og Europa. (Den vælger tit bare Denmark som default.). Der er tilsyneladende ingen begrænsninger. Jeg fandt fx et kort med Storegade i Broager, såvel som Nørrebrogade i København. Hvis der er flere muligheder, får man nogle få valgmuligheder (lignende Rejseplanen). Tilsyneladende forstår den både engelsk og dansk. I hvert fald fandt jeg både Nørrebrogade ved at søge på Copenhagen, Kopenhagen og København.
Til tider skal man dog være lidt kreativ. Hvis du fx vil finde Granvænget i et sommerhusområde ved Klint, så går det ikke bare at skrive det i søgefelterne. Men hvis du under City skriver Sjælland, så viser den en liste med 40-50 forskellige steder i hele Danmark hvor Granvænget ligger. Feltet City skal altså udfyldes, selv om det udfyldes forkert! Fra den liste skal du så vælge rigtigt - i dette tilfælde Trundholm. Og så er du fremme.
Det er også muligt at søge efter seværdigheder, fx Thorvaldsens Museum, Amalienborg og Kronborg. Her skal du afklikke Place Name.
Når først kortet er fundet, har man mulighed for at zoome ind (til venstre for kortet), gøre kortet større eller mindre (øverst til venstre) og rokere til de fire verdenshjørner. Ligesom man kan printe ud eller sende til en ven (hvis man bruger Outlook).

onsdag den 22. januar 2003

Hold dig ajour med søgemaskinerne
Tidligere er omtalt Searchenginewatch og den svenske weblog internetbrus som steder til at holde sig ajour med internettet. Men der er også andre.
Internettet generelt.
www.db.dk er Danmarks Biblioteksskolens internetvejviser. Den har under Generelle vejvisere en meget omfattende oversigt over søgemaskiner, adresser, ordbøger, faglige in-dekser, aviser. Man kan abonnere på Månedens tips.
www.freepint.com / resourceshelf.freepint.com er en weblog for nørder. Lange, dybdeborende artikler om internettet, generelt på et højt, ofte forskeragtigt niveau. Nyhedsmail med udvalgte hovedoverskrifter.
www.marylaine.com Marylaine Block er bibliotekar og inter-net trainer i USA. Nyhedsbrevet NeatNew and Exlibris indeholder faglige links, en længere ofte debatpræget artikel eller interview om biblioteksforhold (dog meget præget af USA). Hun har skægge indfaldsvinkler for bibliotekarer.
blogbib.blogspot.com Denne side om webloggere har også en oversigt over en snes biblioteksrelevante weblogs.
Søgemaskiner specielt.
www.researchbuzz.com Har specialiseret sig i at følge med i internetsøgninger, dvs. søgemaskiner, nyt software osv. Be-regnet til bibliotekarer. Gratis ugentligt Newsletter som er meget omfattende med grundige artikler. Kan være lidt tungt at komme igennem, men god til at få forståelse for hvordan søgemaskiner fungerer. Redaktøren, Tara Calishain, elsker at finde fejl og mangler ved søgemaskinerne – hvilket er lærerigt!
www.searchengineshowdown.com Specialist i statistikker: sammenligninger, evalueringer og vurderinger af søgema-skinerne. Tit lidt specielle. Derudover nyheder som ikke kan fås i abonnement. Stedet skal opsøges. Kvaliteten noget svingende, men ind i mellem gode guldkorn.
Faglige links.
www.fng.dk Uregelmæssigt nyhedsbrev. Faglige links ud-valgt af bibliotekarer. Emnekatalogen behøver næppe yder-ligere præsentation. Den er stadig noget træg inden for mange områder
www.lii.org FNGs pendant i USA, faglige links udvalgt af bib-liotekarer. Præget af USA, også generelle links for engelsk-sprogede. Ofte er nyhedsbrevene tema-prægede, dvs. gen-nemstrejfer et område systematisk. Fint hvis temaet er re-levant. Librarians Index kan bruges til at finde oversigter over forskellige internetsteder at holde sig ajour. Dog mest i USA.

torsdag den 16. januar 2003

Hvor store er søgemaskinerne?
Greg Notess er en af de mest kendte søgemaskineanalytikere. Han driver siden Searchengineshowdown og har opdateret sine analyser af søgemaskinernes størrelse
www.searchengineshowdown.com/stats/size.shtml
En af de test som han laver er at se hvor mange hits der kommer på 25 almindelige søgeord i 8 forskellige søgemaskiner. Stikprøven omfatter alle type dokumenter, altså såvel html som pdf og andre filer.
Google har igen taget et komfortabelt forspring både kvantitativt og kvalitativt efter at Alltheweb i en periode havde overtaget førstepladsen. I rækkefølge ser det sådan ud: Google (3,0 mia), Alltheweb (2,1 mia), Altavista (1,7 mia), Wisenut (1,5 mia), Hotbot (1,1 mia), MSN search (1,0 mia), Teoma (1,0), NLResearch (0,7 mia) og Gigablast (0,3 mia).
Tallene i parentes viser antal indekserede dokumenter og stammer fra en anden side,
www.searchengineshowdown.com/stats/sizeest.shtml
Det er Greg Notess’ skøn over hvor mange dokumenter søgemaskinerne har indekseret.
Det er der for så vidt ikke noget nyt i. Mere værd at lægge mærke til er måske hvor stor væksten er. Her fremhæver Greg Notess Teoma for en voldsom vækst og den helt nye søgemaskine, Gigablast.

fredag den 10. januar 2003

Hurtig og kvalificeret metasøgning: ez2www
En kollega tippede om metasøgemaskinen ez2www. Et godt tip. Navnet lyder underligt, men prøv at udtale på engelsk: Easy to www, altså: let til WWW. Metasøgemaskiner har aldrig været min kop te, men efter et par måneders brug må jeg konstatere det samme som med Google: Den fungerer! Med alle de forbehold der nu engang er, fordi ingen søgemaskiner i dag er optimale.
Ez2www er både en ordsøgemaskine og et emnekatalog. Begge dele giver hurtigt pæne kvalitetssider. Den er nem at overskue. Først og fremmest vil jeg gerne anbefale den til søgninger inden for bestemte fag. Her dur de store søgemaskiner som Google og All the Web sjældent, de giver enten for mange urene resultater eller forstår slet ikke søgeordene.
Ez2www’s ordsøgemaskine søger som den eneste metasøgemaskine også i Google og All The Web, udover i Dmoz, Altavista, MSN, Yahoo, Giraffen, Jubii og Yahoo. Sorteringen synes at foregå efter nogenlunde samme metode som Google: gode resultater først. Fundene får procentsatser.
Til højre er mappe-opdeling (Cluster), men de er sjældent givtige.
Nederst kan man se hvor mange fund maskinen har fundet i hvilke søgemaskiner.
Emnekataloget har en lokal (dansk) version, men brug den generelle (under Categories), den danske er for tyndbenet. Kategorierne fungerer som i alle andre emnekataloger (fx Yahoo), med hovedoverskrifter og et skiftende antal undermenuer. Denne del af emnekataloget er lige så godt som så mange andre emnekataloger, Yahoo, Dmoz osv. Det nye er imidlertid under menuen ”Invisible Web”. Det er en lidt misvisende overskrift: Søgninger her foregår ikke kun i det usynlige web, men også i det synlige. Det skal snarere forstås som steder hvorfra man kan søge i det usynlige web. Bortset fra det, så det en ikke tidligere set facilitet som er meget anvendelig hvis man står og skal bruge en specialsøgemaskine. Og det bør man vænne sig til!
Tag fx under leksika: her kan du søge i 7 leksika på en gang, inkl. Encarta og Britannica. Eller under Law: Findlaw, under kristendom på Bibel-søgemaskiner osv. osv. Sådanne specialsøgemaskiner kan man også finde frem på andre måder, men ingen overgår ez2www i overskuelighed. Det kræver nemlig megen indsigt i et fag for at finde de rigtige søgemaskiner til dette fag. Her er overlades du ikke på herrens mark. Det kan så godt være at udvalget ikke er det bedste, men i hvert fald lader ez2www dig ikke i stikken!
Søgemaskinen har mange landeversioner, dvs. brugerfladen er på dansk med danske aktuelle nyheder. Hvis jeg skulle søge noget om Sverige, kunne jeg vælge den svenske.
Ez2www vinder ved nærmere eftersyn og brug. Hver gang jeg har besøgt siden har jeg fundet flere udmærkede funktioner ved den.
Et stort minus er at maskinen af og til er langsom, af og til sætter den helt ud. Desuden er der ingen avanceret søgning. Klikker man på avanceret søgning, kommer man blot over i et emnekatalog over specialiserede søgemaskiner.
(Se også artikel i Politiken, Lørdagsliv, 4. januar 2003, s. 16)

onsdag den 8. januar 2003

Pandia Post uddeler priser....
Pandia post er et internetsted om internetsøgning. De uddeler hvert år forskellige priser til søgemaskiner og steder om søgemaskiner. Et pejlemærke om hvilke internetsteder man som ivrig søger kan indskrænke sig til. Den samlede oversigt kan ses på:
pandia.com/post/016.html
Her er et kort resume over priserne. Nr. 1 angiver den bedste, nr. 2 angiver de(n) som er værd at lægge mærke til:
Allround-søgemaskiner: 1. Google, 2. Alltheweb og Altavista
Metasøgemaskiner: 1. ez2www, 2. Vivisimo
Om søgning: 1. Searchenginewatch, 2. Searchengineshowdown
Diskussionsfora: 1. Webmasterworld
Weblogs: 1. Resourceshelf (Gary Price), 2. Researchbuzz
Der er også andre priser. Men kik selv nærmere.

tirsdag den 7. januar 2003

Fra webloggens egen verden
Årsskiftet har været lidt nyhedsfattigt, så bær over med følgende lidt navlebeskuende indlæg.
Som administrator er det spændende at følge hvordan webloggen siden starten i august 2002 er blevet omtalt på internettet.
Den blev første gang omtalt i Månedens Tips fra Danmarks Biblioteksskole, september 2002 og røg senere i Biblioteksskolens katalog over vejvisere.
To weblogs omtalte den:
Københavns Hovedbiblioteks IT-funktions blogger den 20. august og Roskildes bib-log den 15. september.
Armarium har en liste over danske weblog. Hvor den hurtigt kom på.
Bibliotekarforbundets faggruppe for EDB og IT fandt den omkring 5. september 2002:
Google var den første søgemaskine som registrerede Månedens tips (omkring 1. september). Senere blev webloggen registreret som selvstændig side. Ved søgning på internetsøgning var den første gang nr. 7 ud af 706. Den 20. september 2002 var den nr. 3 ud af 720. Efter 1. oktober rykkede den op på en 1. plads ud af ca. 750 hits! Midt i november kom der også ranking på: 4/10, fra januar 2003: 5/10
Alltheweb. En uge hen i september har alltheweb fundet månedens tips: Omkring den 12. oktober optræder webloggen (nr. 1 ud af 926 fund på ”internetsøgning”):
MSN registrerede først adressen via bib-log, november også i Armarium:
Jubii udsendte et netnyt. Med billede og det hele…
Yahoo Fandt webloggen lidt før midten af september
Altavista Fandt frem til webloggen omkring den 20. september. Den rangerede som nr. 1 ud af 221 resultater på søgeordet ”internetsøgning”. Efter renoveringen af Altavista røg den imidlertid helt ud!
Politiken havde lørdag den 21.9.2002 i Lørdagsliv en artikel om Alltheweb. Overskriften lignede webloggens fra 28. august (Vær ikke enøjet: Brug andre søgemaskiner end Google). Søgetips: Google truet Vær ikke for enøjet begejstret for én bestemt søgemaskine. AllTheWeb er et godt alternativ.
Hotbot Fandt en henvisning på Armarium omkring 1. november.
palnatoke.blogspot.com, omtalte webloggen 21. oktober 2002
Ballerup Bibliotek omtalte webloggen i novemberudgaven af Nye links under Reference-bookmarks:
Nogle lidt sære steder har fundet frem til webloggen: ilectric info portal (et emnekatalog og metasøgemaskine fra September 2000). Brint Institute (Et Global Knowledge Network for Business, Information, technology, and knowledge Managers, Professinals and Entrepreneuers), Cipotes Group Inc, (et New York-firma fra november 1998 har en internetportal “created to unite the Salvadorian community” og er specielt rettet til spansk-talende). Jim World
Det Sønderjyske Landsbibliotek saksede efter 14 dage et helt indlæg fra webloggen (Love, cirkulærer m.m. på 3 minutter):
På denne internetadresse - http://erikhoy.blogspot.com er der ofte gode tips. Bl. a. dette fra 11.11.2002. (Her følger så hele webloggens indslag uforkortet). Vita H. Beeck, 26.11.2002.
Udover det navlebeskuende er der dog ting at lære: man kan se hvordan internetsider bliver kendt gennem andres henvisninger. Tak for det!
Og så et lille søgetip: Hvis man gerne vil finde ud af hvilke sider som linker til en bestemt side, så gør følgende i All The Web's simple søgning: Skriv link:erikhoy.blogspot.com for at finde ud af hvor mange der linker til denne weblog.

torsdag den 2. januar 2003

Eller-kommandoen.
Den almindeligst brugte søgesprogskommando er og (se 8.12.2002). Men i følgende tilfælde kan det være praktisk med eller:
- Hvis man er usikker på stavemåden, fx: Søndre Stand eller Sønder Strand eller Sønderstrand
- Forkortelser, fx DCHR eller Danish Center for Human Rights
- Entals- eller flertalsformer, fx elefant eller elefanter.
I sådanne tilfælde er det praktisk at kunne få søgt på alle ordene på en gang i stedet for at lave 2 eller 3 søgninger. Eller-kommandoen er som de to andre søgesprogskommandoer og og ikke ikke standardiseret. Man skal derfor vide hvordan man angiver eller i de forskellige søgemaskiner.
Følgende gælder i de største søgemaskiner:
Google: Skriv OR, engelsk eller med store bogstaver, fx: ”søndre strand” OR ”sønder strand” OR sønderstrand.
Alltheweb: Undgå den simple søgning og brug i stedet den avancerede. Afkryds ”should include” i ”Word filters” og skriv et søgeord i hvert af de tre felter.
Eller-søgninger har den store bagdel at de ofte giver mange resultater. Det kan derfor godt betale sig at søge i felter (se 4.11.2002), især titel-feltet er velegnet. I Google ville søgestrengen så se således ud:
intitle:”søndre strand” OR intitle:”sønder strand” OR intitle:sønderstrand
(Jeg har med vilje lavet denne lidt komplicerede søgestreng for at vise hvordan man kan kombinere frasesøgning, søgesprogskammandoer og feltsøgning).
I Alltheweb er det bedste igen at bruge det avancerede søgebillede. Her skal man så huske også at indstille Word Filters på In the title (i alle tre).