Internetsøgning: december 2004

fredag den 31. december 2004

Søgemaskiner guider til hjælp til tsunami-ofre.
Søgemaskinerne har lavet link-sider, hvor du kan finde organisationer som hjælper ofrene for katastrofen rundt om Det Indiske Hav:
www.jubii.dk/ Danske Jubii. Se under Aktuelt på Jubii, Støt ofrene for flodbølgen
sp.ask.com/docs/announcements/tsunami_relief.htm l Ask Jeeves
www.google.com/tsunami_relief.html Google
www.yahoo.com/ Yahoo

onsdag den 29. december 2004

Du er i gang med at læse Internetsøgnings sidste artikel i 2004. Og jeg ønsker dig godt nytår! Jeg håber du hænger på i 2005. Nytårsløjer er temaet i den sidste artikel:

Rocklopedia Fakebandica: Leksikon over ikke-eksisterende bands.

Det lyder som en selvmodsigelse. Meningen er god nok: Det er et leksikon over bands som har optrådt i forskellige film, men som aldrig har eksisteret i virkeligheden.
Husker du fx Muppet Show (tilbage i 1976)? Her optrådte bl.a. Amazing Marvin Suggs and his Muppaphone. Rocklopedia oplyser ikke alene om hvor det stammer fra, hvornår osv. Det fortæller også at det var en parodi på en anden kendt komedieserie, Monty Pythons Flying Cirkus. Her var navnet Arthur Ewing And his Musical Mice. (Det er så vidt jeg husker den hvor en sindssyg musiker hamrer løs på nogle stakkels mus). Ikke lige noget for Dyrenes Beskyttelse.
Bedre kendt er måske Blues Brothers, fra filmen af samme navn. Eller The Splitting Headaches og The Unit Shredders fra tv-serien Roseanne. Yngre læsere vil genkende Timmy! And the Lords of the Underworld og The Raging Pussies fra kultserien South Park. Og at leksikaet ikke bare er ment for sjove fremgår af at der er henvisninger til artikler om serierne eller programmerne i Internet Movie Database.
Artiklerne er forholdvis korte. Men med de mange henvisninger til andre artikler skulle der være rigeligt til lidt underholdning i mellemdagene - eller oven på tømmermændene.
Meget af det stammer fra film og serier vist i USA. Og aldrig nogensinde kendt her i Danmark, endsige Europa. Og omvendt er mange europæiske serier ikke er med i værket.
Endnu engang: Godt nytår!
Link
www.fakebands.com/ Rocklopedia Fakebandica
www.imdb.com Internet Movie Database
Tak til
www.researchbuzz.org/archives/002228.shtml Tara Calishain: Research Buzz

tirsdag den 28. december 2004

Wikipedia - nyt, omdiskuteret leksikonkoncept.

Åbent leksikon kontrolleret af brugerne selv?
Wikipedia er et onlineleksikon som laves af frivillige. Enhver kan skrive en artikel og få den publiceret. Men også risikere at andre retter i den. Ideen bag Wikipedia er nemlig at den skal blive bedre på en billedligt talt evolutionistisk, darwinistisk måde: De med den bedst opdaterede eller mere korrekt viden skal gøre Wikipedia stadig bedre. I hvert fald i teorien. (Wikiwiki er hawaii for hurtig).
Og farer lurer her som alle andre steder på internettet. Den åbenlyse vandalisme er dog her et mindre problem. Den bliver hurtigt opdaget. Og ødelagte artikler kan rekonstrueres. Et større problem er den skjulte. Det kan være små, men betydelige fordrejninger i artiklerne. Endelig er der alle de skjulte dagsordener, fra fx politiske eller religiøse mennesker.
Men brugerne bliver ikke ladt i stikken. Vi kan undersøge hvem der har lavet artiklerne, hvem der har rettet og hvornår. Ved hver artikel kan du klikke på fanebladet historik. Her kan du i omvendt kronologisk rækkefølge følge hvordan artiklen har udviklet sig siden den første gang optrådte i Wikipedia. Du kan dernæst checke forfatterne. Desværre får de lov til at præsentere sig selv. Men der findes dog "overkontrollører", i form af administratorer som forsøger at luge useriøse skribenter væk.
Der er også et debatforum hvor artikelskriverne kan strides, i sidste ende måske blive nødt til at stemme om hvem der har "ret". De forfattere som jeg efterprøvede virkede seriøse i forhold til Wikipedia-konceptet.
Jo større, jo bedre og mere omfattende.
Et er at Wikipedia bevisligt har mobiliseret en masse entusiastiske artikelskribenter. Et andet om det så også er troværdige og brugbare oplysninger de kan levere.
Det er mit indtryk at jo større sprogområdet er, desto bedre er Wikipedia. Det hænger vel sammen med at for de store sprogområder gælder at der er mange brugere og læsere. Derfor er det ganske enkelt ikke muligt for useriøse skribenter at have noget stående uimodsagt i længere tid. Det modsatte gælder i mindre sprogområder, også til dels den danske udgave, se fx nedenstående eksempler..
I forhold til traditionelle leksika har Wikipedia mange flere - og mange flere utraditionelle - opslagsord med. Her vil du finde opslagsord som du aldrig ville kunne finde i fx Den Store Danske Encyklopædi. Til gengæld er det jo mest personlige indlæg. Og her er det igen personens kompetence på området som er afgørende. Så igen: check hvem der har forfattet artiklen!
Generelt bør man dog ikke undervurdere at mange mennesker i dag ved meget mere om et bestemt emne og kender mange flere aspekter af livet end anerkendte videnskabsfolk og højtuddannede.
Den dårlige side af det er at det er tilfældigt hvilke oplysninger der kommer med. Og at artiklerne får en så svingende karakter. (Dette ser nogle wikipedister dog ofte som et plus).
Det værste der kan ske for uerfarne internetbrugere er at de forveksler det med et traditionelt leksikon.
Det er lidt uretfærdigt kun at vurdere Wikipedia ud fra sin danske udgave. Den engelske er væsentlig bedre. Men for traditionelle leksikonelskere stadig en katastrofe.
Verdens måske største onlineleksikon
Wikipedias stærke side er at den har så mange henvisninger (selv om mange af dem ikke virker), at en opmærksomme bruger hurtigt vil kunne danne sig et overblik via disse. Altså sammensætte et puslespil eller kludetæppe til mere information. Ikke bare i Wikipedia, men andre steder fra.
At artiklerne er partiske, gør vel ikke så meget i det omfang artiklen er så ærlig at fremlægge sine præmisser. Hvad der ofte ikke er muligt i traditionelle leksika. Her er tonen ofte er præget af en selvudråbt videnskabelig autoritet.
Omfangsmæssigt er Wikipedia imponerende. Op mod 30.000 artikelskrivere har levet omkring 1,1 mio. artikler på 109 forskellige sprog. Hvoraf dog kun de færreste er ret store. Hovedparten af artiklerne er i den engelske (430.000) fulgt af den tyske (180.000). Den danske kun omkring 21.500, men alligevel blandt de største. Sverige er større med 55.000. Stofmængden er imponerende: 30% af de engelske artikler fylder mere end en almindelig A4-side.
Til sammenligning har Encyclopaedia Britannica 85.000 artikler og 55 mio. ord (over 140 mio. ord i Wikipedias engelske udgave).
Vurdér Wikipedia på dets egne præmisser.
Et trykt leksikon står i de flestes forestilling som et autoritativt sted: det sted hvor diskussioner endegyldigt kan afgøres af fagligt forsvarlige og dybt seriøse oplysninger. Sådanne er der altid brug for. Selv om der er forskel på Den Store Danske Encyklopædi og Lademanns Leksikon (blandt "venner" nedladende kaldet "Farvelademanns Leksikon").
Wikipedia provokerer traditionelt tænkende leksikon-elskere. Vurderet ud fra traditionelle leksikon kriterier er Wikipedia katastrofalt dårligt: usikre kilder, ucheckede oplysninger osv. Men det er uretfærdigt at vurdere Wikipedia ud fra sådanne normer. Internettet har ændret verden. Viden har aldrig været noget absolut. Og har forskellig værdi og troværdighed. Som sådan er begge typer af leksika to sider af hverdagen i dag. Med hver deres forskellige værdi.
At Wikipedia kan forveksles med en national encyklopædi, kan måske tilskrives fraværet af et frit onlineleksikon af den traditionelle type. De danske koster penge (Gyldendal og Lademann). Det ville være korrekt at bruge de to typer komplementært.
Og så er der det tekniske: som det fremgår af nedenstående eksempler er der stadig meget at rette op på med krydshenvisninger til de forskellige sprogudgaver, med "døde" links og meget andet. Men det tilgiver inkarnerede Wikipedister sikkert nok værket….
Eksempler
Nogle eksempler fra den danske Wikipedia kan illustrere nogle af pointerne:
"Jehovas Vidner er en kristen trosretning som blev grundlagt i 1870'erne af Charles Taze Russell. I Danmark blev Jehovas Vidner oprettet i 1900. Jehovas Vidner udmærker sig ved at tro på den suveræne Gud, Jehova, og hans søn, Jesus Kristus"
Her har vi en ultrakort artikel uden ret megen information. Og med nogle dunkle vurderinger (udmærker sig og suveræne Gud). Men artiklen viser hvordan krydshenvisnigerne fungerer. Mange ord er klikbare. Dvs. det skal være muligt at linke fra artiklen til andre steder. Men artiklen viser også svagheden: Flere link fører ikke til rigtige artikler, fx det om Charles Taze Russel. Og hvad måske er værre: der linkes ikke til den ellers meget omfattende artikel om ham i den engelske Wikipedia.
Meget korte artikler er artiklen om TV2 et eksempel på:
"TV-2 er et århusiansk poporkester, som gerne rejser ud og optræder rundt i landet under slogan'et Danmarks kedeligste orkester. Med pladedebut tilbage i 1981 er de nu også et af Danmarks ældste og stadigt eksisterende. Medlemmerne i bandet er: Steffen Brandt (sang, guitar, keyboard), George Olesen (bas), Hans Erik Lerchenfeld (guitar), Sven Gaul (trommer). Ikke mindst takket være tekster med vid, bid og en gennemført lun ironisk undertone har bandet opnået stor og stabil berømmelse."
Herefter følger en kronologisk lister over bandets udgivelser. Samt to henvisninger: til bandets hjemmeside og en fanside. Der står imidlertid ikke noget om at det startede under navnet Taurus. Artiklen er ikke ajourført (de har nu en kvindelig rytmeguitarist og sanger). Og den faste ingrediens The Aarhus Horns er ikke nævnt.
Det modsatte: detailrigdom ses i opslaget om weblog: Først en ordforklaring. Herefter broderer artiklen på en lang gennemgang af holdninger for og imod fænomenet. (Hvis du forstår engelsk, er der en meget lang og grundig gennemgang).
Aktualitet afspejles i artiklen om Yassir Arafat. Her er hans død og begravelse kommet med. Af øvrige oplysninger er godt nok nævnt hans navn og civile karriere, bl.a. hans børn, men hans kone nævnes fx ikke. Og det politiske er meget nedtonet.
Forskellen på den engelske og danske udgave er slående i eksemplet Søren Kierkegaard. Selv om Kierkegaard er dansk, har den engelske Wikipedia nok mere brugbart med.
Læs mere
bibliotek.kk.dk/uddannelse/brugsanvisning/spec/leksika Oversigt over leksika
da.wikipedia.org/wiki/Forside Den danske udgave af Wikipedia
en.wikipedia.org/wiki/Main_Page Den engelske udgave af Wikipedia

torsdag den 23. december 2004

Gratis live-musik: Internet Archive.
Det er tid at ønske læserne god jul. Og det sker med et indslag som måske kan fordrive kedsomme stunder i juleferien med noget afslappende og kreativt: musik. Internetsøgning holder en pause. Bliv dog hængende også mellem jul og nytår. Der er mere på vej....
Internet Archive er mest kendt for at være internettets “hukommelse”: Det opbevarer ældre udgaver af en betragtelig del af internettets sider gennem tiderne. Disse bliver jo som bekendt ændret hele tiden. På Internet Archive kan du se hvordan de engang så ud. En vigtig kilde til internettets historie.
Men arkivet indeholder ikke kun tekst. Det har også en stor samling af live-koncerter. Lad det være sagt med det samme at det ikke er de meste kendte musikgrupper. Til gengæld behøver du ikke at frygte for at piratgruppen eller politiet stormer din lejlighed og anholder dig for at lytte til ulovlige filer. Det er ganske gratis. Og gruppernes bidrag er alle ikke-kommercielle. Internet Archive har indhentet tilladelse til at viderebringe filerne. Og oplyser også inden du kan nå at lytte til dem, hvilke ophavsrettigheder du skal respektere.
Arkivet giver dig mulighed for at browse i en temmelig lang liste over grupper. Det er mest engelsksprogede grupper. Der er dog enkelte store navne imellem, fx Greatful Dead. Nogle er til at downloade. Andre kan lyttes som mediestrøm. Hvis du er interesseret i at læse mere om grupperne, kan du prøve at finde dem All Music Guide.
Det er ikke så lige til at finde frem til afspilningen. Men hvis du ellers er nogenlunde kendt med håndtering af multimediefiler, skulle det kunne lade sig gøre. Til gengæld støder du på en del oplysning undervejs. Om hvordan ophavsretten er, ofte ledsaget af uddrag af de breve som grupperne har sendt og hvori de giver lov til at afspille koncerterne. Derudover er der mange oplysninger om hvor koncerten er optaget osv. Med link til spillesteder. Det er kort sagt ganske godt bibliografi-arbejde!
Jeg fandt en udmærket og meget lang koncert med et for mig ukendt orkester, Mogwai. Den blev afspillet i Windows Media Player (som vist de fleste computere har adgang til). Og jeg ville uden tøven selv have sat på derhjemme, hvis det havde været en cd og jeg havde behov for lidt afslapning på en trist vinterdag. Lydkvaliteten var god, musikken havde den specielle live-stemning. Hvilket vel også skyldes at optageteknikken efterhånden er så god at den er på højde med og overgår de gamle liveindspilninger fra 1970’erne.
Link
www.archive.org/audio/ Internet Archives audiosamling
searchenginewatch.com/searchday/article.php/3450101 Artikel om audiosamlingen.
www.allmusic.com All Music Guide.

onsdag den 22. december 2004

BBC om elektronisk adgang til videnskabelige værker.
Richard Black fra BBC radio 4 havde torsdag den 21. december en udsendelse om vanskelighederne med at komme til forskeres værker. Den hedder ”Publish or be damned”.
Udsendelsen fastslår fra starten at dette ikke er et nyt problem. Selv Kopernikus havde overvejelser om at offentliggøre sine overvejelser. Men gjorde det alligevel. Heldigvis, fordi den dermed var med til at ændre hele vores verdensbillede.
Dette er udgangspunktet for BBC’s udsendelse, som understreger vigtigheden i at videnskabsfolk offentliggør deres resultater.
Universitetsbibliotekerne er den største udbreder af værker. Men de er begrænset af udbyderne i form af dyre licenser (fra tidsskrifternes side). Bibliotekerne har simpelt hen ikke råd til at holde alle de elektroniske tidsskrifter.
Nogle tidsskrifter har fået en slags monopol på at være tidsskriftet inden for et bestemt videnskabsområde. Hvis forskerne ikke publicerer deres materialer her, anses de ikke for at være videnskabeligt holdbare. Dermed har de videnskabelige tidsskrifter faktisk tiltusket sig den samme form for begrænsninger som kirken i sin tid satte for Kopernikus.
Men lige som Kopernikus brød datidens kirkelige begrænsninger, er der også nutidige forskere, som nu prøver at bryde de anerkendte tidsskrifters monopollignende status. Det kan fx være i form af at forskerne kræver ret til at offentliggøre deres værker på egne hjemmesider når først de har været offentliggjort i et tidsskrift. Der er også eksempler på databaser som ganske gratis stiller materialerne til rådighed for offentligheden. Udsendelsen nævner Biomed.
Udsendelsen beskriver den ideologiske kamp mellem betaling eller ikke betaling for at offentliggøre artikler og forskermaterialer. Begge parter bliver interviewet. Også de som stadig forsvarer at der skal betaling til for at komme til forskermaterialerne.
Udsendelsen giver et godt indtryk af den indespiste kultur som hindrer at forskningsmateriale kommer bredere ud. Det kan undre at forskerne selv ikke bare etablerer åbne fora hvorfra offentligheden kan få adgang til deres arbejder. Intet hindrer dem i det, det kræver blot et minimalt kendskab til webpublicering. Er det personlige ambitioner? Klamrer de sig til "deres" fortjenester? Føler de sig som ofre for gridske tidsskriftredaktioner? Svaret blæser i vinden.
Herhjemme har vi en lignende situation: det er stort set umuligt at finde forskningsmateriale online direkte. Forhåbentligt er danske forskere ikke som Tor Nørretranders. Han beskrev i en artikel i Politiken søndag den 28. november (”Folkets selvbetjening”) videnskabsfolk og ”forskersamfundets kollektive kløgt” som ofre for et enevælde indført af autoriteter som bibliotekarer, boghandlere, professorer, overlæger, videnskabsskribenter.
Som det fremgår af BBC’s udsendelse og af denne weblog ”Forskning på internettet – hvad venter vi på” så er danske videnskabsfolk ikke rigtigt kommet ud af hullerne endnu. Alle muligheder ligger åbne for dem. Men selv om offentligheden aflønner dem, kan samme offentlighed ikke få adgang til deres arbejde.
Det er da forhåbentligt ikke pga. pengene. For hvorfor skulle forskere aflønnes to gange? Dels for at forske, dels for at offentliggøre deres resultater? Det gælder ikke for andre offentligt ansatte. Lærere får løn. Men de får jo ikke løn en gang til for at undervise.
Du kan også læse mere om direkte adgang (open access) på hjemmesiden Open Access.
Udsendelsen kan høres (fx på Real Player):
www.bbc.co.uk/radio4/progs/listenagain.shtm l Kig under programmet Publish or be Damned.
www.biomedcentral.com/openaccess/ Open Access

tirsdag den 21. december 2004

Flere online-biblioteksmaterialer på vej.
Ifølge en artikel i Information World Review skulle 10 internationale biblioteker og 2 større biblioteker i USA have indgået en aftale om at samle deres digitaliserede bøger i Internet Archive. Og stille det gratis til rådighed for alle. Det drejer sig bl.a. om tre canadiske universitetsbiblioteker (Toronto, Ottawa og McMaster), Library of Congress og Mellon University Library i USA, European Archives og Bibliotheca Alexandrina.
Internet Archive (tidligere Wayback Machine) er i forvejen et af de største arkiver for gamle websider. (Og jeg havde en artikel undervejs om hvordan det også opbevarer gamle live-koncerter. Men mere om det i et senere indslag….).
IWR citerer en meddelelse fra Internet Archive hvori der står at der er over 1 mio bøger på vej over i arkivet. De 50.000 første vil være tilgængelige i første kvartal af 2005. Jeg har dog ikke kunnet finde denne meddelelse.
Begivenheder på internettet har det med at falde over hinanden: Google indgik en lignende aftale med 4 universitetsbiblioteker og New York Public Library for ganske nylig (se tidligere på webloggen). Men i modsætning til Google er Internet Archive's projekt altså internationalt. Og der er altså heller ikke tale om at der skal indskannes noget analogt, bogligt materiale. Der er udelukkende tale om i forvejen digitaliserede materialer.
Link
www.iwr.co.uk/IWR/1160176 Artikel fra Information world review
www.archive.org Internet Archives

Når bibliotek ikke er et bibliotek.
Borgere i Greve kan få sig en slem forskrækkelse hvis de intetanende klikker sig ind på det de måske tror er Greve Biblioteks hjemmeside. Siden har nemlig domænenavnet grevebib, ikke grevebibliotek. Dette sidste var nemlig allerede optaget. Biblioteket kører nu retssag for at få erhvervet retten til domænet grevebibliotek. Læren fra Greve må være: Hvis andre biblioteker vil undgå noget lignende, må de altså i tide sikre sig ”alternative” domænenavne. Uanset om de bruger det eller ej.
Fænomenet er velkendt i den ubarmhjertige jungle som internettet også er. De fleste har vist stødt på det i mere uskyldig form for år tilbage da google.dk ikke havde noget med søgemaskinen Google at gøre. Der er mange mennesker som spekulerer i internetadresser og opkøber bestemte navne. Som de så håber på at store firmaer vil betale store summer for at overtage.
Mere grovkornet er domænet whitehouse. George Bush’ side har naturligt nok topdomænet .gov. Mens .org og .net er satiriske sider (alt efter hvilken humor du nu foretrækker – se fx i Administration i .org-adressen). Og .com minder lidt om grevebibliotek. Af samme grund praler den med at være besøgt af 85 mio mennesker siden 1997. Men har dog nu fået en advarsel på adressen om at den indeholder pornografisk materiale. Denne kategori vil nok ikke tjene penge, men mere udnytte at de som man normalt forbinder med navnet, ikke har fået købt alle domænenavne.
Så vidt det fortælles fra Greve Bibliotek er motiverne bag deres ”konkurrent” ingen af delene. Der er selvsagt ikke penge i at udnytte biblioteker på denne måde. Og der er vist ingen som føler sympati overfor at nogen prøver at latterliggøre bibliotekerne. Man kunne måske gætte på at motivet var opmærksomhed? Uanset hvad, så gælder (internet)jungleloven åbenbart også i Danmark. Og bibliotekerne har så at indrette deres praksis efter det.
Igen: Køb domænenavne som I kunne forestille jer internetsøgere vil søge efter jer på. Ellers gør andre det måske – før jer. Og til andre formål.
Link
www.grevebib.dk Den rigtige side til Greve Bibliotek. (For ikke at hæve den anden sides pagerank er der ikke linket til den her. Gæt selv adressen).

lørdag den 18. december 2004

Blinkx: Omsætter tale til tekst.
Det mest interessante ved Blinkx er ikke at den kan søge på multimedier. Det er der så mange andre søgemaskiner der kan. Og faktisk er dens database endnu ret indskrænket.
Det spændende er at den kan omsætte lyd, eller tale, til tekst. Og det ser ud til at fungere!
Som nævnt nedenfor i indslaget om Yahoo Video Search, så er multimediernes problem at de er svære at finde. De skal findes via søgeord/tekst. Og billeder og lyd er jo netop ikke tekst! Derfor er det også lidt af et tigerspring frem, hvis det virkelig nu skulle være muligt at omsætte tale til tekst. Og så lynhurtigt, således som det sker i Blinkx.
Som nævnt er Blinkx ikke særlig stor. Den indekserer 15 forskellige nyhedsstationer, fx Fox, CNN, BBC og Bloomberg, samt en håndfuld radiostationer (især BBC). Mig bekendt er netop BBC-journalister kendt for deres formfuldendte engelsk, så det er måske derfor netop de er valgt. Men venstremenuen lover andet, under Coming Soon: Biography, History Channel, National Geographic. Og fremtidens muligheder ligger i alle slags medier, også satellit, kabeltv og mediestrømme.
Ifølge den meget omfattende præsentation af Blinkx skulle den være i stand til ikke bare at genkende ord, men også hvem der taler og på hvilket sprog. Dansk er nok ikke med. Men foreløbig er det jo også kun engelsktalende tv- og radiostationer med. I præsentationen kan du også læse om hvordan selve det tekniske fungerer. Her vil jeg koncentrere mig om selv søgningerne.
Blinkx indekserer altså video og audio. Søgefeltet er meget stort, og det opfordrer til at bruge mange ord. Jeg afprøvede søgeordet Copenhagen, og der kom en pæn portion fund frem. Det er nu i første omfang ikke særligt lange klip man får. Omkring 30 sekunder. Det fleste af dem handlede om Tyrkiet, fordi speakerne nævnte begrebet Copenhagen Criteria om Tyrkiets forhold til EU. Dette viser i det mindste at omsætning fra tale til tekst rent faktisk fungerer!
Men hermed hører begejstringen dog op. Flere af linkene virkede slet ikke. Fx viser det sig at alle fundene fra Sky ikke kan ses uden for USA. Det var svært at bruge raffinere søgningen (Refine Search). Og det var meningsløst at bruge valget mellem at sortere efter relevans eller dato. Der var simpelthen for få fund. Muligvis ville man kunne finde hele videoen ved at anvende adressen i fundoversigten. Denne er i øvrigt noget skrabet. Men teksten var hvad speakerne sagde. Så den er go' nok!
Jeg nåede ikke til at bruge de obligatoriske personaliseringer. Men det skulle være muligt at lave sit eget video- eller audioarkiv ved at lave automatiske søgninger i Blinkx. Herefter ville eventuelle nye klip automatisk blive downloaded til mapper. Som man så ved lejlighed kunne checke. Dette kræver dog nok, som Blinkx reklamer antyder, at man har bredbånd. Multimediefiler er meget tunge og belaster nettet meget.
Disse sidste bemærkninger skal dog ikke fjerne min begejstring for at vi nu vist nok for første gang har set antydningen af en søgemaskine som kan omsætte tale og lyd til tekst. Det giver helt uanede muligheder for fremtidens søgninger!
Tilføjelse, søndag morgen.
En læser har bemærket at Blinkx absolut ikke er fejlfri: Når hun søger på Amish, får hun utilfredsstillende resultater, bl.a. på Army (!) samt en verjudsigt fra BBC. Så: desværre. Det var næsten også for godt til at være sandt.
Nu er det jo ikke min opgave at forsvare Blinkx, men måske er det derfor at de anbefaler at skrive mindst tre ord i søgefeltet. Dette ville muligvis gøre søgningen mere præcis. Men omvendt: når jeg prøver at gøre det, er resultatet som regel "Sorry, no results". En søgning på amish society gør heller ikke søgningen mere præcis. Man kan håbe på at når databasen bliver tilstrækkelig stor, vil den begynde at give resultater når man skriver flere end 3 ord.
Forventningerne til omsætning tale-tekst må dog skrues betydeligt ned (Suk). Tak for kommentaren. (Jeg har ikke kunnet få Blogger til at vise kommentarer på andre måder end på enkeltposterne, så hvis du vil se kommentarerne, skal du klikke på de enkelte indslag, fx Blinx)
Link:
www.blinkx.tv

fredag den 17. december 2004

Flere synspunkter om Google og digitalisering af biblioteker
Det skorter ikke på folk som har en holdning til Googles samarbejde med universitetsbiblioteker i USA om digitalisering. Så det kan være svært at skille skidt fra kanel. Jeg har nedenfor prøvet at liste nogle af de mest interessante synspunkter fra centrale personer.
www.npr.org/templates/story/story.php?storyId=4227895 Lyt til et ca. 4 minutters interview med ALA’s præsident, Carol Brey –Casiano. Hun siger bl.a. at projekter er ”fascinating”, exciting”, men dog ikke svar på alle informationsbehov. Bl.a. er der mange tekniske problemer. Hun ser det som en stor hjælp både til bibliotekerne og til biblioteksbrugerne. (For at kunne lytte, skal du have Real Player eller Windows Media Player).
www.researchbuzz.org/archives/002219.shtml#more Tara Calishain har samlet link og resumeer af pressemeddelelserne fra de involverede parter.
www.berlingske.dk/kultur/artikel:aid=516612/ Annette Skov (som i dagens anledning i Berlingske Tidende er udråbt til ”ekspert i søgning på internettet”) ser ikke den store grund til frygt for bibliotekernes fremtid: ophavsret og folks uvilje mod at læse på en skærm vil være hindringer. Hun nævner dog ikke at for bibliotekarer er det for så vidt underordnet om information ligger analogt eller digitalt: Der er brug for fagfolk (bibliotekarer) til at guide brugerne igennem. Og det bliver ikke nemmere jo større mængder bøger (analogt eller digitalt) der er i spil…
www.linuxinsider.com/story/39031.html Linux Insider ser såvel tekniske problemer som fare for at de mindre universitetsbiblioteker vil blive kørt ind på et sidespor
www.cio-today.com/story.xhtml?story_id=29103 CIO-Today mener ikke at digitaliserede materialer kan erstatte den oplevelsesværdi som ligger i at komme på et ”rigtigt” bibliotek
www.abc.net.au/reslib/200412/r37448_93636.asx Radioindslag fra Australian Broadcasting-news (Australien), lidt over 5 minutter. Interview med lederen af Harvard University Library. Han prøver at se det fra et ”udenlandsk” synspunkt. Om hvordan det vil være at have adgang til Harvard University Library’s bogbestand i en fjern fremtid. Og betydningen i Kina, hvor der er censur, og kun få har adgang til internettet.

torsdag den 16. december 2004

Yahoo beta-tester videosøgemaskine
Yahoo’s weblog skrev den 15. december at Yahoo har lavet en videosøgemaskine. Den skulle ellers først have været lanceret i 2005, men de har altså besluttet at offentliggøre den for at indhente kommentarer fra brugerne.
Søgemaskiner finder fund dels gennem metatags (”gemte” oplysninger på siderne) og tekst i øvrigt. Men da videoer jo består af billeder, kan det være svært at finde de rigtige søgeord. I sagens natur er der netop ingen tekst i videoer. (Det samme gælder for musik – hvor man dog som oftest vil have en kunstner eller en titel at søge på). Derfor har Yahoo også opfordret videoproducenter til at samarbejde med Yahoo om at synliggøre deres produkter (læse mere i pressemeddelelsen, det er lidt teknisk).
Derimod er det ikke et problem at finde selve filerne (de findes fx ved at søge på .mov).
I den avancerede søgning er det muligt at afgrænse til filer der kan afspille i Quicktime, Windows Media og Real Player. Og til filer med endelsen AVI og MPEG. Afgrænse på længde (under og over et minut), størrelse (lille, mellem og stor – nok praktisk for personer med et 57K-modem). Og et par domæner.
For uforstående har Yahoo lavet fire søgninger som åbenbart skulle vise lidt af mulighederne (Hawaii, University Lectures, Fighter Pilots og Racecar). Men hvorfor bruge dem, når nu der kommer fund fra andre søgninger:
[ ”fogh rasmussen” ]
Det gav i dag 8 fund. I første omgang ser man kun et billede for hvert fund. Oplysninger er ret sparsomme, men fortæller om længden (i sekunder), adressen og formatet. Klik på et billede, klik igen – og hvis ellers du har programmel til at afspille videoen, ja så toner det fint frem på skærmen. En af videoerne viser en 11 minutters tale på spansk af en repræsentant fra Mexico. Han ønsker vist nok Fogh velkommen. En anden viser Fogh sammen med Bush på trappen til det hvide hus. Det er mest Bush der siger noget, men Fogh får dog også lejlighed til at lufte sit engelske, mens Bush nikker anerkendende.
Men der er faktisk overraskende mange fund med. Søg på Lars von Trier, og det giver 28 fund, bl.a nogle interviews med ham, 6 minutters klip fra Dancer in the Dark. Hvis videosøgningen ikke giver nogle resultater, laver den automatisk en websøgning.
Og sådan kunne man fortsætte. Betaversionen af videosøgningen lover godt, hvis det ellers bare er dens slags man er ude efter.
Yahoo opkøbte Altavista for ca. et år siden. Og det er sikkert Altavistas videodatabase som udgør rygraden i Yahoos videodatabase. (Altavista var allerede dengang en af de bedste til at søge videofiler).
Link
video.search.yahoo.com/ Yahoo’s videosøgemaskine.
www.ysearchblog.com/archives/000060.html Yahoo’s weblog om videosøgemaskinen

Tilføjelse:
Der ser ud til at være opbrud på video-søgeområdet. En ny søgemaskine, Blinx, har i en pressemeddelelse sagt at de vil lave noget lignende som Yahoo. Men dog koncentreret om nyheder. Jeg har endnu ikke afprøvet den. Men interesserede kan prøve nedenstående
Link:
www.blinkx.tv/about.php Blinkx om Blinkx
news.com.com/Blinkx+unveils+video+search+engine/2100-1032_3-5493660.html Artikel om Blinkx

onsdag den 15. december 2004

Google digitaliserer biblioteker.
OK, det er en gammel nyhed at Google har indgået et samarbejde med nogle store uni-versitetsbiblioteker i USA om at digitalisere deres bøger og gøre den tilgængelige på inter-nettet. Men for de som ikke har fulgt så godt med, her et lille resume af den store nyhed. Samt nogle henvisninger til længere artikler om emnet.
De involverede er Google, Harvard University, Stanford U., University of Michigan og New York Public Library. Og det ligger ikke lige færdigt til næste år. Foreløbig vil det eksistere som en vinge af Google Print. Selve ideen vil revolutionære hele biblioteksverdenen. Men er dog ikke helt ny. Der eksisterer faktisk allerede adskillige mindre ”biblioteker” af fuld-tekstbøger på internettet. Nogle af den blev omtalt allerede i november 2002 her på webloggen. Men der er også andre:
Gutenbergprojektet har pt en samling på over 13.000 bøger, Pennsylvania U. har 20.000 gratis bøger registreret, en mindre samling kan findes hos The Internet Archive . Og blandt kilderne til dette indslag er der flere. Ideen er altså langt fra ny.
Et af de første spørgsmål er naturligvis finansieringen af et så gigantisk projekt. Google er ikke så meget for at ”komme i lommen” på andre finansielt, men har dog accepteret at gå med på annoncefinansiering. Google skal nemlig finansiere selve digitaliseringen i prøvefasen.
Dertil kommer så ophavsproblematikken. Ældre bøger kan frit digitaliseres uden at spørge ophavet eller dennes efterkommere. Men med nyere bøger skal der spørges om tilladelse og eventuelt betales for det. Her vil projektet i første omgang kun give adgang til at smugkigge i disse bøger, fx indholdsfortegnelsen. Men det er dog trods alt bedre end de nuværende bibliotekskataloger.
Foreløbig er der tale om ca. 40.000 titler (hele Harvards bogbestand er på over 15 mio. bind). Og fortrinsvis dem der ikke kommer i konflikt med ophavsretten. Øvrige bøger vil kun være at se som bibliografiske poster. (Ligesom i biblioteksbaserne?). Rent teknisk bliver bøgerne indskannet som billedfiler, tilsyneladende. Men Google er dog hemmelig omkring selve det tekniske. Og så er Google også åben over for biblioteker som måtte være interesserede i at bidrage. (Hvilke danske biblioteker mon vil redde sig noget presseomtale her?).
Link
battellemedia.com/archives/001126.php
battellemedia.com/archives/001124.php
hul.harvard.edu/ Harvard University Library, med link til pressemeddelelse
searchenginewatch.com/searchday/article.php/3447411 Gary Price om projektet
www.resourceshelf.com/2004/12/google-lets-digitize-several-million.html

tirsdag den 14. december 2004

A9 – organiseret personaliseret søgning.
Det første som du måske bemærker på A9 er at du bliver budt velkommen - med navns nævnelse! I hvert fald hvis du er registeret hos Amazon: A9 er “wholly owned subsidiary of Amazon.com”. Men du har dog en mulighed for ikke at blive identificeret. Dette sker første gang man åbner A9. Og det kan da godt være lidt af en overraskelse.
Men bort set fra det, så er dette netop konceptet bag A9. Dette er hvad den prøver at rette op på: Du søger meget på Google, men har svært ved at huske hvordan du fandt noget for 14 dage siden. Dengang du fandt en side som du først nu har indset værdien af. Og som du nu har glemt alt om hvordan du fandt. Her kommer A9 ind: Den gemmer det for dig.
Udover det har den nogle interessante højremenuer. Her kan du efter behag skifte søgetype. Fra web (Google), til billeder (ligeledes Google), bøger (søger i Amazon), film (søger IMDB Internet Movie Database), opslag (GuruNet).
Samt tre interne knapper til personaliseringerne: søgehistorie (din egen søgehistorie), bogmærker og dagbog. Disse tre forudsætter at du har brugt A9 og har lagt noget ind. Dem har du kun adgang til når du er logget på.
Ud over det kan du ændre på typografi og opsætning (under preferences). Og den sædvanlige toolbar, nyhedsmail, search alerts. Den avanceret søgning minder om Googles avancerede søgebillede.
Det er selvfølgelig en smagssag hvad man synes om sådan noget. For almindelige internetsøgere har A9 nok ikke den store værdi, hvad angår dette med at gemme søgninger. Så er det måske blot endnu en ”facilitet” at huske på. Søgningerne er såmænd ikke bedre end de søgemaskiner som A9 bruger. For glemsomme kan A9 være fornuftig nok: journalister med en stresset og uorganiseret arbejdsmetode, studerende som surfer meget og glemmer at notere ned. Og andre særlige brugere af internettet.
A9 er blot endnu en af mange søgemaskiner som laver personaliserede søgninger. Så nu kan det efterhånden være vanskelligt at vælge hvilken en man skal vælge. Men nu kender du den…
Link
A9.com A9

mandag den 13. december 2004

World Press: Anderledes (alternative?) nyheder
Nyhederne er præget af en håndfuld store nyhedsbureauer som AP og Reuter. Alternativet er ofte politiske eller religiøse medier som står inde for en bestemt ideologi. Hvis du ønsker noget ud over disse, kunne du måske prøve World Press. Den er lidt "NGO-agtig".
Den blev oprettet i 1997 for at holde øje med de emner og debatter som foregår i alverdens aviser og magasiner. Den rettede sig oprindeligt især mod læsere i USA fordi de ikke er så interesserede i hvad der foregår andre steder i verden. Det er i hvert fald en gængs opfattelse. Nogen ville måske mene at de europæiske medier i virkeligheden ikke er så meget anderledes end dem i USA. Ikke kun på grund af globaliseringen.
Lidt diplomatisk kunne det formuleres som at selv europæiske medier har en tendens til at se verdensbegivenhederne ud fra perspektivet fra deres egen lille andedam. Under alle omstændigheder, så er dette netop World Press' beskedne formål: ved at sammenstykke alle disse "andedams-synsvinkler" får læserne mulighed for at danne sig et samlet oversigt. Og så selv drage konklusioner ud fra det. Hvis du kikker på forsiden af World Press, vil du hurtigt se hvad der menes med det: der er overskrifter fra mange forskellige lokale og nationale aviser som du sikkert end ikke havde hørt om før.
De vises i World Headlines. De opdateres hvert kvarter. Og viser altså nyheder fra alle egne af verden. I modsætning til de fleste andre nyhedssites, så kan du se hvilken observans avisen har. Det kan være liberal, independent, semi-official, conservative, government-owned o. lign. Og det er altså ikke nødvendigvis de mest kendte som du oftest render ind i på Google News eller Yahoo News.
World Press har også deres egne redaktører rundt omkring I verden. Som alle andre nyhedsbureauer. De publicerer også egne artikler.
Som hjælp til læseren har World Press også nogle leksikale afsnit:
Country profiles med en stribe ultrakorte oplysninger om hvert land. Og kort. Link til medier i landet samt de seneste nyheder om landet.
Oversigten med link til alverdens nyhedsmedier fås bedre andre steder. Men er der dog. Derimod er der talrige link til "tænketanke" og NGO'er.
Link
www.worldpress.org/ Hovedsiden
worldpress.org/map.cfm Landeoversigterne.

søndag den 12. december 2004

Statens arkiver på vej mod internettet
Den 1. december tog Statens Arkiver det første lille skridt på vej mod at blive offentligt tilgængelige på internettet. Men for nu at dulme læsernes forventninger: der er er lang vej igen!
I første omgang kan brugerne kun finde henvisninger til arkivskaberne. Endemålet er at der ikke kun skal være henvisninger. De skal også kunne bestille arkivalier til brug på arkivernes læsesale.
Databasen hedder Daisy. Ikke efter dronning Margrethe, men for Dansk Arkivalie Informationssystem. Og den skal omfatte Rigsarkivet, landsarkiverne (Sjælland, Fyn, Nørrejylland og Sønderjylland) og Erhvervsarkivet.
En af forudsætningerne har været at den fysiske arkivering er blevet ændret fra arkivpakker med mange forskellige former til ensartede arkivæsker med stregkoder. Arkiverne har altså måttet starte helt forfra med registreringen af materialerne. Da det er mennesker som foretager dette, må snusfornuften vel fortælle at der vil ske mange fejl. (De fleste biblioteker bakser vist stadig med fejl efter inddateringen af bogbestandene i 1990'erne med stregkoder. Hvorfor skulle arkiverne være bedre til det?).
Da Statens Arkiver har måttet udvikle systemet selv og helt fra bunden, vil der givetvis også være nogle indkørselsvanskeligheder. Og søgesystemet selv er heller ikke færdigudviklet endnu. I Daisy kan arkivbrugerne kikke ind i hvad der er i vente. Samlingerne fylder ca. 335.000 hyldemeter. En gigantiske registreringsopgave som først forventes afsluttet efter 2008. Og pt. kan brugerne af Daisy som sagt kun se hvem der har afleveret arkivalier, men ikke hvad de består af. (Selv om det oplyses at mellem 40 og 45% af arkivserierne på Rigsarkivet og Landsarkivet for Sjælland skulle være registreret). Registreringen af disse samt af de øvrige landsarkiver og Erhvervsarkivet vil først være afsluttet efter 2008.
Søgning i arkiverne og muligheder for at bestille vil først kunne ske fra 2007. Derimod ser det ud til at man i første omgang har opgivet at skanne de mange arkivalierne. Dette ville ellers opfylde mange brugeres hede drømme om at kunne se det med det samme, fx i pdf-format.
Link
www.daisy.sa.dk Daisy (Kræver Macromedia Flash)
www.sa.dk Statens Arkivers hjemmeside

fredag den 10. december 2004

Nyt fra Google Labs: Suggest.
Google Labs har lanceret en betaversion af et nyt produkt: Google Suggest (og nu skraber de tæt på bunden, vil nogen måske synes).
Google Suggest kommer med forslag undervejs mens du skriver en søgestreng i søgefeltet. Prøv fx med Cuban missile crisis. Midtvejs gennem ordet crisis kommer der en dropdownmenu med 10 forskellige forslag med angivelse af hvor mange fund (results) dette vil give. Andre eksempler er Bill Clinton. Eller prøv med noget dansk: biblioteksskolen. Det er svært at forklare med ord. Prøv selv!
Det minder lidt om den almindelige websøgnings Mente du. Men dropdownmenuen kommer altså frem mens du skriver. Ikke først når du har søgt på noget. Ifølge vejledningen stammer oplysningerne fra Google Zeitgeist. Det er en fortegnelse over de mest brugte søgninger i Google. Det er oplysninger herfra som Google anvender til at foreslå søgninger som minder om den som du er i gang med.
Det fremgår at Suggest ikke understøtter andre sprog. Men det gjorde den jo i hvert fald i nogle tilfælde for danske ord.
En lidt tosset ide? Ikke så tosset endda, hvis ellers du mangler fantasi til at forestille dig andre søgninger, når du ikke lige finder hvad du har brug for.
Find Google Suggest på
www.google.com/webhp?complete=1&hl=en

Julesjov: Hvor populært er dit navn?
Ok, indrømmet: dette indslag hører ikke til de mest seriøse, men julen nærmer sig vel. Til skræk for nogle, til glæde for andre. Alle typer vil måske kunne lide søgemaskinen Birthday Alarm. Her kan du nemlig undersøge hvor populært dit eget navn er. Måske ikke ligefrem i hele verden, men så da i hvert fald i USA. (Søgemaskinen fortæller ikke hvor den har oplysningerne fra).
Søgningen er ganske enkel: du indtaster bare dit fornavn og trykker på Search. Så kommer der en lille grafik hvor du kan se hvor populært dit fornavn var i tiårsperioder i det forrige århundrede (1900-tallet). Her kan jeg fx konstatere at mit navn (Erik) var mest populært i 1979'erne og 1980'erne, men dog kun opnåede en 89.-plads som det bedste. (I Danmark lå det på 1. pladsen i 1930'erne-1950'erne). At søgemaskinen er USA-orienteret, viser sig ved at navnet Eric også var populært i denne periode, og nåede helt op på 14. pladsen.
Hvilket bestyrkes af at et så sjældent brugt navn i Danmark som Tammy står til en 14. plads i 1960'erne. Men nok om det: du er sikkert mere utålmodig efter at se hvor højt (eller lavt) dit eget navn rangerer, så
klik ind på:
www.birthdayalarm.com/NamePopularity.jsp

torsdag den 9. december 2004

Personaliserede Biblioteker...
Personaliserede services på fx søgninger er blevet meget populære igennem hele 2004. Og denne weblog har skrevet om det flere gange (se nogle af dem under links). Dog mest for engelske søgeredskaber. Men nu er det såmænd også ved at blive udbredt i Danmark. Københavns Kommunes Biblioteker har i flere år haft et nyhedsbrev og et rss-feed. Ligesom Århus Kommunes Biblioteker. Nu følger så Dansk Bibliotekscenter (DBC) efter. Eller rettere: den nationale biblioteksbase, Bibliotek.dk.
I et nyhedsbrev fra DBC hedder det: "Nyhedslisterne giver dig mulighed for at få en mail (hver uge, hver anden uge eller hver måned) med søgeresultater fra bibliotek.dk på noget, som du er interesseret i at følge med i. Fx din yndlingsforfatter eller litteratur om et bestemt emne. Du udfører selv din søgning og gør den derefter til en fast "overvågning".
Hvordan?
Du går ind på Mit bibliotek.dk - vælger Nyheds- og mailinglister - klikker på Ny bruger? - Opret dig selv som ny bruger. Følg herefter teksterne på skærmen. I løbet af den kommende tid vil vi informere mere bredt om funktionen.
Vi sender max. 2 gange om måneden en mail om nye faciliteter”
Så nu er det blevet lettere at være bruger af bibliotekerne – i hele landet.
Link
bibliotek.dk/mit_bibliotek.php Oversigt over personaliseret Bibliotek.dk
bibliotek.dk/mit_bibliotek.php?opcode=mail Mail- og nyhedslister på Bibliotek.dk
bibliotek.kk.dk/bibliotekerne/nyhedsbrev KKB’s nyhedsbrev og rss-feed.
www.aakb.dk/sw289.asp Århus Kommunes Bibliotekers nyhedsbrev.
erikhoy.blogspot.com/2004/10/ask-jeeves-lancerer-elegant.html Personaliseret Ask
bibliotek.kk.dk/uddannelse/brugsanvisning/afgr/pers/view KKB om personaliserede søgninger

tirsdag den 7. december 2004

Ajour om multimedie-filer: GoFish, SingingFish, Creative Commons m.fl.
Go Fish: Ny mediefilsøgemaskine.
GoFish har ifølge egne oplysninger 12 mio. mediefiler. Hvilket er ganske imponerede. Hvad der adskiller den for mediefilernes Google, Singing Fish, er at den udover audio og video også medtager ringetoner til mobiltelefoner og spil. Bemærk dog at mange af fundene er betalings.
Søgemaskinen har forskellige indgange. Faneblade for audio, video, mobile, games. Dropdown-menu for Music (kunstner titel og album), Audiobook, video (titel og person), mobil (ringetone, spil og billeder), spil (titler). Samt et emnekatalog. Det er dog noget skrabet. Det fremgår at GoFish ikke satser på at blive en decideret søgemaskine, men vil være en database for andre søgemaskiner. (Det er set før med fx Inktomi).
Singing Fish
Markedet for mediefilsøgemaskiner domineres imidlertid af Singing Fish. Med 700.000 søgeforespørgsler om dagen. Og den bliver stadig mægtigere. 1. december annoncerede den et helt nyt portaldesign. Selv om den blev købt af AOL i november 2003, søger den stadig efter mediefiler som kan afspilles på Microsofts Windows Media Player og RealNetworks Real Player. På Singing Fish er det nemt for brugeren at efterprøve ophavsretten. Før den begynder at afspille, viser den nemlig den side hvor mediefilen stammer fra. Og det er derfor muligt at se om det overhovedet er lovligt at downloade. Men tilsyneladende udelader de ikke længere ”ulovlige” filer. Brugere af Singing Fish må derfor holde øjnene åbne. Det er især det yngre publikum (18-24 årige) som søger efter mediefiler (ifølge Jupiter Research).
Der er linet op til fornyet konkurrence om søgninger af denne type. Altavista siges at have omkring 550 mio filer. Hvilket muligvis er den største mængde blandt de store søgemaskiner. Men også Google småsysler med planer om videosøgninger.
Creative Commons – hvis du vil være lovlig
Det er meget let at finde mediefiler på internettet: billeder, lyd, film osv. Men det er ikke let at finde ud af om du må udnytte det lovligt. Særligt farligt er det hvis du bruger de almindelige søgemaskiner som Google, Yahoo og Ask. Her er det bedst at lade være med at bruge det du finder af ophavsretshensyn.
For de som vil være helt sikre, er der nu kommet en ny søgemaskine: Creative Commons. Her kan du se hvilke copyright-regler der gælder for det som du finder med maskinen. Den oplyser på hvilken måde du kan bruge det. Fx om ophavet skal nævnes, om det må eller ikke må udnyttes kommercielt eller om det kan gøres med dele af værket.
Creative Commons er et koncept for en slags jurisdiktion på internettet. Det gælder software. Det gælder for kreative arbejder: websteder, musik, film, fotoer, litteratur osv. Bl.a. Google-Guide er lavet på det grundlag: ”Originalen” stammer fra Nancy Blachman. Den danske er videreudviklet i guidens ånd og den originale er nævnt. På samme måde kan andre videreudvikle den danske Googleguide – når blot det nævnes hvem den kommer fra.
Tilbage til søgemaskinen. Databasen er endnu ikke særlig stor. Derfor kan det heller ikke betale sig at afklikke mulighederne under ”optional”. Så kommer der tit ikke nogen fund. Audio- og videomaterialet er heller ikke stort. Tit kommer der ingen fund. Det bedste er altså bare at søge i det hele (any). Eller efter billeder, som der tilsyneladende er mange af.
Prøv fx:
[ copenhagen ]
Her er resultatet dd. 122 fund. Ved hvert fund vil du se nogle ikoner som angiver ophavsretsreglerne.
Nogle af valgmulighederne er kryptiske. Fx interactive. Her forventede jeg at finde noget internaktivt om eller på biblioteker på søgningen
[ library ]
Det gav mange fund (over 3.400). Men jeg kunne umiddelbart ikke finde noget interaktivt nogen steder. Det ser ud som om at det blot er en ordsøgning. Uden at der nødvendigvis er noget interaktivt.
Link
www.gofish.com Go Fish
www.singingfish.com Singing Fish
www.internetnews.com/ec-news/article.php/3442241
creativecommons.org/ Hovedsiden til Creative Commons
bibliotek.kk.dk/googleguide Google-Guide. Den danske Googleguide
www.googleguide.com Nancy Blachman’s Google-guide.

søndag den 5. december 2004

Amazon: anbefaling af bøger.
Hvis du skal købe bøger som du ikke kender i forvejen, er det altid godt at indhente anbefalinger først. Amazon er verdens største indkøbssted for bøger mv. via internettet. Hvis du før har købt via Amazon, har du måske set at brugerne kan skrive små anbefalinger om hvad de har købt. Disse er ofte stærkt subjektive og måske ikke de bedste kilder.
Men det er mere end det. Prøv fx nedenstående bog,
[ The World's Religions: Our Great Wisdom Traditions ]
Rul lidt ned til overskriftn: 243 books that cite this book. Den er altså omtalt i 243 andre bøger. 243 er mange og ingen garanti for at bogen er noget for dig. Det kunne jo fx være fra en eller anden sekt. Men det kunne en gennemgang af de 243 titler give dig en chance for at undersøge.
Der er mere. En af klassikerne inden for religionsforskning er
[ Mircea Eliade, The Sacred and the profane ]
Nu får du ikke bare bøger som henviser til bogen (36). Du får at vide at This book cites 8 books: Altså bøger som bogen selv mener er gode. Dette fortæller bl.a. noget om hvilke kilder bogen selv finder det værd at nævne.
Amazons korte forklaring på de to faciliteter får du ved at klikke på learn more til højre for overskrifterne.
Det fremgår at oplysningerne stammer fra det søgeprogram (Search Inside This Book) som Amazon tidligere på året oprettede. Det søger efter om der er henvisninger (citations). Amazon gør dog opmærksom på at listen langt fra er komplet. F.eks. pga. andre stavemåder på forfatteren eller titlen.
Jeg ved ikke hvornår Amazon startede med dette. Det minder lidt om Google Scholar. Her er en af de 4 forskellige slags fund "citations". Så med disse to redskaber i hånden skulle boginteresserede som fx bibliotekarer havde gode muligheder for at vurdere bøger før de køber ind.
Link
Amazon: www.amazon.com
Inspireret af: www.rageboy.com/2004/11/amazon-hypercites-bezos-blows-my-mind.html

lørdag den 4. december 2004

Google husker hvad den finder…
Som bekendt er det svært at få ”slettet” noget når det først én gang er indekseret i Google og andre søgemaskiner. Det har nogle pårørende til soldater i Irak måttet sande. En soldat fra USA havde lagt nogle billeder ud på nettet. De fleste af de hundredvis af fotos viser militært hverdagsliv. Ni af dem er opbevaret i Google’s indeks. Og tilsyneladende viser de at overgrebene mod fangerne fandt sted lang tid før hidtil antaget, maj 2003. De viser Navy SEALs soldater som sidder oven på blodige fanger med håndjern og hætter på.
Andre fotos viser brutale scener fra huse og arrestationer af beboerne her.
Ifølge AP er siden ikke længere tilgængelig. (Og der er heller ikke noget at finde på adressen smugmug.com som AP opgiver som kilde). Men sidens ophav havde åbenbart glemt at hvis først en version af en webside er optaget i Google’s indeks, ja så er det næsten umuligt at få ud igen. Materialet vil nu indgå i en undersøgelse som muligvis kan føre til retssager lignende dem i Abu Ghraib.
Sagen minder lidt om historien om en kommune som ved en fejltagelse kom til at lægge fortrolige dokumenter ud på nettet. De blev fundet af Googles søgerobot. Og har siden ikke været fortrolige mere…. Så pas på inden du lægger noget ud: Vær sikker på at du ikke senere fortryder.

Page Rank i Googles værktøjslinje: Kun for sjov???
Mange internetsøgere har downloadet Googles Toolbar. Og i tilgift fået en lille grafik som tilsyneladende viser en given sides Page Rank. (En grøn markering fra 0/10 til 10/10).
En ansat i Google Support har "officielt" i et onlineforum fortalt at den "kun er for sjov". Dette angiveligt for at forhindre hackere i at få adgang til data om en sides Page Rank. Google opdaterer derfor kun meget sjældent Page Rank-data, i gennemsnit hver 7. måned.
Til beroligelse for webmastere som til deres rædsel opdager at de har Page Rank 0/10. De skal så bare vente til næste opdatering. Den viste grafik er ikke den aktuelle. Til gengæld bruger Google den "rigtige", altså den aktuelle Page Rank, til at sortere fund.
Dette dementeres nu "uofficelt officielt" af en ansat på Google under pseudonymet "Google Guy" (som formodes at repræsentere Google). (Search Engine Roundtable). Search Engine Watch's Danny Sullivan er ligeså forvirret som du sikkert er nu (se link).
Hvad kan vi andre lære af den historie? At det måske ikke er nødvendigt med Google's værktøjslinje! Bort set fra at den fylder en hel del øverst i browseren, så er nogle af funktionerne altså sandsynligvis overflødige.
I stedet kunne du benytte lejligheden til at skifte browseren ud med Firefox. Til standardversionen af Firefox hører et søgefelt ikke bare til Google, men også Yahoo og andre (med mulighed for at downloade snart sagt alle du måtte have lyst til at søge i). Hvis du skulle mangle Page Rank-grafikken, kan du downloade den fra Firefox' "extension"-side. Her får du den så diskret anbragt nederst til højre i proceslinje, i øvrigt sammen med Alexas lignende. Så har du også lidt at sammenligne med.
Spol lidt tilbage i webloggen fra november for flere indlæg om mulighederne i Firefox.
Læs mere
blog.searchenginewatch.com/blog/041202-150227
www.searchengineguide.com/laycock/002783.html

torsdag den 2. december 2004

Ajourført kildeliste.
Jeg har længe ønsket at ajourføre kildefortegnelsen. Senest havde en anonym læser gjort opmærksom på fejl. Kildelisten er ment som inspiration til læserne om selv at gå på jagt i den efterhånden righoldige litteratur om søgemaskiner. Du kommer til indslaget om kilder ved at klikke på linket kilder ude til venstre.

Problemer med Google Scholar
Search Engine Watch og Gary Price har nogle vigtige betragtninger om Google Scholar. Altså den søgemaskine som Google er ved at udvikle til at søge specielt efter forskningsmateriale.
Price peger på at Google ikke angiver hvem det er de har hentet oplysningerne fra, hvor meget der er fuldtekst og hvor meget der er henvisninger og citater. Mange af fundene stammer fra det åbne web uden at Google fortæller hvordan disse er udvalgt. Fx er der citater fra pressemeddelelser og andet som ikke kan anses for akademisk. Endelig er det alment kendt at Google ikke indekserer mere end 101 kb af html-dokumenter og pdf-filer. Et alvorligt problem for forskermateriale, som jo ofte er oppe i større størrelser end det.
Google bruger andre søgemaskiner. Men kan man så ikke ligeså godt bruge dem? Det tyder i hvert fald undersøgelser af en vis Peter Jacso. Han har sammenlignet hvad Google Scholar finder og hvad primærsøgemaskinerne finder. Hans konklusion at Scholar finder væsentligt mindre. Lige som Scholar åbenbart har genoplivet problemet fra søgemaskinernes barndom med dobbelt- og tripleposter. Jacso ser det som et plus at Scholar også viser anmeldelser, så brugeren er i stand til at vurdere materialet. (Dette sidste er Amazon i øvrigt også begyndt på. Jeg arbejder pt. med et indslag om dette).
Price gør dog også opmærksom på at Scholar endnu er i beta-version. Og alle disse fejl måske hen ad vejen bliver rettet. Men mon ikke at Google får styr på det? Når de har lanceret den på denne måde, så må man vel gå ud fra at de har været opmærksom på alle disse problemer.
Modsat fx MSN er Google et mere ”åbent” foretagende. Og netop ved at kaste Scholar for ”løverne” vil Google meget tidligt kunne indhente kritik og gode forslag til forbedringer. Jeg ser frem til at det sker….
Link
blog.searchenginewatch.com/blog/041201-105511

onsdag den 1. december 2004

Forskning på internettet – hvad venter vi på?
Almindelige internetsøgere, bibliotekarer, studerende …. Alle sukker efter gode, dybtgående og saglige dokumenter på nettet. Søgemaskinerne står klar. Bibliotekarer står klar. Så hvad venter vi på? Vi venter på at forskerne og alle de kloge går online. I hvert fald i Danmark. Og ikke bare med henvisninger til analoge materialer. Men Rigtig online!
Universiteterne i USA lægger materialer af høj kvalitet på nettet. Meget kan fx findes på Google Scholar. (Omtalt her på bloggen 20.11.2004). Eller deciderede emnekataloger. Eller med nyere fænomener som Cite You Like. En anden måde at organisere forskningsmaterialer. Ideen er at hvis du opdager et dokument på nettet som du gerne vil beholde, klikker du på en knap som føjer det til et bibliotek. Hertil kommer så oplysninger om citater. Det kræver at du opretter en gratis konto (det tager 10 sekunder). Til gengæld er tjenesten så tilgængelig overalt på koden. Efter registrering bliver du bedt om at føje et menupunkt til Foretrukne(Explorer) eller Bogmærker (Firefox). Herefter kigger du i katalogens 8 menuer og kan gå på jagt efter dokumenter, sæt et bogmærke og find dem igen i Cite You Like's venstremenu under Your Library:View. Indrømmet: ikke helt let at bruge. Men det er jo altså også mest for avancerede brugere.
Det samme kan vi ikke sige om de danske universiteter. Hvad er muligt her? Universiteterne har lavet en forskningsdatabase. Den rummer over 200.000 referencer. Og det ser jo lovende. Men antallet snyder: mange er henvisninger til artikler i bøger eller tidsskrifter som man lige så godt kunne finde på bibliotekernes database. Om egentlig forskning er der ikke tale. Ganske svær at finde rundt på. Hvilket ikke ville gøre noget hvis resultatet er brugbart. Enkel og udvidet (avanceret søgning). Og det kan man desværre ikke altid sige: de fleste henvisninger er til tekster som ikke ligger online. Der er dog en del som internetsøgere kan bruge. Og man kan ikke sortere dem ud specielt.
En søgning på
[voksenundervisning]
Giv er 68 poster, men kun 1 (en) er et online-dokument (fra Undervisningsministeriet).
Bedre bliver det ikke at prøve med et naturvidenskabeligt emne, fx drivhuseffekt?. Her viser resultattavlen 76 poster.
Deprimerende i betragtning af at universiteterne er statsdrevne og kunne forventes at have meget materiale tilgængeligt online. Klamrer forskerne sig til deres værker, så brugerne skal besværes med at bestille dem gennem bibliotekerne?
Her kunne en og anden lære af Danmarks Pædagogiske Universitet. Det udgiver et populærvidenskabeligt tidsskrift, Asterisk. 6 gange årligt. Det er lidt tungt at downloade (pdf-filer). Men her kan lærere, pædagoger og andre interesserede ganske gratis læse artikler af kendte inden for området: Mads Hermansen, Lars Klewe, Stig Brostrøm.
Og så den internationale bibliotekarorganisation IFLA er opmærksom på hvordan ejendomsretsholdning bremser informationsstrømmene. Den er medunderskriver af the Geneva Declaration on the Future of the World Intellectual Property Organization fra 29 september 2004. Heri gør IFLA opmærksom på at balancen mellem at beskytte brugerne og producenterne (fx forfattere) af information har forskubbet sig til brugernes ugunst. Således at opstår informationsmonopoler som gør det vanskelligt for uddannelsessøgende, forskere mv. at få information. Ikke kun i ulandene. Databaser bliver stadig mere vanskeligt tilgængelige. Og gør det besværligere for bibliotekerne at stille materialer til rådighed. Specielt for ikke-udviklede lande lægger høje priser, copyrightlove, manglende uddannelse i at bruge redskaberne osv. en dæmper for informationsstrømme hertil.
Link
erikhoy.blogspot.com/2004/06/svenskerne-overhaler-os.htm l Indslag om Sverige
erikhoy.blogspot.com/2003/09/universiteter-og-forskningsmaterialer.htm l Indslag om materialer fra universiteter.
www.dpu.dk/site.asp?p=162 Asterisk fra Danmarks Pædaogiske Universitet.
www.ifla.org/III/clm/CLM-GenevaDeclaration2004.htm l IFLA om copyright m.v. 28.9.04.
www.futureofwipo.or g Geneveerklæringen om WIPO’s fremtid.
www.citeulike.org/ Cites You Like

Sider