lørdag den 28. august 2010

Mens vi venter på digitaliseringen...

Digitaliseringen af danske bøger og andre analoge materialer, nye som gamle, er så godt som ikke-eksisterende. For tidsskrifters vedkommende er især foreningsblade, ikke-kommercielle tidsskrifter og budskabsbærende blade dog for det meste også tilgængelige på internettet i fuldtekst.
I udlandet ser det lidt bedre ud. Men her gælder at det er meget svært at finde overordnede søgebaser. Så du er oftest overladt til dels at skulle finde frem til tidsskriftet, dels dernæst søge i en eventuel fuldtekstbase eller et søgeindeks til de trykte udgaver.
Hvad kan bibliotekerne gøre mens vi venter ppå digitaliseringen? I princippet har vi kun råderet over de bibliografiske databaser som fx bibliotek.dk og de forskellige bibliotekssystemers lokalbaser. I København Bibliotek.kk.dk. Der er både for- og bagdele ved bibliografiske databaser. Fordelen er at der ikke er så meget kommercielt støj som på fx Google. Den afgørende bagdel er at der er sorteret så meget fra at de ikke er brugbare til fx at sammenstykke kapitler eller dele fra bøger. emneord, fritekstsøgning
Der er sket en opblødning i forne tiders meget restriktive retningslinjer for hvad bibliotekarer kunne lægge ind af fx emneord, anbefalinger, alskens småkommentarer og andre tilføjelser til de "officielle" poster. Nogen kan måske stadig huske begrebet "kontrollerede emneord". I dag snakker vi snarere om "tags-onomi", "folksonomi", at brugerne selv skal have lov til at bidrage, og meget andet.
Jeg har i sommerferien funderet meget over dette problem. Allerhelst så jeg selvfølgelig digitaliseringen overflødige gøre dette problem. Men efter hvad jeg har set de seneste mange år, så er jeg ikke særlig optimistiske hvad det angår. Det ser ikke ud til at dagblade, forlag og andre har tænkt sig at gøre det muligt for os i det mindste at fuldtekstsøge i deres materialer. Tværtimod ser det ud til at hele branchen snerper mund og korslægger armene tættere og tættere. Kvaser kortene tæt kroppen. Selv Det Kongelige biblioteks digitalisering af materialer uden for ophavsret synes at indskrænke sig til marginalt interessante materialer, der næppe rykker særlig meget for det brede publikum.
Så, for nu at komme til hvad der var meningen med hele dette indlæg: Jeg er nået til det punkt, hvor jeg mener at biblioteksverdenen må tage de midler i brug vi nu engang har. Og det er som nævnt at berige de bibliografiske databaser. Ærgerligt. Og når digitaliseringen er gennemgørt, også overflødigt. Men vi kan jo ikke bare vente på at bogbranchen har begået kollektivt selvmord.
Jeg har taget fat på et ganske lille, men ikke desto mindre effektfult, hjørne af Københavns Bibliotekers materialebestand. Københavns Hovedbibliotek råder over ca. 300 udenlandske tidsskrifter. Tallet bedrager. 300 lyder ikke af særligt meget. Men tallet dækker over hundredvis, hvis ikke tusindvis, af artikler for hvert tidsskrift. Altså en samlet materialemængde som skal tælles i titusinder, måske hundredtusinder. Mange af tidsskrifterne er faktisk bøger.
Disse materiale rummer en enorm resssource.  De dækker områder der ikke er dækket af bøger, og de er for det meste også meget mere aktuelle end bøger. Tænkt blot på emner som globalisering, klimaændringer, cubakrisen, mellemøsten, terrorisme, menneskets udvikling, specielle sygdomme, arkæologiske fund osv. Informationer som ikke findes andre steder og i så opdateret form.
Øvelsen har altså været denne: hvordan får vi vores bibliografiske databaser til at "pege" mod disse tidsskrifter så de kan blive inddraget i de almindelige lånerekspeditioner, og også at lånerne selv finder dem når de søger på vores database.
Udgangspunktet, før dette projekt, er følgende: Alle disse tidsskrifter har som minimum en hjemmeside. Mange har et søgeindeks som gør det muligt at finde frem til bestemte numre. Og enkelte tidsskrifter har endda fuldteksteksemplarer online som kan bruges i tilfælde af at det trykte eksemplar er udlånt. Problemet er bare: Lånerne bliver ikke opmærksom på det, og hvad værre er: Det gør bibliotekarerne heller ikke.
Som eksempel vil jeg gerne gøre opmærksom på de oplysninger der generelt fandtes om et udenlandsk tidsskrift i databasen, her tidsskriftet Foreign Affairs:
91.9405 PIF Foreign affairs / Council on Foreign Relations. - New York
Hva'be'hva? Dette tidsskrift rummer talrige artikler om emner som vores lånere efterspørger dagligt, og hvor biblioteket lynhurtigt løber tør for materialer.
Opgaven lyder altså på følgende: Hvordan får vi overhovedet brugerne af bibliotekssystemet til at blive opmærksom på at dette tiddskrift findes? Mit bud på dette har været at gennemse tidsskriftet for at se hvilke emner det jævnligt beskæftiger sig mig, og dernæst indlægge emneord på det. Det giver for dette tidsskrifts vedkommende følgende.
al-Qaeda * cyberspace * demokrati * energiforsyning * energibesparelser * globalisering * hungersnød * islam * klimaændringer * kvinder * olie * pirater * terrorisme * udenrigspolitik * ulande * zionisme * palæstina-problemet * ny økonomisk verdensorden * Afghanistan * Bosnien * Indien * Irak * Iran * Korea * Mexico * Rusland * Somalia * Thailand * Tyrkiet * Ukraine * USA
Dette løser i første omgang problemet med at få brugerne af biblioteksbasen til i det hele taget at opdage Foreign Affairs. Næste skridt er så: Hvordan finder de så det bestemte nummer? For ikke alle numre af tidsskriftet beskæftiger sig med alle disse emner. Dette problem har jeg forsøgt løst ved at henvise til tidsskriftets hjemmeside: med note og et klikbart link:
Fra 1973 findes søgefunktion på nettet  http://www.foreignaffairs.org/search/
Noten har kan variere en del. Det er et stort problem at tidsskrifter ofte ændrer praksis og ændrer hjemmesider, så denne note er lidt atypisk. Det ville nok have været bedre bare at henvise til hovedsiden. Men pointen er: Linket gør opmærksom på at du nu kan arbejde videre med søgningen på tidsskriftets hjemmeside: Finde henvisninger til emner, finde fuldtekstartikler osv.
Jeg eksperimenterer også med mere løse overordnede beskrivelser af tidsskrifter, fx nyhedsmagasiner, sportstidsskrifter, modeblade, forbrugertidsskrifter osv. Men alt er endnu på forsøgsbasis. Den bedste respons er selvfølgelig brugernes. hvordan vil de modtage dette? Jeg er meget spændt på at se om manøvren vil skabe et fornyet udlån af tidsskrifterne. Dette vil være den bedste måde at evaluere forsøget.
Men jeg vil hellere end gerne at du, kære læser, kommer med respons på dette. Alskens kritik, kommentarer, forslag til forbedringer osv. er mere end velkomne. Desværre er det for ikke-københavnske testere kun muligt på bibliotek.kk.dk. Desværre fordi tidsskriftposterne her er meget mangelfulde. Bl.a. kan du ikke se henvisningerne til hjemmesider, ejheller emneordene. Du får altså bare tidsskriftet frem når du rammer et emneord. Københavnske bibliotekarer kan prøve på vores interne base. Her er alt synligt.
God fornøjelse. Kommentér helst på dette indslag, men hvis du ikke vil diskutere i det "offentlige" blogrum, så brug min email. På forhånd tak.
Listen over tidsskrifter der er forsøgt synliggjort er på godt og vel omkring de 100. Her er et lille udplukover nogle af dem du kan søge på, og deres hjemmesider. Som nævnt, der er mange flere. En samlet liste findes på et dokument.
The Baltic Times.
HAHR.
The Middle East.
Security Dialogue.
Sport Illustrated.
WoodenBoat.

torsdag den 12. august 2010

Exit Google Wave

Nogen gange når jeg ikke engang at skrive om et Google-fænomen før det forsvinder igen. Det gælder for Google Wave. Jeg havde ellers et indlæg under udarbejdelse i forbindelse med at Google Wave fyldte et år den 28. maj i år. Og det var jo også noget enestående at det var to danskere som stod bag.
Men ganske kort tid efter fødselsdagen var det altså slut. Det står nu fast at Google Wave ikke kommer til at opleve 2011, i hvert fald hvis man skal tro Googleblog som den 4. august (lidt indpakket) konstaterede, at på trods af teknikernes begejstring, så tog publikum aldrig Wave til sig.
Jeg må indrømme at jeg heller ikke tog det til mig. Ikke fordi jeg er afvisende over for sociale redskaber. Jeg har da en profil på Facebook. Men jeg kunne simpelt hen ikke finde ud af det. Og antallet af brugere på det var for lille til at jeg synes det var spændende. Trådene var mere noget med: Hvordan pokker fungerer det her egentligt?
I det hele taget ser det ikke særlig godt ud for Googles sociale værktøjer. Tænk blot på Orkut. Vist nok større end Facebook i lande som Brasilien og Indien, men andre steder slet ikke slået igennem. Lively er et andet af Google strandede produkter, som tidligere beskrevet på Internetsøgning.
Jeg hører ikke til dem der beklager lukningen. I hvert fald ikke så længe Google stadig holder fanen højt hvad angår de ting de er virkelig gode til. Suverænt gode. Nemlig web-søgning og specialsøgning. Forbedringer, konstante vedligeholdelser af søgealgoritmen og de enorme data af alskens slags, som Google gang på gang har vist at de er i stand til at omsætte i enkle, effektive og brugbare søgeredskaber. Ikke perfekte, men altid bedre end konkurrenternes.
Link
Googleblog.
ComOn.
Google blogoscoped.
Google Wave Blog.

tirsdag den 10. august 2010

Google og Metaweb

Google erhvervede midt i den danske juli-hedebølge Metaweb. Dette er officielt søgemaskinefirmaets seneste forsøg på at udvikle et semantisk søgesystem til korte svar på spørgsmål. Men som sådant er det ikke noget nyt: Søgemaskinen Ask er ligefrem levet af sådanne funktioner i årevis.
Så hvad kan grunden være? Googleblog siger at det er fordi Metaweb har en database med 12 millioner film, bøger, TV shows, geografiske lokaliteter, mm. Bag de lidt kryptiske formuleringer gemmer sig en base, Freebase. Det ser ud til at være et emnekatalog med en række ressourcer. Hvem der har udvalgt det, og til hvilket formål står mig ikke særlig klart. Det er sådan set nemt nok at gå til. Der er både en emneindgang, og en søgemulighed med gode forslag så snart du starter at skrive i søgefeltet.
Men så hører tilgængeligheden også op. Det er et udvalg af ressourcer som ikke umiddelbart giver nogen mening. Nogle er fuldtekst, mens andre er bibliografiske henvisninger eller leksikale artikler om en bestemt bog, film el. lign. Eller slet og ret henvisninger til andre ressourcer, som fx Wikipedia.
Måske ligger hemmeligheden i at bag Freebase står frivillige som leverer stoffet. Formålet med det hele er at finde den rette information til de rette læsere. Men dette formål er jo snart sagt hvad alle påstår at ville.
Eller ligger hemmeligheden i hvem der står bag? Ledelsen af Metaweb og Freebase er tilsyneladende nogle nørder fra de mest kendte universiteter i USA, Stanford, MIT og Yale. Så måske er formålet i sidste ende at støvsuge markedet for kloge hoveder. Denne form for "kannibalisme" er set før, og af andre firmaer. Tænk blot på Yahoo's opkøb af bl.a. All The Web, eller Ask af Teoma for år tilbage.
Tilsyneladende har Google valgt at skyde med spredehagl for at imødekomme dette behov. For over et år siden var det Google Squared fra Google Labs. Andre har været "lignende sider" og den nye venstremenu.

Links
Googleblog om Metaweb.