fredag den 31. august 2007

Fuldtekstdatabaser

Amazon, Google Book Search og Live Search Books er alle eksempler på søgemaskiner og databaser som kan søge fuldtekst i onlinebøger. Med større eller mindre tilgængelighed hvad angår mulighed for at se hele bogen.
Der er selvfølgelig fejlkilder. Skanning indebærer bogstavgenkendelse, og den er ikke 100% korrekt. Hvor stor fejlprocenten er, ved vist ingen. Men lad os antage at den er 2 %, så vil en normalside (A4) på 2.400 enheder altså indeholde ca. 50 fejl. Alt ialt er det dog en fejlmargen som er lille i forhold til kæmpefordelene.
LISnews har en gennemgang af de forskellige muligheder for at søge i de største af sådanne onlinebiblioteker. Den er opdelt i forskellige typer:
Databaser opdelt i emner
De mest omfattende er Amazon/A9 og Google Book Search. Men også Google Scholar. Google books er som de fleste andre med på at bøger fra før 1923 er frit tilgængelige (ifølge USAs ophavsretslovgivning). Efter det årstal kan der være restriktioner på. I starten mente Google sig i sin gode ret til at indskanne alt (blot ikke at stille det til rådighed). Men det synes at have ændret sig til at Google først indhenter tilladelser.
Databaser med fortrinsvis ældre materialer
Authorama er forsåvidt ikke særlig speciel, idet den bygger på andre kilder som Gutenberg og Google Books, men forskellen er at de har overført filerne til letlæselige HTML-versioner.
Internet Archive Text Archive har været omtalt og prist mange gange her på weblogggen, så ikke så meget andet end linket til den. Det samme gælder for Open Library. Men her er kun 13 bøger og en masse gode hensigter at finde.
Project Gutenberg er internettets veteran, men det siger lidt om den eksplosive udvikling at der indtil videre kun er 20.000 titler. Nu langt overgået af Google Books.
LISnews nævner også nogle elektroniske ressourcer som Amazon, Netlibrary og Psycbooks, samt enkelte mindre samlinger, såsom Professor Lawrence Lessig's 2004 book Free Culture, 2000 Code and Other Laws of Cyberspace, 55 Ways to Have Fun With Google by Phillipp Lensenn, The National Academies Press, Random House og Harper Collins.
Derudover også nogle metasøgemaskiner, samt opkommende projekter: The Million Book Project. Ligesom der er henvisninger til artikler, som det kan være rart at orientere sig i, hvis du er interesseret i emnet.
LIS news angiver også en søgeteknik. Her risikerer du at finde ulovligt materiale. Søgestrengen hedder: (søgeord efterfulgt af...) intitle:"index of" "last modified size description" "parent directory"
Link
LISnews.
Kort sammenligning af databaserne.
Google Book Search.
Live Search Books.

Ingen kommentarer: