tirsdag den 20. december 2005

Project Gutenberg
Længe før Google, Microsoft og Yahoo m.fl. kastede sig over at skanne bøger til fuldtekstsøgning, var der Project Gutenberg. Det startede allerede i 1971. Grundlæggeren Michael Hart (dengang studerende) fik sat frivillige i gang med at afskrive bøger elektronisk. I dag rummer Project Gutenberg over 17.000.
Indtil 1989 foregik alt som afskrivning. Nu skannes omkring 90%. Michael Hart fortæller interview i Wall Street Journal det tog ham 9 måneder at afskrive en bog på 1.000 sider. Med skanning tog det tre uger for en bog på 750 sider.
Han fortæller at han blev kontaktet af Google og Yahoo allerede længe før de gik i gang med deres indskanningsprojekter. Han ville samarbejde, men det ønskede Google ikke. Måske fordi Googles projekt er topstyret, mens Gutenberg-projektet er græsrodsorganiseret. Hart tilbyder stadig hele Gutenberg til Google.
Han føler sig noget overset i medieslaget om opmærksomhed. Google og Yahoo får megen medieopmærksomhed, mens Gutenberg-projektet nærmest er glemt.
Gutenbergprojektet bliver ellers brugt meget: der er mindst en million downloads om ugen. Blandt de populære er Thackeray, James Joyce, Dickens, Sherlock Holmes, Koranen, Bibelen og andre.
Gutenberg er det måske ældste, men der kommer til stadighed nye internetsider med gratis ebøger. Et af de nyeste skud på stammen er Authorama. Internetsøgning har før beskæftiget sig med ebøger, se tidligere artikel, se fx artiklen fra 29. juli.
Læs mere
Project Gutenberg.
Artikel i Wall Street Journal.
Autorama.
Artikel i Internetsøgning om ebøger.

Ingen kommentarer: