mandag den 30. oktober 2006

Internet Archive-It

EContentMagazin fra oktober 2006 (trykt udgave) har en længere artikel om bevaring af websider. Dvs. om internettets pt. største arkiv, Internet Archive. Mens nationale officielle institutioner fortsat diskuterer hvordan og hvorfor og kun sparsomt er gået i gang med en systematisk registrering og opbevaring, har Internet Archive i årevis reddet milliarder af sider fra evig glemsel.
I dag rummer Internet Archive over 65 mia. dokumenter, herunder også bøger, film og software. Det opbevares rent fysisk i forskellige lagre i San Francisco, Egypten, Amsterdam og Frankrig. Men udover selv at være arkiv tilbyder Internet Archive nu også en special service over for institutioner: Archive-It. Foreløbig kun i en beta-version.
Oprindeligt blev det oprettet for statslige arkiver, nationalbiblioteker og universitetsbiblioteker som har til opgave at opbevare, men ikke kapaciteten til at gøre det. De får så her en mulighed for at opbevare 300 websteder for tid og evighed med tilhørende søgemuligheder. Det er hensigten at mindre institutioner også får mulighed for at gøre det samme.Der er flere måder at få et lille indblik i hvad Archive-It foreløbig rummer. Klik fx i drop-down-menuen. Den giver dog ikke et samlet billede, men kun et overblik. For mere udførlig information, klik på All Collections. Her kan du se hvilke institutioner der er tilmeldt.
På forsiden af Archive-It er der pt to eksempler på mindre arkiver af denne type. Kigger man listen igennem, omfatter den fortrinsvis universitetsbiblioteker samt et par enkelte stater i USA og Canada.
Link
Internet Archive.
Archive-It.
Econtentmag.

4 kommentarer:

Jørgen Gram Christensen, Vejle sagde ...

Jeg har nu indsendt en ansøgning om at blive modelprojekt for et dansk, lokalt biblioteksarkiv:
The Vejle Internet Library.

I hører nærmere...

Jørgen Gram Christensen sagde ...

Min foregående kommentar er nok ikke blevet sendt...

Men det drejede sig om, at jeg synes, at det ligner en oplagt mulighed for lokal bevaring af amtskommunale/kommunale hjemmesider, her på falderebet før kommunalreformen. Subsidiært lokale bibliotekshjemmesider, før disse forsvinder jvf. strukturændringerne. Og endelig for opbevaring af lokale hjemmesider generelt.
Med det perspektiv, at der også er mulighed for brugeradgang til arkivet.

Hvis altså Internet Archive vil give os lov?

Såfremt ifald - så er det en mulighed, der fortjener at blive meldt bredt ud...

J.G.Christensen sagde ...

Til alm. information - så lød svaret på min henvendelse sådan her:


Thanks for your email.

From your description below, it sounds like either the Archive-It Pro web
application or a Curated Crawl would be a service you could use to archive
your homepages of local county and municipalities.

Archive-It Pro is an annual subscription service and costs between $12,000
and $15,000 for 3 collections and up to 10 million documents. We have
webinars every month to demo the application if you would like to attend
the next one on November 14th (we could arrange a time that would work for
you). You set the frequency that you would like the websites to be crawled
(ie every day, every week,once a month, once a quarter, one time only) and
are issued crawl reports and access to the wayback machine for viewing.
Each collection is indexed for full text search.

A Curated Crawl is a more customized service, with a higher price tag,
designed specifically for topic crawls that a dedicated crawl engineer
would run for you. Again you can let us know the frequencies of the
crawls. There is no limit on the number of documents, we just have price
points for different levels as the number of documents increases. You also
receive crawl reports and anaysis, Q&A and Wayback machine access. Search
can be included, but is an additional cost.

I hope this information is helpful. Please let me know if there are any
other questions I can answer.

Thanks!

Kristine

Kristine Hanna
Director,Web Archiving Services
Internet Archive


Summa summarum: Det kan vi nok gøre billigere selv. Det lød bare som en nemmere løsning... for mig :-)

Erik Høy sagde ...

Jeg har ikke så særligt meget forstand på priser. Men op i nærheden af 100.000, det er vel ikke lige hvad ethvert lille bibliotek sætter øverst på ønskelisten for at redde hjemmesiden.
Svartiden må siges at være ret hurtig, men det er jo nok et standardsvar der her sendes ud.
Tak til Jørgen for forbrugeroplysning på denne meget konkrete måde.