onsdag den 24. august 2011

Schema.org

For mere end 100 år siden mødtes fremsynede biblioteksfolk fra hele verden og vedtog en af de mest oversete betydningsfulde beslutninger i bibliotekernes historie: Fastsættelse af målene for kartotekskort!

Det betød, at Svend Dahl i sin "Haandbog i Bibliotekskundskab" allerede i 1912 kunne skrive:

Da et Seddelkatalog altid optager megen plads, bør de enkelte Sedlers Format være lille, under ingen omstændigheder større end det internationale Postkortformat. Formatet 7½ x 12½ cm er et Format, der i øvrigt nu synes at ville blive Normalformatet for Katalogsedler i de fleste Lande. stift, glat og stærkt Papir eller et tyndt Pap er de bedste Materialer. Endnu bruger de fleste Biblioteker hele eller delvis skrevne Katalogsedler. Den Skrift, som anvendes maa fremfor alt være tydelig, ikke altfor fin og uden overflødige Kruseduller…. Der bør kun skrives paa Sedlens Forside, og hvis Titlen er for lang, fortsættes den paa andre Sedler… Maskinskrevne Sedler anvendes nu meget overalt. Men trykte Sedler er dog Idealet…”

Bag dette tørre, fagsprog gemmer sig en tankegang som ingen normalt tænker/tænkte på, men som ikke desto mindre er en af forudsætningerne for udbredelsen af biblioteksvæsnet. I menneskesprog betød det nemlig at katalogkortet kunne stikkes ned i et hvilket som helst kartoteksskab hvor i verden man end befandt sig! Før den tid var bibliotekernes kataloger enten trykte kataloger eller i vilkårlige formater.

I computerens tidsalder har det taget mere end 30 år at nå frem til en erkendelse af at visse standarder er nødvendige for at fx internettet kan fungere. Men det holdt (og holder stadig) hårdt fordi forretningsinteresser er på spil. Microsoft, Apple og mange andre har fastholdt deres egne standarder, og på ebogsområdet hæmmer et utal af "standarder" (Kindle, Sony, iPad/Apple osv) udbredelsen af ebøger.

Men på visse områder sker der dog noget. De tre søgemaskiner Google, Bing og Yahoo tog i juni i år initiativ til at oprette schema.org. Det er en side hvor webmastere og producenter af hjemmesider kan se hvilke standarder de skal bruge for at søgemaskinerne kan orientere sig i dem.

Dette er nok sket i erkendelse af at søgemaskinerne selv nu 12 år efter Google stadig ikke har formået at kvalificere deres sortering af fund. Godt nok er der sket meget. Men i princippet var og er Googles tankegang bag Page rank stadig det bedste bud på hvad søgemaskinerne kan præstere. Og det erkender alle søgemaskiner ikke er godt nok.

For så vidt er alle søgemaskiner også enige om at de såkaldte metadata, eller mikrodata, er vejen frem. Det er de skjulte elementer på en hjemmeside som gør det muligt at søge fx på sidens titel, url, billeder og thumbnails. Men problemet er at ikke alle bruger de samme standarder.

Det er her at schema.org foreslår nogle standarder for hvordan film, music, organisationer, tv-shows, produkter osv kan markeres og således også fremfindes ved specifikt at bruge kommandoer til at fremfinde dem.

Både Yahoo (SearchMonkey) og Google har delvist afprøvet sådanne. Men at de tre søgemaskiner nu har indset at det vil gavne alle med fælles standarder, er et stort gode for brugere af søgemaskiner. Det bliver spændende at se om disse standarder vil blive brugt og det bliver endnu mere spændende at se om vi snart vil kunne kvalificere vores søgninger på internettet på baggrund af disse mikrodata.

Link
Yahoo Search Blog.
Googleblog.

1 kommentar:

Morten sagde ...

Virkelig spændende læsning det her.