mandag den 26. september 2005

Ebogssøgemaskine (beta)
Med en vis spænding præsenteres her en ny ebogssøgemaskine. Det tekniske lavet af Thor fra it-biblioteket, ideen er Internetsøgnings administrator.
Baggrunden for søgemaskinen er åbenbar: Søgemaskinernes databaser er gigantiske og der er ingen ende på væksten. Det gør det overordentligt vanskeligt at præcisere søgninger. Ordsøgninger og brug af booleske operatorer er i langt de fleste tilfælde ikke særligt præcise. Der er behov for lange og komplicerede søgestrenge. Men hvorfor ikke genbruge sådanne søgestrenge? Fx når man skal søge efter ebøger. Konkret: et søgefelt hvor man blot skal tilføje det variable søgeelement (fx forfatter- eller titelnavn), mens de konstante er indbygget i søgefeltet.
Det sker fx på Google University og Google Scholar. Her søger man med en på forhånd defineret søgestreng og i en afgrænset del af databasen.
Thor fra It-biblioteket har konstrueret en søgemaskine som automatisk søger efter e-bøger. De er svære at finde på internettet. Nogle er samlet på fx ebogscentret eller Gutenberg. Sværere er det at finde alle de andre mange sider, hvor nogen har lagt ebøger ud.
I de fleste søgemaskiner kan man bruge den højst besværlige søgestreng
[ -inurl:htm -inurl:html intitle:"index of" +("/ebooks"|"/book") +(chm|pdf|zip) ]
(Den har tidligere været omtalt her på Internetsøgning). Den søgestreng genbruger Thors søgemaskine. Nu er det tilstrækkeligt fx bare at skrive på H C Andersen. Eller med hans engelske navneform Hans Christian Andersen, så skriv det i stedet:
[ hans christian andersen ]
Man vil med rette kunne indvende at dette ikke er den ultimative søgestreng til at finde ebøger på internettet: for det første finder den ikke alt, for det andet er det den finder ikke nødvendigvis alt sammen ebøger og for det tredje er der næsten ingen danske med. Det sidste er ikke søgemaskinens skyld. Det skyldes at der er meget få danske ebøger tilgængelige på internettet.
Til det er at sige at det nu engang de vilkår, som er på internettet: det vil aldrig blive indekseret på samme bibliografiske måde som fx bøger eller musikcder. Det er en fysisk umulighed. Så det er bare med at komme i gang med at bruge de redskabet vi nu har. Og kik i stedet en ekstra gang på resultaterne: den finder ganske meget! Jeg er ikke i tvivl om at der vil være behov for mere den slags i fremtiden. Og vi eksperimenterer selvfølgelig videre med den for at forfine og udvide!
Først og fremmest er ideen vigtig. Forhåbentlig vil den sætte gang i kreative forslag til forbedringer, supplerende søgestrenge o. lign. Fx udvide den til også mere effektivt at kunne søge danske gratis ebøger. Foreløbig er søgemaskinen placeret på linket nedenunder.
Link
Ebogssøgemaskine.

1 kommentar:

Søren Johannessen sagde ...

Hej Erik og til dels Thor -

Synes I mangler nogle e-book formater i søgestreng fx Microsoft Reader (LIT). Andre måske mere bizare og ikke så kendte formater kan nævnes

Franklin [.FUB], Hiebook [.KML], Isilo [-IS.PDB], Mobipocket [.PRC], Palm Doc [.PDB], Rocket [.RB], eBookwise-1150 [.IMP], REB 1200/GEB 2150 [.IMP]