tirsdag den 25. november 2003

Indbyggede problemer i søgemaskinerne.
I de sidste 3-4 år har søgemaskinerne groft sagt ikke udviklet sig kvalitativt. De har forfinet deres søgekvaliteter, men ikke i væsentlig grad. Der er ingen tvivl om at Google pagerank-system betød et kvalitativt spring frem. Altså princippet med at jo flere der linker til en side, desto højere vil den blive anbragt på listen over søgeresultater. Men systemet har nogle dårlige sider som webmastere udnytter. De er kort sagt blevet dygtigere til at konkurrere for at komme til tops på listerne for at promovere deres sider. Men det er ikke altid, faktisk sjældent, til gavn for internetsøgere.
Nedenfor nogle eksempler på denne udvikling. Meningen med at nævne disse problemer er at det irriterer stadig flere internetsøgere. Ved at gøre opmærksom på det, kunne vi måske påvirke søgemaskinemagerne til at forbedre deres teknik. Selv kan vi dog godt kompensere for nogle af ulemperne, men som oftest må vi resignere og vente på at søgemaskinerne leverer os noget andet værktøj at arbejde med.
Pagerank favoriserer debat, handel, spørgesider m.v.
Her er et af de svageste punkter ved princippet om at jo flere der linker til ens side, desto højere kommer siden til tops: Enhver der har søgt på Google for nyligt, vil opdage at listerne bliver mere og mere fyldt med henvisninger til sider hvor der er debatter, spørgsmål/svar (mest irrelevante i forhold til det man søger på), weblogs, kommercielle sider (internethandel) og lignende sider. Det som man har søgt på, omtales så kun i ganske få linjer. Dette skyldes at disse sider har få, men aktive brugere. Det kan være debatsiger som der linkes til fordi debatdeltagerne ønsker at gøre opmærksom på sig selv. Det kan fx være en internetside uden anden information end tusindvis af debatindlæg fra enten fanatiske bilister eller fanatiske cyklister.
Internethandelssiderne er et helt kapitel for sig. Ofte vil internetsøgere komme ud for at skulle have noget at vide om en bestemt kunstner, en musiker, forfatter, eller et emne som samtidig kan være et handelsprodukt (alt fra stueplanter, automobiler og bøger). På grund af de mange links til internethandler som Amazon.com, Ebay, planteskoler, gartnerier osv. osv. vil internetsøgeren blive bestormet med fund om hvor man kan købe en bog, cd eller en stueplante. Selv om man sådan set bare ønskede at vide noget om emnet – ikke prisen og hvor man kunne købe noget!
Producenters udnyttelse af pseudonymer
Mange produkter (især fra USA) som sælges via internettet, har (eller har taget) navn efter populære søgeord så de derved kommer på intetanende internetsøgeres fundlister. Det kan være firmaer fra før internettet såsom Apple eller fra efter såsom Voodoo. Her er internetsøgere dog ikke helt magtesløse: Ved enten at benytte ikke-kommandoer eller ved at indskrænke sine søgninger med flere emneord vil det som regel være muligt at udelukke disse sider. Men det kræver altså lidt ekstra tænkearbejde. Et eksempel på at udelukke sider med ikke-kommandoer kunne være: voodoo –digital, eventuelt også udelukke internethandlende med –site:com. Ved at putte emneordet haiti bag voodoo får man også indskrænket sin søgning betydeligt. Andre gange er det ikke så enkelt, idet det kan være svært at afgøre hvad det er der forurener ens søgning.
Seriøse sider gemmes i pdf
Et tredje problem er den måde som seriøse forskere publicerer deres materiale. I bedste mening for at præsentere stoffet så fint som muligt gør de sig stort umage med at lave pdf-filer eller lægger deres dokumenter ned i databaser ligesom aviserne lægger deres avisarkiver derned. I tilfældet pdf vil deres dokumenter blive rangeret meget lavt, da mange søgemaskiner overhovedet ikke registrerer pdf-filer, og hvis de gør, da kun indekserer en meget lille del af tekstmængden fordi det drejer sig om meget store filer. Og i bedste fald er der få eller ingen links til disse sider, hvorfor de måske slet ikke bliver fundet af søgemaskinerne – og hvis de gør: bliver rangeret meget lavt.

mandag den 17. november 2003

Nyheder med søgemaskiner, oversigter over onlinenyhedsmedier m. m.
Internetsøgning har fire gange før skrevet om hvordan man finder nyheder. (Bl.a. 8. oktober 2002). Her er en kraftigt udvidet revision og sammenskrivning af disse indslag.
Det er vigtigt at huske at mange af mediernes materialer er i det usynlige internet, dvs. i databaser. Hvilket igen betyder at man ikke vil kunne finde dem via de almindelige søgemaskiner. På almindelige søgemaskiner vil man kun finde de slagnyheder som aviserne har valgt at bringe på deres onlineudgaver. Det vil derfor for det meste kunne betale sig at finde et medie som har en søgefunktion så man kan finde artikler, film, indslag mv. i mediets database. Fx et avisartikelarkiv.
Overblik over nyheder på internettet:
Search Engine Watch giver et godt overblik over nyhedssøgemaskiner, specialsøgemaskiner og medier med abonnement.
www.searchenginewatch.com/links/news.html Search Engine Watch’ links til nyheder.
Danske aviser, medier m.m.
Danske Jubiis guideoversigt, under overskriften Medier giver oversigter over: Danske, europæiske og internationale aviser, radio og tv. Speciel interessant fordi den har danske medier af enhver slags, fra landsdækkende aviser til små lokale blade. De vil normalt ikke kunne findes på de nedennævnte udenlandske oversigter.
soeg.jubii.dk/guide Jubii’s emneguider.
Internationale oversigter:
ABYZ Newslinks er en geografisk inddelt oversigt over samtlige lande. Fortrinsvis aviser, men der er også radio og tv, internetmedier, magasiner og pressebureauer. Siden er rimelig godt opdateret, dvs. der er få døde links. Sprogene er overvejende engelske medier. Det er let at orientere sig i medietype, interesse, sprog og om det er landsdækkende eller lokalt. Her kan du bl.a. finde en af de mest berømte internetmedier, nemlig BBC.
Den svenske Kiosken har links til ca. 16.000 medier geografisk inddelt efter kontinent, herefter land. Man bliver dog ofte skuffet med at linket ikke virker. Desuden angiver de ikke mediets sprog.
All You Can Read påstår at have den største mængde, og tallet 26.500 magasiner og aviser er da også imponerende. Inddelingen er nogenlunde som de to ovennævnte. Den har en noget anderledes søgefunktion og så er den temmelig plastret til med annoncer og reklamer.
Journalistlinks er en dansk side med en masse links til nyhedsstof. Siden er lavet for journalister, men "almindelige" nyhedsinteresserede kan sagtens finde mange interessante links her.
Journalism Net er et andet websted for journalister. Det linker ikke til så mange medier, men er snarere en slags værktøjskasse for aktive journalister.
www.abyznewslinks.com Abyz Newslinks. International medieoversigt
www.esperanto.se/kiosk Den svenske Kiosken. International medieoversigt
www.allyoucanread.com All You Can Read. International medieoversigt.
www.journalistlinks.dk. Dansk side for journalister
www.journalismnet.com Journalism Net. Journalisternes værktøjskasse
Søgemaskiner med nyhedssøgning:
Altavista: Vælg fanebladet ”News” over søgefeltet. Har en snes hovedemner. Men ingen danske medier. En virkelig god nyhedssøgning!
Alltheweb: Vælg fanebladet ”News”. Kan afgrænse til 49 sprog. Mange danske aviser.
Google: Meget stor, men få afgrænsningsmuligheder. Ingen danske aviser. Kategorier. Begrænset avanceret søgning. 4.000 nyhedskilder. Gemmer 1 måned.
Yahoo: Meget avanceret søgninger med gode afgrænsningsmuligheder.
Man skal passe på med kun at nyhedssøge i søgemaskinernes nyhedssøgning – prøv også almindelig websøgning! Faktisk kan almindelig websøgning i flere tilfælde være bedre end søgemaskinernes nyhedssøgninger! Søgemaskinernes nyhedssøgning har på forhånd udvalgt nogle nyhedsmedier som de henter deres oplysninger fra. Google News og Altavista News vil ikke i klammeri med landenes lovgivninger om dybe links. Men de indekserer jo websider. Og ajourfører jævnligt. Også nyhedssider. Det er forvirrende at man altså ikke bare skal søge nyheder ved søgemaskinernes nyhedssøgning, men også gennem almindelig websøgning. Men hvis bare man ved det, kan man i det mindste tage højde for det!
www.alltheweb.com Oprindelig norsk søgemaskine med nyhedssøgning
www.av.com Altavista. Ordsøgemaskine med nyhedssøgning.
news.google.com Google’s nyhedssøgning
news.yahoo.com Yahoos nyhedssøgning
Søgemaskiner til dagsaktuelle nyheder:
Der findes ganske mange søgemaskiner som har specialiseret sig i at søge efter nyheder. De fleste af dem er begrænset af at de kun søger i de flygtige artikler som medierne selv har valgt at bringe på det synlige internet. Hvilket man skal være opmærksom på: Der er intet som kan erstatte en artikelsøgning i en avisartikeldatabase!
Her er imidlertid et lille udvalg af de som jeg mener er de bedste til formålet:
Daypop bringer dagens nyheder fra 7.500 aviser, magasiner og weblog. Avanceret søgning med afgrænsning på nogle sprog (ikke dansk), lande (bl.a. Danmark) og 4 typer af kilder. Daypop søger i 17.000 aviser, online-magasiner og weblogs verden over (man kan søge i enten det ene eller det andet. Eller begge dele på en gang). Tidsmæssigt synes den at gå ca. 1 uge tilbage. Den påstår at gennemse disse websteder mindst en gang om dagen. (Det holder nu ikke altid stik. Daypop er et enmandsforehavende – Daniel Chan. Hvis han er optaget andetsteds, ja så er der intet at gøre!)
Rocketnews eller Rocketinfo søger aktuelle nyheder op til 5 dage gamle i over 6.000 internetkilder. Ringe avanceret søgning. Tilsyneladende ingen danske kilder.
World News er en søgemaskine som har en god avanceret søgning, bl.a. kan man indstille til at søge på danske nyheder og på hvor mange dage man vil gå tilbage. Den bærer dog noget præg af at den skal servicere folk fra USA om hvad der sker rundt omkring i verden.
www.daypop.com Enmandssøgemaskinen Daypop over flygtige nyheder
www.rocketnews.com Rocketnews, søgemaskine til nyheder, weblogs m.v.
www.worldnews.com World News. Søgemaskine til dagsaktuelle topnyheder.
Tidsskrifter, magasiner mv.
Aviser er gode til nyheder, men ofte har man også brug for noget mere dybtgående, fx magasiner eller tidsskrifter. Også disse kan man finde online og i fuldtekst.
Find Articles er en fuldtekstdatabase over indholdet i ca 300 tidsskrifter og magasiner. Det er som oftest meget grundige artikler man finder. Det er ikke de helt store og anerkendte tidsskrifter, men mere på mellemplan. Populærtidsskrifter er ikke med.
Mag Portal ligner lidt Find Articles. Det er både et emnekatalog og en ordsøgemaskine.
Disse søgemaskiner er specialiserede i at søge på artikler. Også andre søgemaskiner til det usynlige internet kan søge artikler, men her får man så altså også andre former for dokumenter med.
Endelig findes der et hav af tidsskrifter på internettet som ikke bliver indekseret nogen steder. For de fleste af disses vedkommende skal man kende tidsskriftet for at kunne finde dets arkiv. Hvilket jo kan være vanskelligt hvis man bare vil søge på et emne. Lidt hjælp er der at hente i Københavns Kommunes Bibliotekers bibliotekssøgesystem. Her henvises fra de trykte tidsskriftudgaver til internetudgaven (i det omfang en sådan findes). Fordelen ved denne metode er at den fortrinsvis finder danske tidsskrifter!
www.findarticles.com Find Articles. Fuldtekstdatabase med tidsskriftartikler.
www.magportal.com Mag Portal.
www.bibliotek.kk.dk Københavns Kommunes Bibliotekers hjemmeside.

tirsdag den 11. november 2003

Hvad betyder søgemaskinernes navne?
Har du nogensinde undret dig over hvorfor søgemaskinerne hedder det de gør? Det har Chris Sherman fra Search Engine Watch (9. oktober 2003) sat sig for at besvare.
Generelt er søgemaskinerne navngivet ud fra tre principper: funktionelle navne, ord fra ikke-engelske sprog og iøjnefaldende navne.
Her er resultatet, i alfabetisk orden:
Alltheweb: Med norsk oprindelse blev kaldt sådan fordi det var firmaets intention at dække hele internettet
Altavista: er spansk og betyder bl.a. overblik. I søgemaskinens første år var der en strid mellem et firma med samme navn og søgemaskinens ophavsfirma, Digital – som måtte betale 3,3 mio dollars for eneret til domænenavnet.
Ask Jeeves: Er opkaldt efter romanforfatteren P. G. Wodehouse’s romanfigur, butleren Jeeves. Fordi intentionen med søgemaskinen oprindeligt var at man skulle kunne søge med sætninger. Som Altavista røg Ask Jeeves ud i en juridisk fejde med forfatteren…
Google: Er en kreativ videreudvikling af ordet ”Googol”. Som er det matematiske ord for et 1-tal fulgt af 100 nuller. Og hentyder til det atronomiske tal af information som Google åbenbart stræber efter. Oprindeligt hed Google BackRub.
Hotbot. En “bot” er en afsnappet form af robot. Det er vel almindeligt kendt at søgemaskiner bruger søgerobotter til at hente data på internettet. Hot giver sig selv.
Inktomi: Denne kan almindelige mennesker ikke søge i, men den sælger sine data til andre søgemaskiner. Ordet kommer fra en indianerlegende (lakota-stammen). Her er Inktomi en lurendrejer-edderkop som blev kendt for evnen til at overvinde overlegne modstandere gennem kløgt og list. Edderkopper hentyder til at søgemaskiner ud over robotter også bruger noget mekanik som populært kaldes Spider (edderkop), lige som web betyder spind, fx et edderkoppespind.
Looksmart: Hentyder både til den smarte måde som den har opbygget sit emnekatalog – og til de folk som vælger at bruge søgemaskinen!
Lycos: Er opkaldt efter lycosidae, det latinske navn for jagtedderkopper. De bygger ikke spind, men jagter byttet. Tarantellen er vist den mest kendte. Jf. edderkoppeforklaringen under Inktomi. Navnet passer ikke længere, idet Lycos nu reelt bruger Alltheweb!
Teoma: Er gælisk ord for ekspert. Som hentyder til to af søgemaskinens varemærker: Evne til at finde sider med links og til at analysere søgeordene.
Yahoo: Er et akronym for “Yet Another Hierarchical Officious Oracle”, men hed oprindeligt "Jerry's Guide to the World Wide Web". Stifterne d’herrer Chief Yahoos Yang og David Filo påstår imidlertid at de slog ordet op i en ordbog og faldt for den almindelige definition: primitiv, simpel, besynderlig. Litteraturinteressede vil måske erindre at yahooer er de ulækre menneskelignede væsner i Swifts Gullivers Rejser i landet hvor rollerne mellem heste og mennesker er byttet om. Navnet inspirerede til den danske søgemaskine Jubiis navn (den er i øvrigt nu ejet af Lycos).
Og nu vi er ved det danske: for egen regning kan tilføjes om danske og skandinaviske søgemaskiners navne:
Kvasir og Sol: Er opkaldt efter en mand fra den nordiske mytologi: Kvase, Kvaser eller Kvasir, en mand skabt af vaners og asers spyt. Fordi Kvasir var skabt af gudespyt, var han så klog at ingen kunne spørge om noget han ikke kunne svare på. Nogen må have fortalt firmaet at det nok var en af de mere ukendte i den nordiske mytologi, for nu om stunder er Kvasir mest kendt under navnet Sol.
Link:
www.searchenginewatch.com
www.oslo.net/historie/kvasir-info.html Om Kvasir og Sol

onsdag den 5. november 2003

Uddannelser på internettet.
Uddannelsesmarkedet er stort i Danmark. Og det ændrer sig hurtigt. Groft sagt er det opdelt i de statsanerkendte uddannelser (officielle) og de ikke-anerkendte uddannelser (private og uofficielle uddannelser). Mens det første er nogenlunde til at orientere sig i, er det sidste temmelig uoverskueligt.
Et godt råd til lidt ældre som før i tiden var velbevandrede i uddannelsessystemet: Tag ikke din viden for givet! Det har sikkert ændret sig. Her er et prøvespørgsmål: Hvor lang tid tager det i dag at blive cykelsmed (eller cykelmekaniker som det hedder nu?). Svaret fås nederst.
Under alle omstændigheder: Der findes ikke nogen helt overordnet portal for samtlige uddannelser i Danmark. Man er nødt til at bruge flere!
Det officielle uddannelsessystem
kan ses i overskuelig form på Undervisningsministeriets hjemmeside (se nederst). Den indeholder også tilhørende stof. Et godt tip er at finde de overordnede portaler som findes for stort set alle typer uddannelser som fx Vidar for voksenundervisning, Efteruddannelse for AMU, CEU og CVU og Ivu-C for videregående uddannelser. Ministeriet udgiver hvert år ”Uddannelse på kryds og tværs”.
Andre generelle oversigter over officielle og uofficielle uddannelser er på Københavns Kommunes Bibliotekers hjemmeside. Den er også god hvis man vil studere i udlandet. Den henviser til andre oversigt på fx Jubii og Yahoo!
Uddannelsesnævnet tager sig af detailhandel, kontor og handel, herunder elevansættelser og praktikophold i udlandet (for offentlige praktiksteder, se under publikationer, kontoruddannelsen, information).
Endelige har danmark.dk under samfundsnøglen, uddannelser en udmærket oversigt. Siden har også en ret god søgefunktion.
Det uofficielle uddannelsessystem.
Er som nævnt svært at få et samlet overblik over. Det går fra alt fra længerevarende skoleophold til korte kursus i stort set hvad som helst.
En metode er at bruge forskellige emnekataloger som kan finde danske sider. Det er fx Open Directory (Dmoz). Søg med ordet uddannelser for en oversigt over en halv snes hovedemner (EDB, sundhed, alternativ m. fl.). Yahoo har flere kategorier, se fx under Voksen- og efteruddannelse. Det samme gælder Jubii. Se fx under Diverse, øvrige uddannelser. Inddelt efter emner.
Der er også specialiserede hjemmesider som fx Alternativ Info’s oversigt over uddannelser inden for fx komplementærterapi, massage, clairvoyance, kinesiologi og andet.
Legater, uddannelsesstøtte o. lign.
De fleste studerende mangler penge! Desværre findes de fuldstændige fondsfortegnelser kun i bogform eller cdrom. Men der er dog også andre muligheder. Igen findes der på Københavns Kommunes Bibliotekers uddannelsesside under menuen Vejledning og støtte en oversigt. En tilsvarende oversigt kan ses på legater.sol.dk Danmark og udlandet for studerende. Her kan man også se hvordan man søger legater (ansøgninger mv.). Se under Gode råd og Eks. på ansøgning.
Ny er Legatnet. Den er meget lille, indeholder 200 legater, men vil muligvis vokse. Kræver registrering med bl.a. cpr-nummer. Siden er dog ret officiel, så måske er der ikke problemer? Er man registreret bruger, er det muligt at søge på legatnavn, formål, gennemført/igangværende og fremtidig uddannelse.
Og så lige svaret på det med cykedsmeden: Det tager 3 år og 6-9 måneder.
Links:
www.uvm.dk/sitemap Undervisningsministeriets grafiske oversigt over uddannelsessystemet i Danmark.
ub.uvm.dk/2003/kryds Undervisningsministeriets årlige oversigt
www.vidar.dk Voksenundervisning
www.efteruddannelse.dk AMU, CEU og CVU
www.ivuc.dk God til erhvervsvejledning på videregående uddannelser
bibliotek.kk.dk/uddannelse/job/index_html Københavns Kommunes Bibliotekers uddannelsesoversigt.
www.uddannelsesnaevnet.dk Uddannelsesnævnet.
dmoz.org/World/Dansk Open Directory, Dmoz emnekatalog
dk.dir.yahoo.com/Uddannelse Yahoo’s danske udgave, emnekatalog
soeg.jubii.dk/guide/studie Jubii emnekatalog
www.alternativinfo.dk/public/b_index/uddan.htm Alternativ Info
legater.sol.dk Sols legater
www.legatnet.dk Legatnet (Obs: kræver registrering, bl.a. cpr-nummer)