torsdag den 18. december 2008

Google verden rundt

Googleblog har i serien om Google bag kulisserne beskæftiget sig med den international approach. Mange af de generelle søgemekanismer gælder også for specifikke sprog. Men nogen må tilpasses. Bloggen giver eksempler på at selv inden for sprogområdet engelsk er der forskelle på amerikansk-engelsk og engelsk-engelsk. Ligesom der er det på brasiliansk-portugisisk og portugisisk-portugisisk.
Oprindelig blev dette arbejde udført af entusiaster for forskellige sprog. Bloggen nævner svensk, tysk, græsk, hebraisk og andre (som sædvanligt ikke dansk). I dag er denne stab så udvidet betydeligt.
Første skridt er at få fat i en betragtelig mængde dokumenter i et specielt sprog, fx officielle dokumenter. Næste er så at inddrage læserne ved at give dem mulighed for input på forskellige semantiske områder:
  • Stavekontrol.
  • Accenttegn og andre bogstavtilføjelser.
  • Synonymer.
  • Sammensatte ord (ord konstrueret ved at sætte flere selvstændige ord sammen).
  • Bøjningsendelser.
Derudover prøver Google også at tage højde for de små detaljer i sprogene, de forskellige keyboards.
De sproglige tilpasninger kan være komplicerede i sig selv. Men derudover prøver Google også at tilpasse sig geografisk. Altså de tilfælde hvor en søgning formentlig på forhånd er forventet at give et lokalt resultat, selvom der vil være adskillige andre internationale muligheder.
Bloggen nævner at Google arbejder med mere end 100 sprog.
Link
Googleblog.

Ingen kommentarer: