Oprindelig blev dette arbejde udført af entusiaster for forskellige sprog. Bloggen nævner svensk, tysk, græsk, hebraisk og andre (som sædvanligt ikke dansk). I dag er denne stab så udvidet betydeligt.
Første skridt er at få fat i en betragtelig mængde dokumenter i et specielt sprog, fx officielle dokumenter. Næste er så at inddrage læserne ved at give dem mulighed for input på forskellige semantiske områder:
- Stavekontrol.
- Accenttegn og andre bogstavtilføjelser.
- Synonymer.
- Sammensatte ord (ord konstrueret ved at sætte flere selvstændige ord sammen).
- Bøjningsendelser.
De sproglige tilpasninger kan være komplicerede i sig selv. Men derudover prøver Google også at tilpasse sig geografisk. Altså de tilfælde hvor en søgning formentlig på forhånd er forventet at give et lokalt resultat, selvom der vil være adskillige andre internationale muligheder.
Bloggen nævner at Google arbejder med mere end 100 sprog.
Link
Googleblog.
Ingen kommentarer:
Send en kommentar