torsdag den 29. marts 2007

Oversættelser af internetsider

Scientific American har en længere gennemgang af Google’s oversættelseskoncept. Tidligere har jeg omtalt de forskellige koncepter af oversættelse (februar 2007). Kort fortalt, så er der to hovedretninger: En som bygger på ord-til-ord-oversættelser fra ordbøger (dvs. sprogspecialister), og en som bygger på mening-til-mening ud fra sammenligninger af sider skrevet på to eller flere sprog. (I Googles sprogbrug: Statistical Machine Translation).
Artiklen fortæller lidt nærmere om hvad Google maskinoversættelser går ud på. Ifølge Google selv skulle dette være en væsentlig bedre måde at oversætte på. Der er selv på Google delte meninger om hvor godt systemet virker.
Oversættelserne bygger især på documenter fra FN og EU. Her findes jo netop parallelle tekster for de 21 EU-sprog. Andre lande især fra Afrika vil nok skulle vente endnu en rum tid før der er brugbare oversættelser. Men indtil videre omfatter programmet oversættelser til/fra arabisk, kinesisk, russisk og engelsk, mens tredjeparts software leverer til andre sprog som fx tysk.
Artiklen fortæller også at Google’s kontor består af 3 ansatte, i spartansk udstyrede kontorer. Det hele foregår bogstaveligt talt i maskiner.
Miles Osborne, professor ved University of Edinburgh, har brugt et sabbatår på at arbejde på Googles projekt. Han roser det, især det arabisk-engelske, men har dog også forbehold. Bl.a. mener han at det aldrig vil overgå mennesket selv, således som det fx er set indenfor skak. Google’s Eric Schmidt ser politiske konsekvenser af lette oversættelser, bl.a. for bedre forståelse mellem forskellige sproggrupper.
Link
Artikel i Scientific American.
Tidligere indslag på Internetsøgning 20. februar 2007.

Ingen kommentarer: