onsdag den 7. februar 2007

Oversættelser på WWW

Oversættelser er et fascinerende emne på internettet. Ikke nok med at du har adgang til milliarder af materialer, du vil også være i stand til at oversætte dem selv fra sprog som du ikke forstår.
Der er groft sagt to hovedretninger inden for oversættelsesteknik: Ord-for-ord og mening-for-mening. Hvor den første nærmest maskinelt oversætter ord, forsøger den sidste at oversætte meningen med sætninger og helheden i teksten. De fleste oversættelser rummer elementer fra begge.
Hvordan oversætter man mening for mening på internettet, når det eneste vi indtil videre har til rådighed er maskiner, og hvor perspektiverne for at oversætte på anden vis er håbløse? De hidtidige løsninger som Systrans Babelfish er ord for ord. De bygger så igen på tilgængelige oversættelsesordbøger. Hvilket bl.a. betyder at der ikke er nogen danske. Danmark er, hvor gerne vi end vil fremstille os som teknologisk avancerede, nærmest et uland hvad angår internettet.
Google er mig bekendt eneste bud på en maskinel oversættelse mening-til-mening. Groft sagt går deres bud ud på at udnytte søgemaskinens enorme indeks til at sammenligne sider hvor teksten forekommer på flere sprog. Altså udnytte oversættelser som allerede eksisterer. For internettets skyld kan man håbe at ideen er farbar og giver et godt resultat. Men en undersøgelse omtalt i Wired (og formidlet gennem Google Blogoscoped) tegner ikke godt. Om end der er sket kæmpefremskridt de seneste 5 år.
En undersøgelse foretaget af National Institute of Standards and Technology lavede en sammenlignende undersøgelse mellem hvad en professionel oversætter, Google’s oversætter og Systran kunne præstere. Resultaterne viste menneskets overlegenhed med en score på mellem 0,7 og 0,85 på oversættelser på kinesisk og arabisk. Google scorede pænt, 0,51, mens Systran kun scorede mellem 0,11 og 0,15.
Nogle vil måske gnide sig i hænderne og godte sig over at Google her endelig har mødt sin grænse. Men for internetsøgere generelt er det en trist meddelelse. For hvad er så fremtiden for at få oversat internetsider fra et sprog til et andet? Internettet er så enormt og kæmpestort at manuelle løsninger synes umulige.
For interesserede i oversættelser og hvor langt teknologien i det hele taget er nået, er artiklen fra Wired et must. Det er den eneste jeg har set som afdækker hvor langt vi i dag er nået med oversættelser. Derudover: Læs også den opfølgende artikel i Google Blogoscoped.
Link
Wired undersøgelse.
Opfølgende artikel i Google Blogoscoped.

Ingen kommentarer: