torsdag den 25. oktober 2007

Google Translate - igen

Ifølge Google egne oplysninger skulle Google Translate nu understøtte en række sprog på den specielle mening-til-mening-oversættelse. Det drejer sig om engelsk til/fra arabisk, fransk, italiensk, kinesisk, koreansk, portugisisk, russisk, spansk og tysk. Samt ydermere tysk til/fra fransk.
Google Blogoscoped har prøvet at undersøge om det er rigtigt, og synes at hælde til at Google Translate er en anelse bedre end Systran/Babelfish. De eksempler som Google Blogoscoped har udvalgt, er nogle hårde nødder at knække. Jeg har lavet nogle tilsvarende fra spansk, og jeg er ikke ekspert, men jeg er tilbøjelig til at give Google Translate en anelse bedre score end Babelfish.
Hertil skal dog også tilføjes, at hvis Google Translate allerede nu er fuldt på højde på Babelfish, så lover det godt. For mens Babelfish formentlig ikke udvikler sig, så vil Google Translate blive bedre og bedre alt efter hvor meget erfaringsmateriale der bliver lagt ind i den.
Her er mine to test af tekster. Den første er fra et spansk biblioteks hjemmeside:
Den spanske originaltekst lyder sådan:
La red de Bibliotecas del CSIC está formada por 96 bibliotecas especializadas ubicadas en los centros de investigación del CSIC. Su misión es dar soporte a la excelencia científica, garantizando a la comunidad científica del CSIC el acceso a la información. La dirección y gestión de la Red recae en la Unidad de Coordinación de Bibliotecas, responsable de su coordinación y desarrollo, así como del control y gestión de su automatización.
I Google Translates automatically translated-version til engelsk lyder den sådan:

The network of libraries CSIC consists of 96 specialized libraries located in the research centers of the CSIC. Its mission is to support scientific excellence, ensuring the scientific community CSIC access to information. The direction and management of the network lies with the Unit for the Coordination of Libraries, which is responsible for coordination and development, as well as control and management of its automation.
Der er kun nuanceforskelle til Babelfish' ord-til-ord-oversættelse, men måske lidt bedre hos Google:
The network of Libraries of the CSIC is formed by 96 libraries specialized located in the research centers of the CSIC. Its mission is to give support to the scientific excellence, guaranteeing to the scientific community of the CSIC the access to the information. The direction and management of the Network fall to the Unit of Coordination of Libraries, person in charge of its coordination and development, as well as of the control and management of its automatization.
Dette skulle repræsentere en lidt tør fagtekst. Over for den valgte jeg så en skønlitterær tekst, her en spansk oversættelse af H. C. Andersens Den grimme ællling til engelsk. Den spanske tekst lyder sådan:
Se lanzó al agua. "Cuac, Cuac", dijo, y uno tras otro los patitos se lanzaron tras ella. El agua les cubrió las cabezas, pero salieron de nuevo y flotaron maravillosamente. Sus patitos se movieron solas, y hasta el patito feo y gris nadó con ellos.
Skønlitterære tekster burde være endnu sværere end faglitterære pga. billedsprog, metaforer osv. Også talesproget Cuac er en udfordring. Her kommer først Google Translates bud:
It was launched into the water. "Cuac, Cuac" he said, and one after another the Ducks were launched after it. The water they covered their heads, but came back and float beautifully. The Ducks moved alone, and even the ugly duckling and gray nadó with them.
Afsløret er her et åbenlyst problem med spansk: Udsagnsordene underforstår hvem det er, og her er altså oversat med it. Det har Babelfish klaret lidt bedre, men til gengæld er den øvrige tekst ret uforståelig:
It was sent to the water. "Cuac, Cuac", said, and one after another one the patitos were sent after her. The water covered the heads to them, but they left again and they floated wonderfully. Their patitos moved single, and until the ugly and gray patito it swam with them.
Det med rødt er de udtryk som enten er dårligt sprog eller direkte forkert. Resten af teksten er ikke nødvendigvis korrekt engelsk, men dog så forståeligt at det giver mening.
Under alle omstændigheder ville det være fint hvis Googles oversættelsesprogram kunne forbedre maskinoversættelser. Lad os i det mindste håbe at det kan den.
Link
Google Blogoscoped.
Google Translate om Language Pairs.
Internetsøgning om Google Translate.
Babelfish.

Ingen kommentarer: