Kysymykseen on tietenkin mahdotonta vastata, sillä se riippuu niin monesta tekijästä. Sama teksti olisi käännettävä sekä konekääntimellä että tekoälyllä ja mitattava käännösten jälkieditointiin kuluva aika. Tämän jälkeen teksti pitäisi vielä kääntää perinteisellä tavalla ja mitata siihen kuluva aika. Ja juuri näin olemme tehneet!
Muistutetaanpa ensin, miten konekääntimet eroavat tekoälykääntimistä. Molemmat ovat automaattisia käännösteknologioita, joilla on pyritty vähentämään kääntämisessä tarvittavaa ihmisen työpanosta. Niillä on kuitenkin hieman eri toimintamekanismit.
Nykyiset neuroverkkopohjaiset konekääntimet (NMT) on koulutettu valtavalla määrällä kaksikielisiä tekstejä, ja ne pyrkivät ennakoimaan, mikä olisi todennäköisin käännösvaihtoehto. Tästä syystä konekäännin on juuri niin laadukas kuin sen kouluttamiseen käytetyt käännökset, eikä se ole kovin taitava tunnistamaan asiayhteyksiä.
Tekoälykääntäminen puolestaan hyödyntää laajoja kielimalleja (LLM). Tekoälyohjelmat on koulutettu suurella määrällä tekstidataa, ei pelkästään käännösdatalla. Ne eivät käännä pelkästään lausekohtaisesti vaan ottavat huomioon asiayhteydet ja jopa tekstin sävyn. Ne myös oppivat jatkuvasti tekstiin tehtyjen korjausten ja muokkausten pohjalta.
Katsotaanpa sitten, millaisia eroja on konekääntimen (Google Translate) ja tekoälyn (ChatGPT) tuottamien käännösvaihtoehtojen välillä. Lähdetekstiksi valikoitui oheinen englanninkielinen tekstinpätkä, jonka olemme aiemmin kääntäneet suomeksi eräälle tunnetulle kosmetiikkabrändille:
Intensely nourishing ‐ Comforting
Ultra-concentrated with 25% shea butter, this universal cream that melts into your skin offers instant comfort to (very) dry and sensitive skin and leaves it nourished for 48 hours.
The skin seems instantly soothed, stronger and better protected from external aggressions, such as extreme cold.
Lähdeteksteissä on toisinaan kirjoitusvirheitä ja vastaavia, jotka voivat tuottaa vaikeuksia konekääntimelle ja tekoälylle. Tässä tapauksessa ainoa suoranainen virhe liittyy otsikon yhdysmerkkiin (-), jonka tulisi olla ajatusviiva ( – ).
Näin kuuluu Google Translaten käännösversio:
Voimakkaasti ravitseva ‐ Lohduttava
Ultratiivistetty 25 % sheavoita sisältävä yleisvoide, joka sulaa ihoon, tarjoaa välitöntä mukavuutta (erittäin) kuivalle ja herkälle iholle ja jättää sen ravituksi 48 tunniksi.
Iho näyttää välittömästi rauhoittuneelta, vahvemmalta ja paremmin suojatulta ulkoisilta vaikutuksilta, kuten äärimmäiseltä kylmältä.
Konekäännin ei tässä tapauksessa osannut korjata edes otsikon ajatusviivaa. Lisäksi otsikko on käännetty erittäin kirjaimellisesti: adjektiivit ravitseva ja lohduttava sopisivat ennemmin kuvaamaan äidin makaronilaatikkoa kuin kasvovoidetta. Ilmaukset kuten ”jättää sen ravituksi 48 tunniksi” eivät kuulosta luontevalta suomelta, vaan lauserakenteissa näkyy selvästi englannin vaikutus.
Tässä puolestaan ChatGPT:n käännösversio:
Syväkosteuttava – Rauhoittava
Tämä 25 % sheavoita sisältävä erittäin täyteläinen yleisvoide sulaa iholle tarjoten välitöntä helpotusta (erittäin) kuivalle ja herkälle iholle sekä kosteuttaa ja ravitsee ihoa jopa 48 tunnin ajan.
Iho tuntuu välittömästi rauhoittuneelta, vahvemmalta ja paremmin suojatulta ulkoisia ärsykkeitä, kuten äärimmäistä kylmyyttä, vastaan.
Plussaa siitä, että tekoäly osasi korjata yhdysviivan ajatusviivaksi! Tekstin otsikko ja ensimmäinen virke kuulostavat muutenkin järkevältä ja sujuvalta suomelta. Otsikon adjektiivit vaikuttavat ensilukemalta erittäin sopivilta kuvaamaan kasvovoidetta. Lähdetekstiin verrattaessa ongelma on kuitenkin ilmeinen: ”intensely nourishing” ei varsinaisesti tarkoita ”syväkosteuttava”. Toisessa virkkeessä ongelmat ovat jo ilmiselviä, sillä ”iho tuntuu välittömästi rauhoittuneelta” ei kuulosta lainkaan luontevalta, vaan tässäkin näkyy selvästi englannin kielen vaikutus. ”Ulkoiset ärsykkeet” eivät myöskään istu tekstiin, ja pilkuilla erotettu kuten-lisäys tekee virkkeestä sekavan. Sekä Google Translate että ChatGPT ovat lisäksi kääntäneet ”extreme cold” suoraan ”äärimmäiseksi kylmyydeksi”, vaikka suomeksi tälle on oikein tuttu termi – pakkanen!
Tässä Samtextin ihmiskääntäjän käännösversio:
Erittäin hoitava – Rauhoittava
Tämä runsaasti sheavoita (25 %) sisältävä perusvoide suorastaan sulaa iholle ja tarjoaa välitöntä helpotusta kuivalle, erittäin kuivalle ja herkälle iholle. Ravitsee ihoa jopa 48 tunnin ajan.
Rauhoittaa ja vahvistaa ihoa välittömästi sekä suojaa sitä ulkoisilta rasituksilta, kuten pakkaselta.
Versiomme ei tietenkään ole ainoa oikea, sillä useimmat tekstit voi kääntää sujuvasti monella eri tapaa. Meidän versiossamme ei kuitenkaan ole kirjoitusvirheitä, ja sanajärjestys ja lauserakenteet ovat luontevaa suomea. Lisäksi lähdetekstin viesti ja sävy on säilytetty myös käännöksessä.
Kun Samtextin kääntäjä lukee valmiin käännöksensä läpi, hän kysyy itseltään: Olisinko ilmaissut asian näin, jos olisin kirjoittanut tekstin itse? Jos vastaus on ei, kääntäjä muotoilee kohdan uudelleen.
Konekäännin ja tekoäly eivät useimmiten pysty tuottamaan julkaisukelpoista lopputulosta, vaan käännökset vaativat muokkaamista eli jälkieditointia, jossa sekä lähdetekstin että käännöksen jokainen sana ja lause on luettava läpi ajatuksella. Toisin sanoen kone- tai tekoälykäännöksen jälkieditoijan on perehdyttävä huolellisesti tekstiin ja sen kohdeyleisöön sekä tehtävä lukuisia sanavalintoja ja muita tekstuaalisia ratkaisuja. Usein jälkieditointi edellyttää myös taustatutkimusta, esimerkiksi termien tarkistamista sekä referenssikuvien ja -videoiden etsimistä.
Kannattaako konekääntimiä ja tekoälyä siis hyödyntää käännöksissä? Kyllä ja ei. Tietynlaisissa käännöksissä niistä voi olla suuri apu. Yksinkertaisissa teksteissä, joissa on paljon toistoa ja konkretiaa, kone- tai tekoälykäännös jälkieditointeineen voi olla 30–50 prosenttia nopeampaa kuin manuaalinen kääntäminen. Ajansäästö syntyy siitä, että teknologiset työkalut vähentävät näppäinpainallusten määrää, sillä tekstin muokkaaminen kirjoittamisen sijaan vaatii huomattavasti vähemmän näppäilyä. Tästä huolimatta myös jälkieditointi vaatii huolellista lukemista, ymmärtämistä ja ajatustyötä, ja juuri siksi konekäännökset harvoin säästävät aikaa yli 50 prosenttia.
Kone- ja tekoälykääntäminen sopii vain teksteihin, jotka ovat konkreettisia, selkeitä ja yleiskielisiä. Jos teksti sisältää kulttuurisia viittauksia, huumoria tai sanaleikkejä, näistä käännösteknologioista ei yleensä ole hyötyä. Seuraavanlaiset tekstit eivät toisin sanoen sovellu käännettäväksi konekääntimen tai tekoälyn avulla:
Pahimmassa tapauksessa tällaisten käännösten jälkieditointi vie enemmän aikaa kuin manuaalinen kääntäminen. Tämä johtuu siitä, että luovia, emotionaalisia, humoristisia ja ironisia tekstejä ei voi kääntää sananmukaisesti, vaan ne edellyttävät toisinaan merkittävääkin uudelleenkirjoittamista. Tätä kutsutaan copykääntämiseksi tai transkreaatioksi. Tällaisen tekstin kääntäminen konekääntimellä tai tekoälyllä ei yleensä tuota käytettävää – tai edes ymmärrettävää – lopputulosta.
Yllä olevan esimerkkitekstin kohdalla ChatGPT tuotti laadukkaamman käännöksen kuin Google Translate – toisin sanoen ChatGPT:n käännöksen jälkieditoimiseen kului vähemmän aikaa kuin Google Translaten versioon. Kummankin teknologian käännösten jälkieditoiminen julkaisukelpoiseen muotoon vei vähemmän aikaa kuin kääntäminen täysin manuaalisesti, eli tämä teksti soveltui melko hyvin käännettäväksi sekä konekääntimellä että tekoälyllä. Jälkieditointi kuitenkin edellytti molemmissa tapauksissa hyvää käännös- ja kirjoitusosaamista – eli ammattimaisen kääntäjän työpanosta.
Haluatko tietää lisää editoinnin mahdollisuuksista, kestosta ja hinnasta?
Lähetä tekstisi meille ilmaiseen arvioon!