Kielen päällä

8.9.2017

Neuroverkot valjastetaan kääntäjän apujuhdaksi

Perinteisissä konekääntimissä on monta puutetta, mutta viimeisen kahden vuoden aikana kehitys on ottanut huimia harppauksia, kun konekääntimissä on alettu hyödyntää neuroverkkoja. Kilpajuoksussa kohti parempia konekäännöksiä ovat ilmeisen kilpailijan Googlen lisäksi mukana muun muassa Facebook, Microsoft ja yliopistot kuten Harvard ja Helsingin yliopisto.

Viime vuoden marraskuussa Kääntäjät ilman rajoja -järjestön perustajanakin tunnettu Lori Thicke sai tietää, että hänen käännösalan yrityksensä Lexceleran ranskankielinen yritysesittely tarvittaisiin seuraavaksi päiväksi englanniksi tarjouasiakirjan liiteeksi. Yritysesittelyssä oli 59 sivua. Aikataulu tuntui täysin mahdottomalta, mutta tarjous oli saatava lähtemään määräajassa.3

Lexcelera oli jo jonkin aikaa käyttänyt konekäännintä rajatuissa tilanteissa, joissa käännöksen laadun ei tarvinnut olla täydellistä: yleiskuvan saamiseksi, sisäisiin raportteihin, post-editointia varten. Yritysesittelyn käännöksessä laatu on kriittinen, mutta Lori Thicke oli epätoivoinen. 59 sivua ja päivä aikaa.3

Lexeceralla sattui olemaan beta-testauksessa Systran-nimisen yrityksen neuroverkkokonekäännin, konekääntimien uuden sukupolven edustaja, joka eroaa radikaalisti perinteisista tilastopohjaisista ja sääntöpohjaisista konekääntimistä. Thicke päätti siis käyttää tätä työn nopeuttamiseen, vaikka laatu kärsisikin.3

Viime vuosina on konekääntimien saralla tapahtunut jotakin,
mikä mullistaa koko konekääntämisen kentän.


Kun käännös oli valmis, Thicke oli ällikällä lyöty. Noin joka neljännessä lauseessa oli jokin virhe, mutta hämmästyttävää oli, että käännös kuulosti ihmisen, ei koneen tekemältä. Kyseessä ei ollut enää yleiskuva sisällöstä, niin kuin perinteisten konekääntimien tapauksessa, vaan viimeistelyä vaille valmis käännös. Kun kone hoiti käännöksen, jäi riittävästi aikaa sen kielentarkistukselle, ja viimeistelty käännös lähti määräajassa tarjouksen mukana eteenpäin.3

Jo muinaisella 50-luvulla

Kun ensimmäisiä tietokoneita kehitettiin 1900-luvun puolivälissä, oli yksi niiden käyttötarkoituksista jo silloin kääntäminen.18 Varsinaisten konekääntimien kehitys on vienyt paljon kauemmin. Nyt, yli puoli vuosisataa myöhemminkin, voivat perinteiset konekääntimet enintään auttaa saamaan yleiskuvan tekstin sisällöstä. Erityisesti morfologisesti rikkaat kielet ovat niille turhan iso pala. Konekääntimen kouluttaminen tietynlaisella sisällöllä parantaa tilannetta, mutta lopputulos jää kauas optimaalisesta.5

Kun puhutaan perinteisistä konekääntimistä, viitataan yleensä tilastopohjaisiin ja sääntöpohjaisiin konekääntimiin.17 Eri variantteja on mahdollista myös yhdistellä hybrideiksi.18

Tilastopohjainen konekäännin (SMT, statistical machine translation) käyttää algoritmejä todennäköisyyksien luomiseen alku- ja kohdekielisten dokumenttien välille ja ehdottaa sen pohjalta käännöksiä.8 Se koulutetaan syöttämällä sille suuri määrä lähde- ja vastaavaa kohdekielistä tekstiä, joiden perusteella se tunnistaa, mikä on minkäkin käännös.17

IBM_models_01_
Kuva: Krz.wolk, Wikimedia Commons
Sääntöpohjainen konekäännin (RbMT, rule-based machine translation) on rakennettu algoritmeille, jotka analysoivat lähtötekstin syntaksin ja käyttävät sääntöjä kohdekielisen lauseen rakentamiseen.9 Sille siis opetetaan joukko leksikaalisia ja kielioppisääntöjä, joiden perusteella se rakentaa kohdekielisiä lauseita.17 Tämän konekääntimen etuna on se, että sen avulla on mahdollista kääntää hyvin monenlaisia tekstejä, koska sitä ei tarvitse kouluttaa tietyllä tekstimassalla. Haasteena on se, että sitä varten on rakennettava esimerkiksi sanakirjoja.9

Puutteita näillä perinteisillä konekääntimillä on paljon. Tilastopohjainen konekäännin ei esimerkiksi ymmärrä kontekstin merkitystä8 eikä sääntöpohjainen ymmärrä metaforia9. Kun tarvitaan huippuunsa hiottu käännös, on siis parempi antaa kääntäminen ammattikääntäjän hoidettavaksi. Toisaalta konekäännös sopii tilanteisiin, joissa laatu tai väärinymmärrys ei ole niin kriittinen, esimerkiksi jos halutaan vain ylimalkainen kuva tekstin sisällöstä.17 Viime vuosina ollaan päästy jo tilanteeseen, jossa on nopeampaa jälkieditoida konekäännöksestä laadukas käännös kuin kääntää kaikki alusta asti ilman koneavusteista osuutta.18

Koneavusteisen kääntämisen uusi aalto

Viime vuosina on konekääntimien saralla tapahtunut jotakin, mikä mullistaa koko konekääntämisen kentän. Uusi kehitysharppaus tuli yleiseen tietoisuuteen viimeistään silloin, kun Google julkaisi viime vuoden lokakuussa Google Translaten uuden version, jonka se kertoi hyödyntävän syväoppivaa neuroverkkoa käännösvirheiden vähentämiseksi2  tusinassa kieliä11.

Google jopa hehkutti, että tämä edistysaskel on suurempi
kuin koko kymmenen viime vuoden kehitys konekääntimien saralla yhteensä.


Tämä uusi teknologia mahdollistaa sen, että konekäännin pystyy tulkitsemaan sanojen ja lauseiden suhteita ja päättelemään sen perusteella, mikä lause sopii kontekstiinsa.2 Google jopa hehkutti, että tämä edistysaskel on suurempi kuin koko kymmenen viime vuoden kehitys konekääntimien saralla yhteensä.11 Google on sittemmin laajentanut neuroverkkokonekääntimensä kielivalikoiman kieliin kuten arabia, hebrea, venäjä ja vietnami. Huhtikuussa Google laajensi kielivalikoimansa Intian kieliin.19

Viime vuoden joulukuussa Microsoft taas tiedotti, että ”Microsoftin käännössovellus mobiililaitteille käyttää nyt neuroverkkoteknologiaa”. Kieliä oli alkuvaiheessa kymmenen (arabia, ranska, italia, japani, espanja, brasilian portugali, saksa, englanti, venäjä ja mandariinikiina), joista yhdessä muodostuu 80 % Microsoftin päivittäisistä käännöksistä.1  Viimeisimpänä Microsoft lisäsi huhtikuussa valikoimaan kiinan ja japanin.22

Neuroverkkonekääntämisen suunnannäyttäjistä ei pidä unohtaa myöskään SYSTRANia, Soulissa päämajaansa pitävää pitkän linjan kieli- ja käännösalan yritystä, joka muun muassa toi markkinoille ensimmäisen hybridikonekääntimen. Sen käännöskone PNMT (Pure Neural™ Machine Translation) perustuu keinotekoisten neuroverkkojen ja syväoppimisen uusimpiin kehitysasteisiin.7 Kaikki PNMT:n koodi, myös algoritmit, ovat avoimen lähdekoodin koodia20 ja SYSTRANilla onkin ollut merkittävä osa esimerkiksi Harvardin neurorvekkokonekääntimen OpenNMT:n kehityksessä.14

Myös useat muut yritykset, kuten Baidu, Facebook ja SDL, ovat ilmoittaneet omista askeleistaan NMT:n tutkimuksen ja ratkaisujen saralla.20 Toukokuussa Facebookin toimitusjohtaja Mark Zuckerberg kertoi, että Facebookin keinoälyä tutkinut viiden hengen tiimi havaitsi tutkimuksessaan konvolutiivisen neuroverkon käytön nopeuttavan konekääntämistä jopa seitsemänkertaiseksi aiempiin neuroverkkokonekääntimiin verrattuna.21  Elokuun alussa yritys, joka suorittaa noin 4,5 miljardia konekäännöstä päivässä, ilmoitti kaikkien sen konekäännösten siirtyvän neuroverkkojen hoidettavaksi.12

Neuroverkko oppii ratkaisemaan käännösongelmia

Neuroverkkokonekääntäminen (NMT, Neural Machine Translation) on syväopppiva prosessi (Deep Learning, DL), joka perustuu nimensä mukaisesti neuroverkoille.5 Syväoppiminen taas on koneoppimisteknologia, joka pyrkii syvien neuroverkkojen avulla jäljittelemään ihmisaivojen tomintaa ainakin osittain.13

AdobeStock_111016305_neuroverkotPerinteisesti tietokonetta ohjeistetaan rikkomalla ongelma osasiinsa ja ohjaamalla tietokonetta tehtävillä ja algoritmeillä. Keinotekoista neuroverkkoa ei ohjeisteta ongelmanratkaisussa, vaan sille syötetään aineistoa, jonka pohjalta se oppii itse löytämään ratkaisut.10 Syväoppimisessa ja siten sitä hyödyntävässä NMT:ssä ei siis ohjelmoida ongelmalle ratkaisua, vaan koulutetaan kone ratkaisemaan ongelma esimerkkien avulla ja valtavan aineistomäärän pohjalta.5

Vuoden 2016 loppuun asti kaikki konekäännöstuotteet perustuivat algoritmeihin, jotka käyttivät tilastomenetelmiä yrittäessään päätellä, mikä on paras käännös millekin sanalle. Ongelmana on ollut, että kontekstina on vain pari edeltävää ja pari jälkeen tulevaa sanaa. Konteksti on siis riittävä vain lyhyille irrallisille lauseille.13 NMT sen sijaan ei vain yhdistä lähde- ja kohdetekstiä samankaltaisuuden pohjalta kuten sääntöpohjainen konekäännin, vaan opiskelee kieltenvälisiä suhteita. Se pystyy tekemään opetusaineiston perusteella yleistyksiä perinteisiä konekääntimiä helpommin.11

Neuroverkko luo mallin käännettävästä sanasta kokonaisen lauseen perusteella ja kääntää luomansa mallin toiselle kielelle. Jos lauseessa esimerkiksi esiintyy sana koira ja kontekstista käy ilmi, että kyseessä on pentujaan imettävä koira, neuroverkko luo mallin nartusta ja kääntää oikein feminiiniseen muotoon.13

Tämän vuoden neljän ensimmäisen kuukauden aikana julkaistiin NMT-aiheisia tutkimuksia lähes yhtä paljon kuin koko viime vuonna yhteensä.


Tällä hetkellä keinotekoisten neuroverkkojen käyttöä luonnollisten kielten prosessoinnissa tutkitaan paljon ja kehitys on huimaa.10  Tämän vuoden neljän ensimmäisen kuukauden aikana julkaistiin NMT-aiheisia tutkimuksia lähes yhtä paljon kuin koko viime vuonna yhteensä. Julkaisujen kirjoittajina oli 173 tutkijaa ympäri maailman.16

Perinteisilläkin konekääntimillä on paikkansa

NMT:stä annettu kuva on kuitenkin ruusuisempi kuin mitä se todellisuudessa on. Google hehkuttaa, että NMT tuottaa lähes ihmistasoista käännöstä, mutta vertailupisteenä ei ole ammattikääntäjän korkealaatuinen käännös.15 NMT:llle pitää edelleen opettaa esimerkiksi tuotenimet, sisäinen terminologia, harvinaiset sanat sekä asiakasspesifit erikoistermit ja ilmaisut, jotta se suoriutuu niistä.3, 11 Eri kääntimien suoriutuminen myös riippuu siitä, mitkä kielet ovat kyseessä.5

Perinteiset konekääntimet taas eivät vaadi suuria investointeja6 tai suuria teknisiä valmiuksia, vaan sellaisen voi laatia vaikka kännykkäsovellukseksi off-line-tilassa käytettäväksi, sellaiseksi kuin Kääntäjät ilman rajoja -järjestön kehittämä kurdi-MT-järjestelmä, jonka voi ladata ilmaiseksi Android-puhelimeen Google Play Kaupasta.4

"Uskon, että NMT:stä tulee kolmen vuoden sisällä valtavirtaa." Lori Thicke


NMT tekee konekäännöksistä kuitenkin työstettävämpiä ja kuroo umpeen käännöskysynnän ja tarjonnan välistä kuilua.15 Kriittisessä käännöstyössä, kuten jos käännetään teknisiä oppaita, taloudellista raportointia tai juridisia asiakirjoja, pienetkin virheet voivat olla kohtalokkaita, ja ihmisiä tarvitaan järjestelmän käyttämisen lisäksi vähintäänkin tarkastamaan ja editoimaan automaattisten järjestelmien tuottamat käännökset.19 Edelleen tarvitaan myös ammattikääntäjän tekemää huippulaatua, siihen ei kone yllä.

Konekääntäminen on kuitenkin tullut jäädäkseen. Kuten Lori Thicke sanoi kokeiltuaan NMT:tä yritysesittelyn kääntämiseen:

- Meidän on joko otettava uusi teknologia haltuun tai kaivettava itsellemme jokin erikoisala paikasta, jonne MT ei yllä, mutta uskon, että NMT:stä tulee kolmen vuoden sisällä valtavirtaa.3

Teksti: Suvi Seikkula



Kokeile, miten NMT toimii 


Lähteet:

  1. Microsoft Translator launching Neural Network based translation for all its speech languages
  2. Is Google Translate Really As Good As A Human Now?
  3. Neural Machine Translation (NMT) Beta Test
  4. Translators without Borders develops the world’s first crisis-specific machine translation system for Kurdish languages
  5. Neural Machine Translation: The New Kid on the Block
  6. Now & Next: Machine Translation
  7. About SYSTRAN
  8. TAUS Knowledge Base: Statistical machine translation
  9. TAUS Knowledge Base: Rule-based machine translation
  10. SYSTRAN: Purely Neural Machine Translation Issue 1
  11. Neural is the New Black
  12. Transitioning entirely to neural machine translation
  13. What is neural network based translation?
  14. OpenNMT
  15. Is Neural MT Really as Good as Human Translation?
  16. Increase in research of neural machine translation in the first half of 2017
  17. Hyvä, paha konekäännin
  18. Yksikin myrkyllinen keksi voi pilata konekäännöksen
  19. Translation platforms cannot replace humans
  20. Neural MT Leaves the Lab for Beta and Third-Party Assessment
  21. Facebook to Open Source Its Neural Machine Translation, Zuckerberg Announces
  22. Microsoft Translator Apps Switch all Chinese and Japanese Language translations to Neural Network Technology
Palaa otsikoihin


Poutapilvi web design - P4 - julkaisujärjestelmä