Machinevertaling (MT) krijgt een slechte reputatie omdat het wordt gezien als van lage kwaliteit (en de resultaten zijn soms hilarisch) - maar het zou je verbazen hoe ver deze technologie is gevorderd sinds deze voor het eerst werd bedacht in 1949. Onlangs vonden we TAUS's uitgebreide tijdlijn van de geschiedenis van MT , en het is geweldig om te lezen. Maar als je geen tijd hebt om 63 jaar MT-vooruitgang te lezen, volgt hier een kort overzicht:
1949-65: Machine vertaalonderzoek begint
Het nieuwe gebied van "machinevertaling" verschijnt in Warren Weaver's Memorandum on Translation (1949), en de eerste onderzoeker op dit gebied, Yehosha Bar-Hillel, begint zijn onderzoek aan het MIT (1951). Een onderzoeksteam van Georgetown MT volgt (1951) met een openbare demostratie van zijn systeem in 1954. MT wordt aangeprezen als een oplossing om de VS te helpen het Russisch in de gaten te houden. Het is ook een van de eerste niet-numerieke toepassingen voor computers. MT-onderzoeksprogramma's duiken op in Japan en Rusland (1955), en de eerste MT-conferentie wordt gehouden in Londen (1956). Onderzoekers blijven zich bij het veld voegen, aangezien de Association for Machine Translation and Computational Linguistics in de VS wordt opgericht (1962) en de National Academy of Sciences een commissie (ALPAC) vormt om MT te bestuderen (1964).
1966-95: MT gaat aan het werk
Het rapport van ALPAC stelt dat MT niet kan concurreren met de kwaliteit van menselijke vertalingen, en stelt voor om de financiering van MT-onderzoek stop te zetten. Maar het onderzoek gaat door. MT wordt ook aan het werk gezet: het Franse Textielinstituut om samenvattingen te vertalen van en naar het Frans, Engels, Duits en Spaans (1970); Brigham Young University start een project om mormoonse teksten te vertalen door middel van geautomatiseerde vertaling (1971); en Xerox gebruikt Systran om technische handleidingen te vertalen (1978). Er worden verschillende MT-bedrijven opgericht, waaronder Trados (1984), dat als eerste vertaalgeheugentechnologie ontwikkelt en op de markt brengt (1989). Het eerste commerciële MT-systeem voor Russisch/Engels/Duits-Oekraïens is ontwikkeld aan de Staatsuniversiteit van Charkov (1991).
1996-2012: MT raakt het web
MT op het web begint met Systran, dat gratis vertalingen van kleine teksten aanbiedt (1996), gevolgd door AltaVista Babelfish, dat 500.000 aanvragen per dag verzamelt (1997). Franz-Josef Och (het toekomstige hoofd Vertaalontwikkeling bij Google) wint de MT-snelheidswedstrijd van DARPA (2003). Andere innovaties in deze periode zijn MOSES, de open-source statistische MT-engine (2007), een tekst/SMS-vertaalservice voor mobiele telefoons in Japan (2008), en een mobiele telefoon met ingebouwde spraak-naar-spraak-vertaalfunctie voor Engels, Japans en Chinees (2009). Onlangs kondigde Google aan dat Google Translate ongeveer genoeg tekst vertaalt om 1 miljoen boeken in één dag te vullen (2012).
Oef! Dat is veel, en we hebben 90% van de geschiedenis van machinevertaling niet behandeld! Al het negatieve gepraat over MT lijkt te vergeten dat het een ongelooflijke, geavanceerde technologie is. De kwaliteit is lager dan die van menselijke vertalingen , maar dat betekent niet dat het geen goede, praktische toepassingen heeft, zoals het vertalen van oude persberichten van 5 jaar geleden.
2013-Nu
De afgelopen jaren zijn er belangrijke stappen voorwaarts gezet in de technologie voor automatische vertaling, waarbij het onderzoek van Google naar neurale automatische vertaling een optimistische toekomst voor de industrie inhoudt. Het is duidelijk geworden dat automatische vertaling niet langer de snelle, onhoudbare kwaliteitsoptie is voor vertaalorganisaties, maar een redelijk alternatief voor het vertalen van inhoud met een lage zichtbaarheid. In slechts een paar jaar tijd zijn er een heleboel leveranciers van automatische vertalingen opgestaan die acceptabele kwaliteit beloven tegen een fractie van de kosten van professionele linguïsten. De race om een concurrentievoordeel op het gebied van kwaliteit is in volle gang en MT-aanbieders beginnen gedifferentieerde benaderingen te hanteren om de kwaliteit die hun systemen kunnen produceren, te "boosten". De providers van tegenwoordig vallen over het algemeen in drie categorieën uiteen:
Hybride Human-MT-oplossingen (bijv. Unbabel) Domeinaangepaste machinevertaling (bijv. Lilt, IBM) Neurale machinevertaling (bijv. Google, Microsoft, SDL, Yandex) Bij Smartling zijn we ervan overtuigd dat machinevertaling snel een belangrijk onderdeel wordt van een effectieve globaliseringsstrategie. Hoewel het produceren van content tegen lage kosten en zo snel mogelijk een nadelig effect blijft hebben op de kwaliteit, biedt machinevertaling veel vertaalorganisaties een voorsprong bij het bereiken van de heilige graal van vertaalresultaten: een evenwicht tussen kosten, kwaliteit en time-to-market.
Zie deze link voor meer informatie over Smartling's Neural Machine Translation Hub.