Generatieve AI is al bijna twee jaar top of mind. Nu vragen leidinggevenden in verschillende sectoren en functies hun teams om manieren te vinden om het te gebruiken om de kosten te verlagen of de efficiëntie te verhogen. Maar de vraag is, werkt AI eigenlijk wel in vertalingen?
In de afgelopen 18 maanden heeft Smartling haar inspanningen op het gebied van Onderzoek & Ontwikkeling gericht op het vinden van een antwoord. We wilden met name weten of AI ons kon helpen vertaaloplossingen te leveren met de beste kwaliteit, kosten, snelheid en ervaring ter wereld.
Het antwoord? Een volmondig ja! AI werkt en het werkt op schaal. Maar niet elke applicatie is een winnaar.
Waar werkt AI vandaag de dag in vertalingen?
Toen Large Language Models (LLM's) voor het eerst uitkwamen, begonnen bedrijven ze te testen als een directe vervanging voor machinevertaling. Hoewel deze use case potentieel heeft, zijn er nog een paar knikken die moeten worden aangepakt om consistente prestaties te garanderen.
Ons R&D-team evalueerde verschillende LLM's en machinevertalingen in meerdere talen en kwaliteitsmaatstaven (d.w.z. BLEU, MQM, TER, enz.). Dit experiment toonde aan dat bij het gebruik van LLM's voor vertalingen in alle talen, geautomatiseerde kwaliteitsevaluatiestatistieken aangaven dat machinevertalingen nog steeds beter presteerden dan LLM's op het gebied van vertaalkwaliteit. Bovendien is machinevertaling een veel goedkopere benadering voor vertaling dan het gebruik van LLM's.
Hoewel LLM's nog niet de optimale optie voor vertalingen zijn, begon ons team ze te zien schitteren in automatische nabewerking en evaluatie van machinevertaalresultaten. In plaats van een vervanging te zijn voor automatische vertaling, blijkt AI een krachtige aanvulling te zijn op automatische vertaling.
Met name de volgende blijken sterke toepassingen voor AI te zijn:
- Fuzzy lucifer reparatie
- Invoeging van woordenlijstterm
- Schatting van de inspanning bewerken
- Formaliteit
- Gender de-biasing
Met deze kennis zijn we begonnen met het ontwikkelen en implementeren van nieuwe AI-oplossingen voor onze klanten. Het begon met AI-Powered Human Translation, een vertaaloplossing die de deskundige taalkundigen en AI-technologie van Smartling samenbrengt om vertalingen van hoge kwaliteit te leveren tegen de helft van de kosten en twee keer zo snel.
Toen begonnen klanten ons te vragen of ze onze AI-functies konden gebruiken met hun externe taalserviceproviders. Dus zeiden we ja.
Introductie van de AI Translation Toolkit
De AI Translation Toolkit van Smartling biedt een reeks AI-vertaalfuncties die zijn ontworpen om de vertaalkosten aanzienlijk te verlagen en de prestaties van taalkundigen te verbeteren zonder in te boeten aan kwaliteit. We maken onze AI-technologie die ongelooflijke resultaten heeft opgeleverd voor onze AIHT-klanten beschikbaar voor iedereen, waaronder:
- AI Fuzzy Match Reparatie: Verhoog de hefboomwerking van het vertaalgeheugen met maar liefst 35 procentpunten, wat leidt tot aanzienlijke kostenbesparingen en een betere kwaliteit.
- Invoeging van AI-woordenlijsttermen: Integreer uw woordenlijsttermen naadloos in de inhoud, waardoor contextuele en grammaticale nauwkeurigheid worden gegarandeerd.
- Schatting van de inspanning bewerken: Groepeert vertalingen op basis van verwachte inspanning om menselijke kwaliteit te bereiken. Inzichten kunnen worden gebruikt in onze workflowautomatisering om tekenreeksen toe te wijzen aan specifieke taalkundigen of om menselijke beoordeling volledig te omzeilen.
Laten we eens duiken in elk van deze kenmerken en het onderzoek dat ze ondersteunt.
Diepe duik: AI Fuzzy Match Reparatie
Tegenwoordig is het gebruik van een vertaalgeheugen een standaardpraktijk. AI Fuzzy Match Repair gaat echter nog een stap verder met de traditionele aanpak door LLM's te gebruiken om snaren te repareren en glad te strijken die normaal gesproken niet zouden worden gebruikt voor besparingen.
In de onderstaande afbeelding kunt u bijvoorbeeld zien dat de brontekst en het vertaalgeheugen slechts één woord van elkaar verwijderd zijn. Met een regulier vertaalgeheugen zou de brontekst doorgaans volledig opnieuw moeten worden vertaald. Maar met fuzzy match repair is de LLM in staat om het verschil te identificeren en een gerepareerde vertaling te bieden. De voorgestelde vertaling zou nu in aanmerking komen voor fuzzy match-kortingen, waardoor klanten meer gebruik kunnen maken van hun TM's en de werklast voor taalkundigen wordt verminderd.
Hoewel het concept erop volgt, klinkt dit als een heel coole functie - ons R&D-team wilde er zeker van zijn dat het werkte. Wat nog belangrijker is, ze wilden er zeker van zijn dat het echte waarde bood in de vorm van kosten-, kwaliteits- of snelheidsverbeteringen.
Om dit te doen, vertaalden ze dezelfde inhoud twee keer - een keer met AI fuzzy match repair aan en een keer met het uit. Ze evalueerden beide scenario's op basis van de HTER van de outputvertaling en de uiteindelijke menselijke vertaling. We wilden zien hoeveel snaren geen menselijke tussenkomst nodig zouden hebben na Fuzzy Match Repair.
Uit het onderzoek bleek dat AI fuzzy match repair de overeenkomsten in het vertaalgeheugen met maximaal 35 procentpunten verhoogde en dit redelijk consistent deed in alle talen. Dit betekent dat klanten het vertaalgeheugen kunnen gebruiken voor veel meer van hun inhoud, wat leidt tot aanzienlijke kostenbesparingen en verbeterde consistentie.
Deep Dive: invoeging van AI-woordenlijstterm
Een andere standaardpraktijk bij het vertalen is het invoegen van woordenlijsttermen. De traditionele aanpak is om simpelweg termen in de bron- en doeltekst te rippen en te vervangen door de relevante termen uit de woordenlijst. Dit heeft echter de neiging om nieuwe vloeiendheidsproblemen te introduceren wanneer die woordenlijsttermen niet overeenkomen met het numerieke aantal, de verbuigingen of andere grammaticale elementen van de totale zin.
Met AI Glossary Term Insertion wordt een LLM gebruikt om de invoeging van de woordenlijstterm "soepel" te maken, waardoor contextuele en grammaticale nauwkeurigheid wordt gegarandeerd. In de onderstaande afbeelding kunt u bijvoorbeeld zien dat de traditionele toepassing van de woordenlijstterm "publicación" een grammaticale fout heeft geïntroduceerd in de algemene tekenreeks waar het bijbehorende bijvoeglijk naamwoord nu de onjuiste verbuiging heeft (primer vs. primera). Met behulp van een LLM wordt het juiste bijvoeglijk naamwoord ingevoegd en wordt de fout geëlimineerd.
Op basis van ons onderzoek kunnen LLM's een enorme impact hebben op het aantal morfologisch correcte woordenlijstinvoegingen. Bij het testen op Russische en Spaanse inhoud verhoogde de AI Glossary Term Insertion-functie het aantal correcte invoegingen met respectievelijk 25% en 17,5%. Dat is inhoud die niet langer menselijke inspanning vereist om te repareren.
Deep Dive: Schatting van de inspanning bewerken
Onze Edit Effort Estimation-technologie groepeert vertalingen op basis van de verwachte inspanning om menselijke kwaliteit te bereiken. Alle strings worden met onze eigen prompt naar een LLM gestuurd die strings evalueert op basis van:
- Grammaticale correctheid
- Vlotheid
- Semantische samenhang
- Lexicale nauwkeurigheid
- Kwaliteitscontroles
- Stijlgids (uniek voor elke klant)
Deze groeperingen (Niveau 1, Niveau 2 en Niveau 3) kunnen binnen dynamische workflowautomatisering worden gebruikt om tekenreeksen te behandelen op basis van hun verwachte inspanning. Een bedrijf kan bijvoorbeeld tekenreeksen die uitgebreide bewerkingen vereisen, toewijzen aan meer ervaren taalkundigen of menselijke beoordeling volledig overslaan op tekenreeksen die weinig tot geen bewerkingen vereisen. Klanten kunnen ook onze kortingen voor het schatten van inspanningen bewerken gebruiken om kortingsniveaus te maken voor goed presterende steken.
Dit kan aanzienlijke tijd- en kostenbesparingen opleveren voor bedrijven, vooral voor bedrijven die veel gebruik maken van menselijke vertaalworkflows. Het geeft teams ook dieper inzicht in hun vertaalproces.
Breng een revolutie teweeg in uw vertaalstrategie
We hebben gezien dat AI werkt aan het vergroten van de hefboomwerking, het verbeteren van de nauwkeurigheid van het invoegen van woordenlijsttermen, het toepassen van formaliteit en meer. Het kost echter veel tijd en onderzoek om de plaatsen te identificeren waar AI het meest effectief kan zijn en een sterk rendement op de investering kan opleveren. Dat is waar de hulp van een partner, zoals Smartling, om de hoek komt kijken, zodat je het niet alleen hoeft te doen.
Een cruciaal onderdeel van onze strategie is onze investering in R&D om ervoor te zorgen dat we in staat zijn om de meest uitgebreide LanguageAI-oplossing™ in de branche te bieden. We hebben meerdere patenten op ons werk met generatieve AI en ons technische team heeft het afgelopen jaar meer dan 70 belangrijke functies of verbeteringen geleverd in een verbazingwekkende 3300 productiereleases.
Dat is wat er nodig is om er echt voor te zorgen dat AI-oplossingen de beste kwaliteit, kosten, snelheid en ervaring ter wereld leveren.
Lees meer over ons laatste onderzoek en wat we hierna onderzoeken in de Global Ready Conference-sessie: Research Revealed - nu op aanvraag.