25.06.2019
Zukunft=Maschine?!
Machine Translation, maschinelle Übersetzung, künstliche Intelligenz und maschinelles Lernen sind in aller Munde. Wir haben das Thema mit unserer Inhouse-Expertin für Machine Translation und Post-Editing diskutiert. Heraus kamen spannende Einblicke in Best-Practice, Herausforderungen und Chancen für Kunden, Freelancer und Projektmanager …
Was müssen Unternehmen wissen, die sich für Machine Translation (kurz: MT) interessieren? Woran erkennen sie einen guten Anbieter und sind die Vorteile der Kosten- und Zeitersparnis tatsächlich stets gegeben? Was können Übersetzer tun, um von der neuen Technologie zu profitieren? Diese und viele weitere Fragen stellten Bogy-Praktikantin Emela und Marketingmanagerin Carolin Bauer der MT-Expertin Nikolina Cabraja. Sie ist seit 2,5 Jahren bei oneword und begleitet Unternehmen bei der Einführung und Umsetzung von Übersetzungsprojekten mit Machine Translation und Post-Editing (PE).
Aus der Serie oneQuestion – oneAnswer
Machine Translation vs. Humanübersetzung
Nikolina, erstmal vielen Dank, dass du dir die Zeit genommen hast. Erkläre unseren Lesern doch noch einmal kurz, was die generellen Vorteile von Machine Translation sind und warum Unternehmen diese Technologie einsetzen sollten.
Generell wissen Unternehmen, die zu uns kommen, dass man mit der maschinellen Übersetzung vor allem Kosten einsparen und den Zeitaufwand im Vergleich zur Humanübersetzung sehr gering halten kann. Während ein Übersetzer ca. 1500 Wörter am Tag übersetzen kann, setzt eine Maschine dieses Volumen in wenigen Sekunden gnadenlos um – überspitzt formuliert.
Eignen sich alle Textarten für eine maschinelle Übersetzung?
Grundsätzlich ist alles möglich, besonders gut funktioniert es aber mit standardisierten, technischen Texten. Schwieriger wird es bei Marketingtexten: Alles, was bildliche Sprache verwendet, besondere Redewendungen, Wortspiele oder Wortwitze beinhaltet oder sehr blumig geschrieben ist, ist schwierig für die Maschine. Wobei die Ergebnisse mittlerweile auch deutlich zufriedenstellender sind, als noch vor wenigen Jahren. Die Technik macht da wirklich sehr große Fortschritte.
Zudem kommt es schlichtweg darauf an, wie kritisch bzw. wie risikobehaftet die Texte sind und wofür sie verwendet werden. Werden die Inhalte von einer internen oder externen Zielgruppe gelesen? Ist der Text langlebig oder nur kurzfristig wichtig, um beispielsweise einen Sachverhalt in Kontext zu setzen?
Zahlenspiel maschinelle Übersetzung: Deutlich mehr Volumen in weniger Zeit, durch Post-Editing in hochwertiger Qualität. Klingt verlockend. Ist es das auch?
Kosten sparen mit maschineller Übersetzung
Ich höre hier raus, dass eine grundlegende Kategorisierung von Texten, zum Beispiel nach Zielgruppe, Risikograd, Inhalt und Zweck der Übersetzung dabei helfen könnte, den Kostenvorteil besser einschätzen zu können, oder?
Definitiv. Wir sprechen hier auch von Risikomanagement. Je mehr überschneidungsfreie Variablen, desto aussagekräftiger. Eine Priorisierung ist dabei ebenfalls wichtig. Beispielsweise kann eine kurzlebige Übersetzung, wie die einer aktuellen Pressemitteilung prinzipiell als „MT-nutzbar“ eingestuft werden. Die Zielgruppe ist aber extern und vergleichsweise groß. Es müssen also auch hohe Qualitätsstandards und Regeln für die Nachbearbeitung erstellt werden. Gleiches gilt beispielsweise für die Übersetzung einer Bedienungsanleitung für eine ganz spezielle Kreissäge. Hier kann die Zielgruppe noch so klein und spezifisch sein, da es um Leib und Leben geht, sollte es auch hier K.O.-Kriterien geben.
Diese sollten im Rahmen einer Machbarkeitsanalyse angesetzt werden und anhand der Texteinteilung abschätzbar machen, welche Kombination aus Human- oder maschineller Übersetzung, Full- oder Light-Post-Editing und eventuell sogar mit einer zusätzlichen Revision und fachlichen Prüfung sich eignet. Unternehmen stellen dann selbst oft fest, dass durch die Clusterung irgendwann die Textkategorie des Break-Even-Punkts kommt. Natürlich sprechen wir hier nicht von Gewinn und Verlust, aber es kommt der Punkt, an dem weitere aufwändige Prüfschritte die Kosteneinsparung durch die zuvor gefertigte MT nahezu aufheben und sich Unternehmen die Frage stellen sollten: Spare ich ab hier eigentlich noch Zeit oder Geld?
Eine Kategorisierung der vorhandenen Dokumente kann erste Entscheidungshilfe sein, um das bestmögliche Einsparpotential je Textart zu eruieren. (Quelle: oneword)
Machine Translation beauftragen: Worauf muss ich achten?
Wer entscheidet, ob eine Übersetzung human oder maschinell angefertigt wird? Der Sprachdienstleister oder das Unternehmen?
Das entscheidet immer der Kunde, aber wir beraten umfassend, machen eine Machbarkeitsanalyse und unterstützen ihn während und auch nach seiner Entscheidung in der Umsetzung. Gemeinsam können wir im Rahmen von MT einen Prozess aufsetzen, der auch bei einem komplexen, anspruchsvollen Ausgangstext ein qualitativ hochwertiges Endprodukt zum Ziel hat.
Die bereits genannte Einteilung hilft Kunden generell, selbst eine Entscheidung zu treffen und auch vorab einzuschätzen, welcher Dienstleister hier überhaupt profund berät und die Texte des Kunden individuell und differenziert genug betrachtet.
Das führt uns direkt zur nächsten Frage: Common Sense Advisory hat bereits 2016 gesagt, dass 80 Prozent der LSPs MT anbieten. Da stellt sich schon die Frage, ob es Qualitätsmerkmale oder Hinweise gibt, die helfen, die Qualität und das Angebot des einzelnen Dienstleisters einzuschätzen. Hast du dazu einen Tipp für den Kunden?
Die initialen Beratungsgespräche zwischen Kunde und Dienstleister sagen bereits viel aus, wie ich finde. Da kommt es darauf an, dass sich der Dienstleister genügend Zeit nimmt, um herauszufinden, welche Anforderungen und Bedürfnisse der Kunde hat, welche Textsorten, Volumina und Qualitätsansprüche er mitbringt, ob es um vollständiges oder leichtes Posteditieren geht, welche Systeme sich dafür eignen und wie die Maschine auch langfristig trainiert werden soll. Ich als Kunde merke dann schnell, ob die Agentur sich auskennt und mir auch ein passgenaues Leistungsangebot machen kann.
Auch das Thema Datenschutz ist zu diskutieren. Geht der Dienstleister sensibel mit meinen Daten um, oder werden die Ergebnisse und Texte irgendwo cloudbasiert abgespeichert oder in anderem Kontext weiterverwendet? Wie stark werde ich ins Training der Engine eingebunden? Wie sind die Feedbackprozesse? Wo soll die Maschinelle Übersetzung stattfinden und welche Anschaffungen habe ich als Kunde eventuell vor Ort zu tätigen? Neben der Erkennung von Professionalität und Kompetenz innerhalb dieser Gespräche erkenne ich auch anhand des Qualitätssiegels der Posteditiernorm DIN ISO 18587 die Kompetenz eines Anbieters. Danach sind einige wenige Dienstleister zertifiziert und auch das hilft zu erkennen, wie weit die Anbieter hinsichtlich ihres Leistungsspektrums für MT bereits sind. oneword ist eines der schnellen Unternehmen und will sich noch 2019 zertifizieren lassen.
Apropos Training: Ist denn die Einbindung von Styleguides und Terminologie überhaupt möglich?
Es gibt unterschiedliche Typen von MT: statistisch, regelbasiert und neuronal. Terminologie kann man grundsätzlich in alle einbinden.
Styleguides muss man differenziert betrachten. Konkrete Regeln wie „Formuliere nur in Nominalsätzen“ oder „Verwende nur kurze Sätze“ lassen sich in die regelbasierte MT leicht einbinden. Teilweise ist es aber auch schon bei der Humanübersetzung schwierig, den eigenen, gewünschten Stil durch einen Styleguide so in Regeln zu fassen, dass er durch Dritte, wie den Übersetzer oder Revisor, stets eingehalten und exakt umgesetzt wird. Denn: Stil ist subjektiv. Je unkonkreter also eine Regel, desto schwieriger wird es auch für die Maschine, diese umzusetzen. Bedeutet: Bei MT sind Styleguides vor allem für den Posteditor wichtig. Während der Nachbearbeitung des gesamten Textes achtet er insbesondere bei komplexen Stilanforderungen wie Reimen, Redewendungen oder Wortspiele auf eine adäquate Umsetzung. Und genau deshalb ist es so wichtig, dass MT nur in Ausnahmefällen ohne PE stattfindet.
Herausforderungen Machine Translation
Was sind denn weitere Stolpersteine für die Maschine – ganz im Allgemeinen?
Grundsätzlich sollten Ausgangstexte keine Rechtschreibfehler beinhalten. Die Maschine kann beispielsweise beim Wort „hitnerlegt“ nicht automatisch auf die korrekte Rechtschreibung „hinterlegt“ kommen und dementsprechend übersetzen. Als gänzlich unbekanntes Wort wird es wie ein Eigenname behandelt und bleibt unübersetzt.
Spannend wird es auch bei einem Ausgangstext, der bereits einzelne Begriffe aus anderen Sprachen beinhaltet. Im Deutschen werden zum Beispiel viele Anglizismen verwendet: Der englische Begriff „Backend“ wird synonym für den hinteren Raum eines informationstechnischen Systems gebraucht. Oder eben auch als Partizip für das deutsche Verb „backen“. Maschinell in die Zielsprache Englisch übersetzt, kann dieser Begriff also auch schnell zu „baking“ werden und unter Umständen im falschen Kontext für etwas Verwirrung sorgen.
Wichtig ist grundsätzlich, kontinuierlich große, saubere Daten zu füttern und viel Trainingsmaterial zur Verfügung zu stellen, um die Engine einzulernen und immer wieder zu korrigieren. So kann auch ein Stil angelernt werden. Nur durch Kontinuität kann die Maschine lernen.
Betrachten wir noch stärker die Seite des Übersetzers im MT-Prozess. Oft fühlen sich klassische Übersetzer außenvorgelassen, wenn es um das Training der Engine geht. Hast du Tipps für ein Training und wie Übersetzer hier besser eingebunden werden können? Welche Training-Strategien gibt es da?
Wir binden unsere Übersetzer und Posteditoren durch einen umfassenden Feedbackbogen ein, der verschiedenste Aspekte der Übersetzung abfragt, um die Maschine oder den Prozess im Anschluss zu optimieren. Auch unsere Projektmanager sind ausgebildete Übersetzer und Linguisten. Es sollten unbedingt Sprachwissenschaftler am Training der Maschine teilnehmen, nicht nur der Fachexperte auf Kundenseite.
Es gibt zudem Firmen, die ihre maschinell übersetzten Texte durch Umfragen und Likert-Skalen von der Zielgruppe bewerten lassen. Die Frage ist hier immer: Was ist das Ziel? Nach offensichtlichen Fehlern zu fragen, nach Grammatik und Natürlichkeit in der Formulierung, ist klar. Aber was ist, wenn der Stil nicht gefällt? Sprache und Stil sind immer sehr subjektiv, daher ist die Frage, welche und wie viele Personen ich am Training teilnehmen lasse und was am Ende wen zufriedenstellen soll.
Ist eine Maschine so gut wie ein Übersetzer? Wenn ja, braucht man dann überhaupt noch einen Menschen beim Übersetzungsprozess?
Die Maschine wird immer besser, das steht außer Frage. Vor allem seit neuronale Systeme wie DeepL den Markt erobert haben, sind deutliche Fortschritte im Bereich der maschinellen Übersetzung zu erkennen. Allerdings weiß man auch aus anderen Bereichen, wie beispielsweise der Automobilindustrie, dass man sich bei wichtigen Prozessen niemals allein auf die Technik oder die Maschine verlassen sollte. Auch wenn man das neueste Navigationssystem in seinem Auto hat, muss man trotzdem auf Verkehrsschilder etc. achten. Bei der maschinellen Übersetzung ist das ähnlich: nicht alles, was aus der Maschine kommt, ist auch richtig. Wie bereits zuvor erwähnt, ist Sprache nicht nur ein Konstrukt aus Wörtern. Es fließen noch weitere Faktoren mit ein, die den Humanübersetzer unersetzlich machen. Eine Maschine erkennt keine Doppeldeutigkeit, kann nicht zwischen den Zeilen lesen, versteht Anspielungen nicht, hat keine interkulturellen Kompetenzen usw.
Und: Die Maschinen übersetzen immer noch Satz für Satz, ohne den gesamten Text als Kontext zu nehmen. Das führt zu vielen Inkonsistenzen und manchmal auch vollkommen unpassenden Übersetzungen. Natürlich kann man, je nach Wichtigkeit, Zielgruppe und Verwendung der Übersetzung, auf eine Nachbearbeitung des maschinellen Outputs verzichten. Das gilt vor allem für reine Informationsübersetzungen, um beispielsweise innerhalb eines Unternehmens den Inhalt einer E-Mail zu verstehen. Soll am Ende aber ein qualitativ hochwertiges Produkt herauskommen, das von einer Humanübersetzung nicht zu unterscheiden ist, dann kann die maschinelle Übersetzung zum jetzigen Zeitpunkt nicht ohne den „humanen“ Teil auskommen.
Post-Editing unter der Lupe
Diese Argumente werden viele Übersetzer beruhigen. Was genau sind denn die Aufgaben eines Posteditors?
Beim Post-Editing ist zunächst wichtig, dass der Kunde vorab entscheidet, welche Qualitätsanforderungen er an die Übersetzung stellt. Wenn die maschinelle Übersetzung einer Humanübersetzung gleichen soll, muss auf jeden Fall ein vollständiges Posteditieren durchgeführt werden. Dabei prüft der Posteditor jeden Satz der maschinellen Übersetzung, vergleicht ihn mit dem Ausgangstext und passt wenn nötig den Zieltext an. Der Posteditor achtet darauf, dass die Maschine nichts ausgelassen oder hinzugefügt hat, ob alles konsistent übersetzt wurde und ob die Maschine sinngemäß korrekt übersetzt hat. Wird die maschinelle Übersetzung allerdings nur für interne Zwecke und zur Informationsgewinnung genutzt und nicht veröffentlicht, kann auch ein leichtes Posteditieren genügen. Dabei sind kleinere Fehler erlaubt, wie beispielsweise keine Angleichung der Adjektive, Singular-/Plural-Fehler, da die Übersetzung auch mit diesen grammatikalischen Fehlern dennoch verständlich bleibt und der Aufwand des Posteditors möglichst gering gehalten werden soll. Eine weitere wichtige Aufgabe des Posteditors ist auch die Prüfung der Terminologie, die zwar eingebunden werden kann, aber deren Einhaltung je nach System nicht immer gewährleistet ist. Nicht zu vergessen ist am Ende das Feedback des Posteditors zu häufig auftretenden Fehlerkategorien. Dieses Feedback hilft beim Training der Maschine und bietet auch die Möglichkeit, die Ausgangstexte zu verbessern und „maschinenlesbarer“ zu machen, was wiederum den Output der Maschine optimiert.
Auf der letzten tekom in Wien gab es wirklich einige Übersetzer, die etwas panisch hinsichtlich der technologischen Entwicklung waren. Hast du einen Rat?
Ich kann das einerseits sehr gut verstehen, andererseits gab es vor 30 Jahren auch noch keine CAT-Tools. Bedeutet: Wir waren in unserer Branche schon immer dem technologischen Wandel ausgesetzt.
Übersetzer sollten sich daher in jedem Fall spezialisieren. Posteditieren ist eine sehr gefragte Zusatzqualifikation, welche an die Nachfrage und Bedeutung von Machine Translation gekoppelt ist und in Zukunft demnach noch präsenter sein wird.
Man sollte MT daher nicht als eine Gefahr sehen, sondern als Chance begreifen. Es ist nicht jeder Übersetzer der geborene Posteditor, dennoch können Schulungen und Weiterbildungen helfen, sich damit anzufreunden.
Wir können aber auch noch eine weitere Entwicklung feststellen: Während einige Kunden vor allem auf MT setzen, interessieren sich andere speziell für Transkreation oder SEO-Übersetzung und damit für Texte, die unglaublich viel sprachliches Geschick, kulturelles Einfühlungsvermögen und Wortgewandtheit brauchen. Hier ist damit mehr denn je der Humanübersetzer gefragt, nicht die Maschine.
Entwicklung von MT in den vergangenen 70 Jahren. (Quelle: oneword)
Fähigkeiten des Posteditors
Gibt es konkrete Fähigkeiten, die ein Posteditor unbedingt benötigt?
Die Devise lautet immer: So wenig wie möglich, aber so viel wie nötig ändern. Wenn der Posteditor alles nochmal auf den Kopf stellt, gehen Zeit- und Kostenvorteile gegenüber einer Humanübersetzung verloren. In dem Fall lohnt sich der Einsatz von maschineller Übersetzung nicht mehr für den Kunden. Ein Posteditor muss also in der Lage sein, schnelle Entscheidungen zu treffen: Kann ein Satz so übernommen werden, wie die Maschine ihn übersetzt hat, sind Anpassungen nötig oder muss der Satz womöglich komplett neu übersetzt werden? Jeder Übersetzer, der Post-Editing anbietet, sollte sich auch mit den unterschiedlichen Systemen vertraut machen, da dieses Wissen später bei der Bewertung des maschinellen Outputs entscheidend ist. Nicht jedes System macht dieselben Fehler. Ein System kann Fehlerquellen aufweisen, die andere System nicht oder kaum haben. Wie schon gesagt, sollte jeder Übersetzer Post-Editing als Chance und nicht als Gefahr sehen und für sich herausfinden, ob er sich darauf spezialisieren möchte oder nicht.
Vielen Dank für das Interview, Nikolina, und bis bald!
8 gute Gründe für oneword.
Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.
Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.