24.09.2024

Post-Editing von maschineller Übersetzung: Warum auch KI Übersetzer:innen nicht überflüssig macht

Revolutionen im Übersetzungsbereich kündigen sich oft in Form von zwei Buchstaben an: Das war bei Translation Memorys (TM) in den 1990ern so, setzte sich mit maschineller Übersetzung (MT) seit Mitte der 2010er fort und zeigt sich seit 2022 beim Hype um KI erneut bestätigt. Die Sprachbranche neigt allgemein dazu, vieles auf zwei Buchstaben zu reduzieren, um Platz und Zeit zu sparen. Von AA für Afar bis ZU für Zulu listet die ISO 639-1 insgesamt 183 zweibuchstabige Sprachkürzel auf und von HÜ für Humanübersetzung und QS für Qualitätssicherung haben auch viele Leistungen und Prozesse ihre gängige Abkürzung. Eigentlich ein interessantes Verhalten für eine Branche, die von korrekter Sprache und Verständlichkeit lebt.

Hier weiterlesen

Gerade die Zeitersparnis macht auch das Posteditieren – meist abgekürzt als PE – aus: Von der menschlichen Nachbearbeitung einer maschinellen Vorübersetzung erhofft oder erwartet man deutliche Zeit- und Kostenvorteile im Vergleich zu einer Humanübersetzung. Da aber die Qualität nicht unter der schnelleren und damit günstigeren Bearbeitung leiden soll, scheint der Spruch „Gut, schnell, günstig – Suchen Sie sich zwei davon aus!“ ausgedient zu haben. Durch den KI-Hype bekommt diese Erwartungshaltung nochmals frischen Wind. Höchste Zeit also, einen Blick auf die Anforderungen an das Posteditieren zu werfen.

Post-Editing: Effizienzgewinn oder Illusion?

„Wir lassen das durch die Maschine vorübersetzen und dann liest da nur nochmal kurz jemand drüber.“ Dieser Satz trifft Übersetzungsdienstleister und Übersetzer:innen schwer. Nicht nur, weil potenzielles Übersetzungsvolumen verschwindet, sondern weil jahrelange Erfahrung zeigt, dass noch immer kein MT-System fehlerfrei übersetzt und der Teufel oft im Detail steckt.

Der Erfolg von MTPE – also dem menschlichen Posteditieren einer maschinellen Vorübersetzung – misst sich am Aufwand dieser Nachbearbeitung: Wie viel Prozent des MT-Outputs musste wie stark durch die Posteditor:innen angepasst werden? Für die Bewertung nutzen wir bei oneword die sogenannte “Drittel-Regel”: Muss mindestens ein Drittel des Outputs gar nicht korrigiert werden, ein Drittel nur leicht verändert und höchstens ein Drittel stark verändert oder komplett neu übersetzt werden, gilt der Einsatz von MTPE als sinnvoll.

Je höher die Werte der ersten beiden Kategorien, desto effizienter ist der MTPE-Prozess. Andersherum ist ein hoher Anteil der letzten Kategorie ein klares Indiz, dass MTPE keine gute Wahl für ein Projekt war.

Schwachstelle in der Analyse

So wichtig eine Analyse und Bewertung nach erfolgtem Posteditieren auch ist, hat der Fokus auf den Änderungskennzahlen allerdings zwei Haken: Die prozentuale Abweichung vom ursprünglichen MT-Output sagt nicht automatisch etwas über den kognitiven Aufwand einer Änderung oder die Schwere des korrigierten Fehlers aus.

Das Einfügen oder Fehlen des Wortes „nicht“ stellt beispielsweise nur eine geringe Anpassung mit wenig Aufwand dar, kann den Inhalt eines Textes aber grundlegend verändern. Eine komplette Umstrukturierung, um einen Satz an die Vorgaben eines Styleguides anzupassen oder ihn in Einklang mit einem vorhergehenden Satz zu bringen, kann wiederum eine starke Anpassung darstellen, von deren Unterlassung aber ein geringes bis gar kein Risikopotenzial ausgeht.

Am reinen Änderungsgrad lässt sich außerdem nicht ablesen, wie hoch die kognitive Leistung bei der Bearbeitung war. Ein Satz muss vielleicht zwei- oder dreimal gelesen und benötigte Infos recherchiert werden, bevor er unverändert freigegeben wird und damit in die Kategorie „keine Änderungen“ fällt. Wird der MT-Output wiederum auf den ersten Blick als falsch und unpassend eingeschätzt, ist eine komplette Neuübersetzung manchmal schneller eingefügt, als der bestehende Satz überarbeitet werden könnte.

Schlaue Maschinen, schlaue Fehler

Da neuronale maschinelle Übersetzung und seit einiger Zeit auch Large Language Models (LLM), die zur Übersetzung eingesetzt werden, oft durch flüssig und schlüssig klingenden Output überzeugen, ist es umso schwieriger, sich beim Posteditieren von dieser sprachlichen Eleganz nicht blenden zu lassen und die teils sehr subtilen Fehler zu erkennen. In der Praxis zeigt sich immer wieder, dass Fehler sogar eher übersehen werden, wenn die Vorübersetzung insgesamt nur sehr wenige Korrekturen erfordert. Es kann dann geradezu abwechslungsreich sein, wenn sich zwischen all die kleinen Fehler auch mal ein richtiger Ausrutscher schleicht, wie das folgende Beispiel zeigt.

In diesem Text ging es eigentlich um einen alternativen Schiffsantrieb durch Windsegel. Das Ergebnis lässt einen jedoch direkt in Fantasy-Welten eintauchen und würde so manchen Containertransport deutlich ansehnlicher machen:

Post-Editing: mehr als nur eine Korrekturschleife

Dem Posteditieren haftet oft der Vergleich zum Korrekturlesen oder der Revision an. Schließlich ist ja bereits eine Übersetzung vorhanden, die „nur noch“ geprüft werden muss. Im Vergleich zur Revision einer Humanübersetzung, bei der im besten Fall nur Kleinigkeiten oder gar nichts angepasst werden muss und bei der grundsätzlich von Korrektheit ausgegangen wird, ist das MT-Ergebnis aber deutlich weniger verlässlich: Während zehn Sätze in Folge fehlerfrei und flüssig sein können, kann Satz 11 grobe Fehler enthalten, völlig an den Vorgaben vorbeigehen, einen Stilbruch enthalten oder aufgrund von Tags, Satzstruktur oder Wortwahl komplett unbrauchbar sein. Gerade bei kontextlosen Sätzen oder Satzteilen (zum Beispiel Tabellen in Anleitungen) gilt die Alles-oder-Nichts-Regel: Der MT-Output kann entweder komplett richtig oder eben komplett falsch sein.

Häufig wird das Argument angeführt, dass die maschinelle Vorübersetzung zumindest immer als Ausgangspunkt genutzt werden könne und dass es schneller sei, vorhandenen Output zu korrigieren, als einen Satz komplett neu zu übersetzen. Zur Entkräftung hilft es, die Arbeitsschritte des Posteditierens aufzulisten:

Lesen und Prüfen der maschinellen Vorübersetzung
Entscheiden, ob die Vorübersetzung übernommen werden kann, angepasst werden muss oder nicht verwendet werden kann.
Bestätigen der Übersetzung, Überarbeiten oder Löschen des MT-Outputs und komplette Neuübersetzung.

Die Schritte der Prüfung und Entscheidung erfolgen zusätzlich zur Humanübersetzung, die erst an diesem Punkt ansetzen würde. In Fällen, in denen eine Neuübersetzung nötig ist, muss der vorübersetzte Satz gelöscht und die eigene Übersetzung eingefügt werden. Zusätzlich zum Mehraufwand des Löschens wird der eigene Satz in den meisten Fällen von der gerade gelesenen Vorübersetzung „gefärbt“ sein, wodurch eine freie und kreative Übersetzung im eigenen Stil erschwert wird.

Der eigene Stil und auch die gewohnte Arbeitsweise rücken beim Posteditieren generell in den Hintergrund. Laut DIN ISO 18587 für das Posteditieren maschineller Übersetzungen soll so viel MT-Output wie möglich verwendet und nur notwendige Anpassungen vorgenommen werden. Um den Korrekturaufwand pro Satz von vornherein zu verringern, ist außerdem ein strukturiertes Vorgehen üblich, bei dem zum Beispiel zu Beginn des Projekts inkorrekte Fachtermini global gesucht und ersetzt werden oder bestimmte Prüfkriterien direkt abgearbeitet werden. Entscheidend für die Effizienz des Posteditierens ist daher neben Fachkenntnissen auch das technische Know-how über die Arbeitsweise von MT und unterstützende Funktionalitäten in den CAT-Tools.

Mit Abschluss des Posteditierens ist die Aufgabe noch nicht ganz erledigt, denn MTPE-Projekte leben vom Feedback zum MT-System und der Dokumentation von Fehlerquellen und Optimierungspotenzial. Hierbei geht es um die Fragen, welche Fehler im MT-Output vorkommen und ob und wie sich diese vermeiden lassen können, zum Beispiel durch die Einbindung eines Glossars oder die Anpassung des Ausgangstextes. Aufgabe der Posteditor:innen ist es also auch, Fehler der MT-Systeme zu analysieren und zu kategorisieren. Wiederholt sich schlechtes Feedback, können daraus Maßnahmen abgeleitet werden, zum Beispiel der Wechsel auf ein anderes MT-System oder der Ausschluss von MTPE für eine bestimmte Sprache oder Textsorte.

Da sich Posteditor:innen am intensivsten mit dem MT-Output und dessen Korrektur beschäftigen, sind oft weitere Aufgaben nach Projektabschluss bei ihnen angelagert, wie die Erstellung oder Ergänzung eines PE-Leitfadens, um typische Vorgaben und Stolperfallen zu dokumentieren.

Der Einfluss von KI auf MTPE

Mit Aufkommen von Large Language Models und deren Einsatz für Übersetzungen sind zahlreiche neue Aufgaben für Sprachexpert:innen entstanden: vom Vergleich des Outputs zwischen verschiedenen MT-Systemen und LLMs über Glossarerstellung, Analysen und Datenoptimierung bis hin zum Prompt Engineering, um der KI bestimmte Vorgaben mitzugeben. Denn im Vergleich zu einem klassischen MT-System kann man einem LLM schnell beibringen, dass zum Beispiel im Deutschen mit Doppelpunkt gegendert oder dass aktive Formulierungen verwendet werden sollen. Auch die Nachbearbeitung eines MT-Ergebnisses lässt sich durch KI unterstützen, um bestimmte Vorgaben wie die Formulierung von Anweisungen oder die Verwendung von Fachtermini umzusetzen. Erste Schnittstellen zu CAT-Systemen sind dafür bereits verfügbar, viele weitere werden sicherlich folgen.

Gerade im Hype um KI kam aber wieder die Frage auf, die der Übersetzungsbereich schon seit mindestens 2016, also dem Aufkommen von neuronaler maschineller Übersetzung kennt: Werden Übersetzer:innen bald überflüssig, weil die Maschine den Menschen ersetzt?

Die Tätigkeit des Übersetzens hat sich in den letzten Jahren kontinuierlich entwickelt und an neue Gegebenheiten, so auch an den Einsatz maschineller Übersetzung angepasst.

Dabei geht es aber idealerweise eher um die Frage, bei welchen Aufgaben die Maschinen den Menschen unterstützen können. Wie aufgezeigt, kann der Übersetzungsprozess durch den Einsatz von MT und KI deutlich beschleunigt werden. Die entscheidenden und kognitiv anspruchsvollen Aufgaben zur kurz- und langfristigen Sicherstellung von Qualität – wie das Posteditieren selbst, aber auch Fehleranalysen und Strategien zur Prozessunterstützung – liegen jedoch immer bei den beteiligten Menschen. Im besten Fall entsteht durch die MT-Unterstützung auch Zeit für andere wichtige Aufgaben, zum Beispiel kreative Übersetzungen, sprachliche Nuancierung oder Language Engineering zur Prozessoptimierung und Datenkontrolle. Der viel zitierte „human-in-the-loop“-Ansatz hat also längst nicht ausgedient, sondern sollte eher zum „human-in-control“-Ansatz umformuliert werden, bei dem MT und KI als hilfreicher Co-Pilot agieren. Weder Mensch noch Maschine sind in diesem Szenario überflüssig, sondern unterstützen sich gegenseitig.

Wenn auch Sie maschinelle Übersetzung einsetzen oder darüber nachdenken und dabei auf Qualität und Know-how setzen wollen, dann nehmen Sie am besten gleich Kontakt mit uns auf.

8 gute Gründe für oneword.

Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.

Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.

Gründe ansehen