23.01.2024
Übersetzungsgerechtes Schreiben für das Arbeiten mit CAT-Tools
„Garbage in, garbage out?“ hatte unsere Fachleitung Qualitätsmanagement, Eva-Maria Tillmann, ihren Vortrag auf der tekom vergangenen November betitelt. Nun gibt es die darin präsentierten Erkenntnisse auch zum Nachlesen und Mitnehmen. Im folgenden Beitrag erläutert sie, wie das Arbeiten mit Tools zum computerunterstützten Übersetzen (Computer Aided Translation), kurz CAT-Tools, mit dem übersetzungsgerechten Schreiben zusammenhängt. Und sie führt aus, welche kleinen Optimierungen dabei helfen können, Übersetzungsfehler, Zeitverluste, Zusatzkosten und unnötige Rückfragen zu reduzieren.
Übersetzungsgerechtes Schreiben
Zum Einstieg kurz ausgeführt: Von übersetzungsgerechtem Schreiben spricht man, wenn bereits bei der Erstellung eines ausgangssprachlichen Inhalts die spätere Übersetzung berücksichtigt wird. Dabei spielt es keine Rolle, ob die Übersetzung human oder maschinell erfolgt. Unter ausgangssprachlichen Inhalt fällt dabei nicht nur Text, sondern Information in jeglicher Form (DIN ISO 20539:2020) – also auch per Audio und Video.
Übersetzungsgerechtes Schreiben verfolgt dabei klar vorgegebene Ziele:
- Reduzierung von Übersetzungsfehlern durch fehlerhafte, unvollständige oder inkonsistente ausgangssprachliche Inhalte
- Reduzierung unnötiger Rückfragen aufgrund missverständlicher oder unklarer ausgangssprachlicher Inhalte oder fehlender Kontext- und Referenzinformationen
- Reduzierung von Zusatzaufwänden und Zeitverlusten wie z. B. Dateivorbereitung (Abtippen von Texten, Prä-Editieren, Formatierungskorrekturen etc.), Dateinachbereitung (Layout-Optimierung), Rückfragenmanagement, oder nachträgliche Korrekturläufe
- Reduzierung von Zusatzkosten
Die gängigen Regelwerke für ausgangssprachliche Fachtexte, z. B. die Doku-Norm IEC/IEEE 82079-1:2019, haben eine fehlerfreie, sichere und effiziente Anwendung von Produkten und Maschinen zum Ziel. Auch sie befassen sich daher mit der Vollständigkeit von Sätzen, der Kompaktheit von Informationen, Konsistenz, Verständlichkeit, Eindeutigkeit, Logik, Terminologie und vielen anderen Themen, die auch Relevanz im übersetzungsgerechten Schreiben haben. Warum also braucht es hier zusätzliche Empfehlungen? Wenn der ausgangssprachliche Inhalt für Anwender:innen verständlich ist, ist er es dann nicht automatisch auch für Übersetzer:innen?
Zwar begünstigt das Einhalten der Vorgaben z. B. aus der Doku-Norm das korrekte Verständnis der Inhalte durch die Übersetzer:innen. Die Regelwerke für Ausgangstexte berücksichtigen aber bei Ihren Empfehlungen und Vorgaben nicht den Übersetzungsprozess und die Tatsache, dass beim professionellen Übersetzen Übersetzungstechnologie zum Einsatz kommt.
Übersetzungstechnologie
Der Begriff Übersetzungstechnologie bezeichnet alle Tools, die im Übersetzungsprozess verwendet werden – also bei der Humanübersetzung, bei der Revision, beim Posteditieren maschineller Vorübersetzung und bei der fachlichen Prüfung (Review). Zu diesen Tools zählen z. B. Translation-Management-Systeme, Translation Memorys, Terminologiedatenbanken, maschinelle Übersetzungssysteme, Content-Management-Systeme, DTP-Software, Evaluierungssoftware, Qualitätskontrollsoftware, Tools für Revision oder Review, Lokalisierungssysteme, Spracherkennungssoftware, Keyword-Tools, u. v. m. (Siehe hierzu auch ISO 17100, Anhang E.)
Übersetzt wird nicht in der Ausgangsdatei, sondern in CAT-Tools, in denen Translation Memorys, Terminologiedatenbanken etc. eingebunden sind. Die ausgangssprachlichen Inhalte werden in das CAT-Tool importiert, darin übersetzt und nach Abschluss der Übersetzung in der ursprünglichen Datei durch die zielsprachlichen Inhalte ersetzt, ohne dass die Übersetzer:innen die Ausgangsdatei überhaupt öffnen müssen. Dies erspart die Anschaffung von viel Zusatzsoftware (z. B. InDesign).
Relevanz für das übersetzungsgerechte Schreiben haben vor allem die Translation Memorys und ihre Segmentierungsregeln sowie Terminologiedatenbanken und die Terminologieerkennung.
Translation Memorys und Segmentierung
Ein Translation Memory (TM) ist das digitale Gedächtnis der Übersetzer:innen und speichert sogenannte Segmentpaare aus ausgangsprachlichem und zielsprachlichem Inhalt für jeweils eine Sprachrichtung (z. B. Deutsch-Englisch) ab. Diese können dann in zukünftigen Übersetzungen durchsucht und wiederverwendet werden.
Welche Texteinheiten aus einer Ausgangsdatei im CAT-Tool ein Segment bilden bzw. wo ein neues Segment beginnt, bestimmen die Segmentierungsregeln im TM. Ein Segment kann aus einem Satz, einer Überschrift oder auch nur aus einem einzigen Buchstaben bestehen und endet immer an einem Stoppzeichen. Standardmäßig sind das Punkt (.), Ausrufezeichen (!), Fragezeichen (?), Doppelpunkt (:), harte Umbrüche (¶) oder etwa das Ende einer Tabellenzelle.
Terminologiedatenbanken und Terminologieerkennung
Terminologiedatenbanken beinhalten die Terminologie eines bestimmten Unternehmens oder Sachgebiets, also Fachbegriffe mit den entsprechenden Benennungen in allen relevanten Zielsprachen. Durch die Pflege der Terminologie und deren Verwendung bei der Übersetzung wird Terminologiekonsistenz über alle Übersetzungen hinweg gewährleistet.
Bei der Einbindung einer Terminologiedatenbank ins Übersetzungsprojekt im CAT-Tool werden alle erkannten, ausgangssprachlichen Termini gekennzeichnet und (soweit vorhanden) direkt die zielsprachlichen Benennungen aus der Datenbank angezeigt.
Was hat das mit übersetzungsgerechtem Schreiben zu tun?
Die Expertise über Übersetzungstechnologie und die Funktionsweisen von TM und Terminologiedatenbanken ist zu Recht beim Dienstleister zu erwarten und zu verorten. Dennoch sollten auch Redakteur:innen von Fachtexten wissen, welche Fallstricke im Zusammenhang mit Übersetzungstechnologie sich in ihren Inhalten verstecken und diese eliminieren.
Die Layout-Falle
Ein Hauptgrund dafür, dass Texte – bezogen auf den Einsatz von Übersetzungstechnologie – oft nicht übersetzungsgerecht sind, ist die Formatierung. Wer kennt es nicht? Ein Wort soll doch lieber in der nächsten Zeile stehen, Text soll anders eingerückt oder ein Wort anders getrennt werden, um den Platz im Layout optimal zu nutzen. Also wird schnell selbst Hand angelegt.
Doch das manuelle Eingreifen in das Layout kann insbesondere für die Segmentierung, aber auch für die Terminologieerkennung problematisch sein. Stattdessen sollten immer die Formatierungstools der Texteditoren genutzt werden, wie unsere folgenden Beispiele zeigen.
Grundsätzlich ist es sinnvoll, in allen Texteditoren die Absatz-/Textmarken einzublenden. (Bei MS Word und Adobe InDesign ist dies möglich, bei MS PowerPoint oder MS Excel leider nicht.) Denn damit lassen sich überflüssige Eingriffe in die Formatierung direkt erkennen:
Absatz-Textmarken einblenden – Empfehlung
Fall 1: Manuell erzwungene Zeilenumbrüche
Harte Umbrüche (Enter, ¶) gelten als Stoppzeichen für die Segmentierung. Fügt man also zu Layoutzwecken einen harten Umbruch mitten im Satz ein, werden aus einem einzigen Satz zwei Segmente. Dies kann zu Zusatzaufwand in der Dateivorbereitung führen, um die Umbrüche vorab zu löschen oder getrennte Segmente im CAT-Tool zu verschmelzen. Bei Nicht-Behebung entstehen allerdings zwei oder mehr Segmente, deren sinnvolle Übersetzung erschwert und für weitere Projekte eventuell unbrauchbar sein kann.
Harte Umbrüche im Texteditor
Harte Umbrüche – Auswirkungen im Editor im CAT-Tool
Harte, manuell eingefügte Umbrüche gilt es also unbedingt zu vermeiden. Alternativ können weiche Umbrüche (↵) verwendet werden, die den gleichen Zweck erfüllen, aber nicht als Stoppzeichen gelten. Zu beachten ist hier – genau wie bei harten Umbrüchen – jedoch, dass der Umbruch je nach Lauflänge der Übersetzung an völlig anderer Stelle stehen kann und damit seinen Zweck zur Layoutgestaltung eventuell nicht mehr erfüllt.
Ebenso kann die Verwendung eines geschützten Leerzeichens (°) verhindern, dass Textteile segmentiert werden, die eigentlich nicht getrennt werden dürfen. Die Verwendung empfiehlt sich daher bei Abkürzungen wie „z.°B.“.
Auch geschützte Bindestriche (-) helfen dabei, keine unnötigen Textfragmente und Segmentierungen zu erzeugen. Wird etwa der Bindestrich zwischen „E-Mail“ durch einen geschützten Bindestrich ersetzt, wird verhindert, dass nur das „E-“ am Ende einer Zeile und das „Mail“ am Anfang der nächsten steht.
Fall 2: Manuelle Worttrennung mit Bindestrichen
Während geschützte Bindestriche Wörter betreffen, die immer einen Bindestrich enthalten und an diesen Stellen nicht getrennt werden sollen, werden Bindestriche auch verwendet, um Wörter zur Layoutoptimierung manuell zu trennen. Lange Wörter stehen dann nicht komplett in einer neuen Zeile und große Textlücken werden vermieden. Da es sich dabei um einen manuellen Eingriff und nicht um ein systembedingtes Zeichen handelt, taucht der Bindestrich als Zeichen auch im Ausgangstext auf. Ändert sich künftig das Layout, muss das Zeichen auch wieder manuell entfernt werden und führt eventuell zu geringeren Trefferquoten und dadurch Zusatzkosten bei der Übersetzung.
Worttrennung
Worttrennung – Auswirkungen im Editor im CAT-Tool
Worttrennung – Auswirkungen bei Nachfolgeaufträgen
Auch die Terminologieerkennung kann durch das Hinzufügen von Bindestrichen beeinträchtigt werden. Ist etwa das Wort „registrieren“ in der Termbank hinterlegt, würde das Wort „regis-trieren“ nicht erkannt. Damit besteht die Gefahr von inkonsistenter und falscher Terminologieverwendung. Es empfiehlt sich daher immer, die automatische Silbentrennungsfunktion der Texteditoren zu verwenden.
Worttrennung – Auswirkungen auf die Terminologieerkennung im CAT-Tool
Fall 3: Manuelles Einrücken mit Tabulatoren und Leerzeichen
Neben Bindestrichen und Umbrüchen werden auch Tabulatoren (?) oder Leerzeichen (·) zum Einrücken von Text oder Satzteilen zur Layoutoptimierung eingesetzt. Auch hierbei gilt, dass das Layout für eine Sprache durch unterschiedliche Lauflängen der Übersetzungen nicht automatisch auf anderen Sprachen übertragen werden kann. Im schlimmsten Fall führen gerade manuelle Eingriffe wie zusätzliche Einrückungen dazu, dass der Textfluss in der Übersetzung unterbrochen und manuelle Nacharbeit nötig ist. Bei einer Überarbeitung des Ausgangstexts und einer erneuten Übersetzung kann es außerdem – genau wie im Beispiel oben – zu Zusatzkosten kommen, da geänderte Tabs als geänderter Ausgangstext gewertet werden und Segmente nochmals übersetzt werden, für die eigentlich bereits eine Übersetzung vorhanden ist. Die Lösung ist auch in diesem Fall die Arbeit mit den Formatierungsfunktionen des Texteditors, zum Beispiel mit Einzügen, Spaltengrößen und Rändern.
Tabulatoren
Die Terminologie-Falle
Auch Terminologie und unterschiedliche Schreibweisen können einen Grund darstellen, dass Texte (bezogen auf den Einsatz von Übersetzungstechnologie) nicht übersetzungsgerecht sind. Für den optimalen Lesefluss ist man schnell versucht, Fachterminologie nicht immer komplett auszuschreiben. Auch intern gängige Bezeichnungen und Abkürzungen werden im Schriftlichen verwendet, ohne dass erläutert wird, was damit gemeint ist.
Warum Unaufmerksamkeit bei der Wortwahl insbesondere für die Terminologieerkennung, aber auch für maschinelle Übersetzungssysteme und Humanübersetzer:innen problematisch sein kann, zeigen die folgenden Beispiele.
Kurzformen und Abkürzungen
Im ersten Beispiel wird im ersten Satz die Langform (Innensechskant-Schraubendreher), danach aber nur noch die Kurzform (Schraubendreher) verwendet. Die englischen Entsprechungen laut Datenbank unterscheiden sich allerdings, sodass für Leser:innen nicht klar ist, dass das gleiche Werkzeug gemeint ist.
Kurzformen
Auch unbekannte oder unübliche Abkürzungen, wie AT und ZT für Ausgangstext und Zieltext, erschweren die Übersetzbarkeit und führen zu Rückfragen. Maschinelle Übersetzungssysteme wiederum übernehmen Abkürzungen häufig identisch wie im Ausgangstext, was eine häufige Fehlerquelle darstellt.
Abkürzungen
Auch wenn Textbausteine aus CMS-Systemen exportiert werden, fehlt diesen oft der Kontext und der aktuell zu übersetzende Textteil enthält eventuell nur noch Kurzformen oder Abkürzungen. Daraus entstehen schnell Inkonsistenzen mit schon übersetzten Textpassagen. Als Lösungsweg empfiehlt es sich, Fachbegriffe in der Langform zu verwenden und Abkürzungen in einem Abkürzungsverzeichnis zu erklären.
Synonyme
Auch die Verwendung unterschiedlicher Termini für denselben Begriff kann mindestens zwei Gründe haben: Entweder soll der Text durch die Abwechslung aufgelockert und interessanter werden oder es wurde keine einheitliche Terminologie festgelegt, sodass eine klare Vorgabe fehlt. Das Ergebnis sind mehrere Fachtermini (z. B. Schraubenzieher, Schraubendreher) und damit eventuell Unsicherheit bei Übersetzer:innen und Leser:innen, ob es sich um den gleichen Begriff handelt. Umgangen werden kann dieser Wildwuchs nur, indem immer die festgelegte Terminologie verwendet wird, egal, wie häufig sich ein Terminus im Text wiederholt.
Fazit: Wenig Aufwand, viel und gute Wirkung
Schon mit wenigen einfachen Optimierungen lassen sich ausgangssprachliche Inhalte verbessern, wovon auch Leser:innen und Anwender:innen profitieren, die mit dem Originaltext arbeiten. Übersetzungsfehler, Zusatzaufwände, Zeitverluste oder unnötige Rückfragen lassen sich auf diese Weise ebenfalls minimieren. Schlüsselfaktoren sind dabei die Nutzung der Formatierungstools der Texteditoren und möglichst wenig manuelle Eingriffe in Formatierung und Layout sowie die konsistente Nutzung vorgegebener Fachterminologie.
Möchten Sie mehr über das übersetzungsgerechte Schreiben bei der Verwendung von CAT-Tools erfahren? Dann können direkt unter e.tillmann@oneword.de Kontakt mit der Autorin und Expertin aufnehmen.
8 gute Gründe für oneword.
Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.
Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.