17.06.2021

Gendern in der maschinellen Übersetzung – wie das funktioniert und worauf zu achten ist

Gendergerechte Sprache ist – nicht nur in Deutschland – ein kontrovers diskutiertes Thema. In den ersten beiden Teilen unseres Beitrags haben wir eine Einordnung für Deutschland und uns selbst vorgenommen und dann einen Blick aufs Gendern in anderen Sprachen und Ländern geworfen. Im dritten und letzten Teil richten wir den Fokus auf maschinelle Übersetzung, ein Trendthema der Übersetzungsbranche, und beleuchten, ob und wie Maschinen gendern können und welche sprachlichen Hürden dabei zu überwinden sind.

Kann maschinell gegendert werden?

Beim Thema Gendergerechtigkeit und genderneutrale Sprache wird sehr schnell deutlich: Es gibt kein richtig oder falsch, stattdessen gibt es eindeutige Meinungen und nicht selten auch handfeste Meinungsverschiedenheiten. Während die einen es als sprachlichen Firlefanz und überflüssige Diskussion ansehen, betonen andere, dass die Diskussion um sprachliche Feinheiten die reale Ungerechtigkeit nicht löst. Befürworter:innen gendergerechter Sprache führen mehr Gerechtigkeit und eine Sichtbarmachung aller als Argumente ins Feld. Ob und wie sehr Sprache angepasst, umgestellt und teilweise reguliert werden kann oder sollte, ist also ein tiefgreifend menschliches und teilweise sehr persönliches Thema. (Siehe dazu auch Teil 1: Warum oneword gendert – und andere das auch tun sollten)

Was passiert aber, wenn man künstliche Intelligenz in dieses Thema involviert? Zumal die geführte Diskussion samt ihrer menschlichen und emotionalen Komponenten einer Maschine grundsätzlich egal sein sollte. Für uns als Sprachdienstleister:innen ist dabei vor allem die maschinelle Übersetzung (Machine Translation, MT) interessant. Ein Vorgehen, bei dem ein Text auf Basis von Algorithmen und antrainierten Sprachmustern in eine Zielsprache übertragen wird. Je nach MT-System erfolgt dies entweder regel- oder korpusbasiert. Sprich: Die Maschine „lernt” eine Sprache entweder durch vorgegebene Sprachregeln oder durch einen Abgleich und die Übernahme von Mustern aus bestehenden Übersetzungen.

Nun ist gendergerechte Sprache ein recht aktuelles Phänomen, zu dem es bisher kaum oder keine sprachlichen Regeln gibt und dessen Umsetzung sich erst seit kurzer Zeit in Textkorpora findet. Entsprechend divers sind also auch die Möglichkeiten, gendergerecht zu schreiben: mit Sternchen, Unterstrich, Doppelpunkt, Doppelnennung, oder Binnenmajuskel im Deutschen, mit Binnenpunkt im Französischen oder mit den Zeichen x, e oder @ im Spanischen. (Siehe dazu auch Teil 2: Wie andere Sprachen gendern.)

Für die Übersetzung stellt sich also die Frage: Können MT-Systeme bereits Muster beim Gendern erkennen und korrekt in eine Zielsprache übertragen? Unsere eigenen ausgiebigen Tests mit verschiedenen Systemen, Genderzeichen und Sprachen zeigen: Es kommt auf alle drei Faktoren an.

Die Maschinen erkennen die meisten Genderzeichen, die im Deutschen verwendet werden, und setzen diese um. Sprich: Der Text wird als zusammenhängend erkannt und – je nach Zielsprache – neutral oder in ein generisches Maskulinum übertragen. Aus „Student*innen” wird also „students” im Englischen (geschlechtsneutral) und „étudiants” im Französischen (maskulin). Eine Übertragung in eine ebenfalls gegenderte Form in der Zielsprache findet nicht statt.

Einen Fehler gibt es allerdings bei der Verwendung des Doppelpunkts (Student:innen) bei Testübersetzungen ins Französische: Ein Doppelpunkt erfordert im Französischen grundsätzlich ein Leerzeichen vor und nach dem Zeichen. Da diese Regel vor dem inhaltlichen Bezug angewendet wird, wird der Wortteil „:innen” abgetrennt und als „intérieur” („drinnen”) übersetzt. Ein zwar nachvollziehbares Maschinenverhalten, dass den Zielsatz jedoch völlig sinnentstellt. Dieser Fehler trat jedoch nur in einem der drei getesteten MT-Systeme auf:

Gendern in der maschinellen Übersetzung ; Screenshot1
Gendern in der maschinellen Übersetzung ; Screenshot2

Weitere untersuchte Genderzeichen werden von den meisten Systemen und in den meisten Sprachen problemlos erkannt, teilweise aber auch fehlinterpretiert. Bei der Umsetzung des französischen Binnenpunkts, bei der alle Wortformen bzw. -endungen hintereinander, durch Punkte innerhalb des Worts getrennt, angeführt werden, zeigen sich die größten sprachlichen Probleme: Während System 1 alles korrekt erkennt und übersetzt, lässt System 2 im ersten Satz einen Teil aus und gibt im zweiten Satz die Informationen nur kryptisch und verkürzt aus. System 3 übersetzt den ersten Satz richtig, interpretiert den zweiten Satz aber irrtümlich, da nicht „dem Wähler” ein Dokument vorgelegt werden muss, sondern „die Wähler:innen” ein Dokument mitführen müssen.

Gendern in der maschinellen Übersetzung ; Screenshot3
Gendern in der maschinellen Übersetzung ; Screenshot4

System 1: Korrekte Umsetzung

Gendern in der maschinellen Übersetzung ; Screenshot5

System 2: Beide Sätze fehlerhaft

Gendern in der maschinellen Übersetzung ; Screenshot6

System 3: Satz 1 korrekt, Satz 2 fehlinterpretiert

Wichtig beim Einsatz maschineller Übersetzung für gegenderte Texte ist also die Auswahl des MT-Systems und das Wissen über mögliche Stolpersteine. Soll ein System speziell für ein Unternehmen trainiert werden, gilt genau wie für Terminologie und Stilvorgaben, dass die Gendervorgaben bereits im Trainingsmaterial enthalten und konsistent umgesetzt sein müssen. In diesem Fall ließe sich der Maschine dann auch die korrekte Übersetzung in die gewünschte Genderform der Zielsprache antrainieren. Andernfalls werden, wie die Tests zeigen, Gendermuster zwar erkannt, dann aber doch ins viel diskutierte generische Maskulinum übertragen. Schlägt sich die künstliche Intelligenz damit etwa auf die Seite der Gender-Gegner?

Diskriminierung durch Maschinen?

Nicht wirklich, natürlich. Das MT-System „entscheidet” nicht über die Umsetzung des Genderns, ebenso wenig, wie es aktiv diskriminiert. Der zugrundeliegende Algorithmus sammelt und verwertet alle verfügbaren Daten und Informationen eines Sprachpaars, um auf dieser Basis Sprachmuster zu erkennen und reproduzieren zu können. Somit spiegelt die maschinelle Übersetzung die aktuell etablierte Kommunikation samt aller tradierten geschlechtsspezifischen Unterscheidungen und Rollenzuschreibungen, ohne diese jedoch zu bewerten oder sich aktiv für oder wider eine bestimmte sprachliche Umsetzung zu entscheiden.

Doch ist es dann mit einem einfachen „die Maschine kann nichts dafür, sie hat es so gelernt” getan? Unsere Testergebnisse zeigen das Ausmaß, in welchem die Maschinen klassische Rollenbilder wiedergeben und damit tief in die Kerbe der Geschlechterdebatte schlagen: Gibt man einem Subjekt im Satz das Adjektiv „hübsch” an die Seite (Beispiel: hübsche Studierende), ist das Ergebnis in geschlechtsspezifischen Zielsprachen in der Regel weiblich, bei „intelligent” aber männlich:

Gendern in der maschinellen Übersetzung ; Screenshot7

Noch deutlicher wird dieser Bias, wenn man das Geschlecht in einer geschlechtssensiblen Ausgangssprache explizit vorgibt, diese Vorgabe aber durch Stereotype im Algorithmus ausgehebelt wird. Der männliche Krankenpfleger in einem spanischen Text (enfermero) wird im Deutschen in der Regel mit „Krankenschwester” übersetzt, die weibliche Chefin (jefa) hingegen mit „Chef”. Diese Rollenbilder zeigen sich ebenso bei Tätigkeiten und Besitzverhältnissen, wie ein Beispiel aus dem Finnischen, einer Sprache ohne Unterscheidung zwischen „er” und „sie”, zeigt:

Gendern in der maschinellen Übersetzung ; Screenshot8

Technisch verantwortlich ist eine sogenannte NEAR-Funktion, die einem Wort oder einer Wortgruppe rein statistisch ein weiteres Wort, zum Beispiel ein Pronomen, zuordnet.

Was speziell bei maschineller Übersetzung eigentlich ein Vorteil sein kann, wenn die Maschine zum Beispiel ein fehlendes Verb sinnvoll ergänzt, macht im Kontext der Geschlechtergerechtigkeit und Gendern-Diskussion die gesellschaftlich geprägten Sprachgewohnheiten deutlich sichtbar.
Es ist also nicht die Maschine, die in irgendeiner Form diskriminiert, sondern es sind die verankerten Rollenzuschreibungen, die tief in unserer Sprache und damit in den Trainingstexten der Algorithmen stecken. Vielleicht ist dies noch ein Argument mehr, um diese Sprachmuster aufzubrechen und auch durch Gendern zu mehr Sichtbarmachung aller in der Gesellschaft beizutragen.

In unserem Blog „Fehlerquellen der maschinellen Übersetzung: Wie der Algorithmus ungewollte Rollenbilder reproduziert“ widmen wir uns dem Thema noch einmal genauer.

8 gute Gründe für oneword.

Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.

Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.

Angebot anfordern

    Ich bin damit einverstanden, dass mich die oneword GmbH kontaktiert und meine angegebenen Daten speichert.