26.04.2022
Übersetzungsqualität
Synthetic Content: Was Künstliche Intelligenz abseits maschineller Übersetzung kann und braucht
Synthetische, von künstlicher Intelligenz erstellte Texte und Übersetzungen, Bilder, Videos und Stimmen können von Unternehmen mit wenig Aufwand und viel Effekt zum Einsatz gebracht werden. Nicole Sixdorf, unsere Expertin für Übersetzungsmanagement, erläutert, worauf dabei zu achten ist und wie dies sinnvoll, gezielt und erfolgreich funktioniert.
Wir alle kennen die Szene: Keanu Reeves als Neo im 90er-Jahre-Blockbuster „Matrix“, der per Knopfdruck nicht nur diverse Kampfkünste erlernt, sondern auch aus nichts weiter als Programmiercode allerlei Ausrüstung und Utensilien erschafft. Was seinerzeit noch bloße Fantasie war, ist dank ausgeklügelter Algorithmen und immer elaborierterer KI-Anwendungen mittlerweile (virtuelle) Realität.
Was im Film die Matrix war, ist im digital geprägten Alltag inzwischen Synthetischer Content: Künstlich geschaffene Inhalte, denen wir immer wieder auf unterschiedliche Weise begegnen. Oft, ohne uns dessen bewusst zu sein. Bekanntestes Beispiel sind sicher die sogenannten Deepfakes, die in den letzten Jahren immer häufiger durch die Medienlandschaften geistern. Synthetic Content ist allerdings weitaus vielfältiger.
Was ist Synthetic Content?
Der Begriff Synthetic Content beschreibt von künstlicher Intelligenz (KI) bzw. lernenden Algorithmen – wie in „Matrix“ sagen wir auch Maschinen – geschaffene synthetische oder künstliche Inhalte, an deren konkretem Entstehungsprozess kein Mensch mehr beteiligt ist.
Ein Beispiel: Wenn ein Text vom Deutschen ins Englische übersetzt werden soll, wird er in der Regel von einem:einer Übersetzer:in kraft Talent, kognitiver und motorischer Fähigkeiten von der einen in die andere Sprache übertragen. Dies ist der „klassische“ vom Menschen erstellte Inhalt – eine Humanübersetzung. Kopiert man den Text in Übersetzungsmaschinen wie z. B. DeepL, dann schafft eine künstliche Intelligenz bzw. ein neuronales Netzwerk eine synthetische Übersetzung, basierend auf tausenden Parametern und Datenpunkten, ohne dass ein Mensch an der Erstellung der konkreten Übersetzung beteiligt ist – die maschinelle Übersetzung.
Synthetic Content hat grenzenlose Möglichkeiten
Heutzutage können Maschinen längst nicht nur Texte, sondern auch Bilder, Videos, Stimmen und Musik aus einem schier endlosen Reservoir an Daten generieren. Auf Knopfdruck lassen sich so zum Beispiel auf der Website This Person does not exist Bilder von Menschen erschaffen, die – wie der Titel sagt – schlicht nicht existieren. Der Vorteil: Personenbezogene Bildrechte und Datenschutz, etwa für die Verwendung in Marketingbroschüren, sind nicht zu beachten. Der Nachteil: Die Nicht-Existierenden sind praktisch nicht von echten Menschen zu unterscheiden und bieten einiges Potenzial für Täuschung und Missbrauch.
Beispiele für künstlich generierte Personen (Quelle: This person does not exist)
Meist braucht es für die Erstellung von Synthetic Content lediglich den minimalen Input von Kurzbeschreibungen – sogenannte Prompts – oder entsprechende Parameter, die der künstlichen Intelligenz einen Weg vorgeben. Dahinter respektive entlang dieses Weges stehen jedoch riesige Mengen aufbereiteter Daten und ein ausgefeiltes Netz aus künstlichen Neuronen.
Von generischen Kunstwerken, Bildern von Menschen, Tieren oder Fantasiegebilden über eloquente Essays, Zeitungsartikel oder Produktbeschreibungen bis hin zu Stimmen von Alexa oder Siri und generierten Videos in dutzenden Sprachen sind der Erstellung von Synthetic Content kaum Grenzen gesetzt. Das Qualitätsspektrum der Ergebnisse erstreckt sich allerdings auch von absurd und unsinnig über passabel bis täuschend echt.
Gemeinsamer Faktor ist Sprache
Damit die künstliche Intelligenz (KI) weiß, was sie erstellen soll, ist eine Kommunikation zwischen Mensch und KI herzustellen. Wenn wir also etwa von Alexa wissen wollen, wie das Wetter morgen wird, um zu entscheiden, ob wir doch lieber die Regenjacke aus dem Schrank holen, muss Alexa – die KI – unsere Sprache verarbeiten können.
Das Verarbeiten von Sprache wird Natural Language Processing (NLP) genannt. „Natürliche Sprache“ meint in diesem Fall die menschliche Sprache, denn in der Regel sind Computer nur dann Sprachgenies, wenn es um Programmiersprachen geht.
NLP unterteilt sich in zwei wesentliche Bereiche: Zum einen das Natural Language Understanding (NLU), das die Maschine befähigt, menschliche Sprache „verstehen“ bzw. verarbeiten und interpretieren zu können. Und zum anderen die Natural Language Generation (NLG), also die Generierung bzw. Reproduktion menschlicher Sprache durch die KI. Beispiele hierfür sind sowohl die textliche Form der maschinellen Übersetzung als auch die Form von gesprochener Sprache, etwa beim heimischen Amazon Echo.
Ein weiterführendes Anwendungs- oder Paradebeispiel zur Verdeutlichung der Fortschritte von NLP und Synthetic Content ist der Avocado-Sessel, der in unterschiedlichsten Formen vom neuronalen Netzwerk DALL-E erschaffen wurde. Diese beeindruckende KI erzeugt Bilder aus kurzen Textbeschreibungen, die Nutzer:innen frei erstellen können, und generiert auf deren Grundlage direkt passende Bilder für Artikel, Beschreibungen und andere Texte. Dazu muss die KI allerdings Bezüge zwischen den Worten herstellen – also erkennen, was ein Substantiv, Adjektiv oder Verb ist, und die einzelnen Wörter interpretieren können –, denn natürlich hat eine Maschine keine Vorstellung davon, was ein „Sessel“ ist, wenn wir dies nicht anhand von Daten definieren. Genau hier setzt das NLP an.
Avocado-Sessel (Quelle: DALL-E)
Synthetic Content in Unternehmen
Ebenso vielfältig wie die Arten und Möglichkeiten künstlicher Inhalte sind auch ihre Anwendungsbereiche. Größere Unternehmen nutzen Synthetic Content inzwischen bspw. im Kundenservice, im personalisierten Marketing, im E-Learning, im Recruiting oder ganz allgemein in der klassischen Content-Erstellungen für Webseiten, Webshops oder auch in der technischen Dokumentation.
Gemeinsames Ziel aller Synthetic-Content-Anwendungen ist, Inhalte schneller, persönlicher und dennoch kostengünstig bereitzustellen. Und zwar auch in Massen und in einer Vielzahl von Sprachen.
Das bekannteste Beispiel sind wahrscheinlich die computergenerierten Stimmen der Deutschen Bahn, die per Text-to-Speech mehrsprachige An- und Durchsagen an Bahnhöfen oder in Zügen und Bussen generieren.
Nicht minder präsent, aber weniger bekannt ist die Anwendung im E-Commerce. Hier lassen immer mehr Webshops individuelle Beschreibungstexte für ein Portfolio von tausenden Produkten und Produktvarianten kostengünstig, schnell und qualitativ hochwertig generieren und synthetisieren. Dafür reicht der Zugriff auf wenige strukturierte Datenpunkte eines handelsüblichen Produktinformationssystems.
Auch ermöglicht KI mittlerweile das (Neu-)Schreiben individueller Texte, wenn z. B. die Tonalität für eine bestimmte Zielgruppe angepasst werden soll. Anstatt Texte komplett neu zu verfassen, werden diese durch Programme „korrigiert“, um sie je nach Bedarf konziser, lockerer, werbender oder sachlicher zu verfassen.
Sogar Deepfakes werden mittlerweile in positiver Mission von größeren Unternehmen verwendet. So kommen synthetische Videos etwa für die Einarbeitung oder Weiterbildung von Mitarbeiter:innen oder auch im Kundenservice zum Einsatz, um über weltweite Unternehmensnetzwerke hinweg ein einheitliches „Gesicht“ zu zeigen und gleichzeitig möglichst personalisiert interagieren zu können. Das Nachrichtenportal Reuters nutzt KI- und Synthetic-Content-Anwendungen zum Beispiel für automatisierte Videoberichte.
Fazit: Ist Synthetic Content unsere schöne neue Welt?
KI- und Synthetic-Content-Anwendungen scheinen die Lösung aller Produktions- und Effizienzfragen zu sein. Denn, hey, sie bescheren Texte und Übersetzungen, Bilder, Videos und Stimmen in allen Sprachen der Welt auf Knopfdruck und mit minimalem Input. Nur leider stimmt das nicht so ganz.
Maschinen stoßen immer wieder an ihre Grenzen. Jede künstliche Intelligenz braucht menschliches Know-how. Und jeder lernende Algorithmus ist nur so gut wie die Daten, auf denen er basiert. Je spezifischer Anforderungen werden, desto schneller schwindet die Output-Qualität oder steigen die Investitionskosten.
Zudem sind Humor, Wortspiele, Umgangssprache, Emotion oder logische Gedankenfolgen häufig Stellen, an denen synthetisch produzierte Texte, Videos, Töne und Bilder scheitern. Auch werden abstrakte Inhalte missverstanden, weil sie Transferleistung erfordern, zu der KI (noch) nicht in der Lage ist.
In der Folge ist die synthetische „Textqualität“ grundsätzlich noch eine andere als bei einem menschlich erstelltem Text. Zur Anpassung der Inhalte und Sicherung der Qualität bedarf es doch wieder der menschlichen Leistung. So ist und bleibt etwa das Posteditieren maschinell erstellter Inhalte, egal in welcher Sprache, ein notwendiger Faktor, um wirklich hochwertige und natürlich klingende Ergebnisse zu erhalten. Ebenso wichtig ist aber auch das Präeditieren von Skripten, wenn diese bspw. für synthetisierte Videos genutzt werden sollen. Auch erfordern Stimmen in Text-to-Speech-Anwendungen oftmals Nachbesserungen durch qualifizierte Muttersprachler:innen, um so natürlich zu klingen wie sie sollen.
Somit sind und bleiben Qualitätsprüfungen und kontinuierliche Qualitätsevaluation auch beim Synthetic Content entscheidende Faktoren, um die Entwicklung von Inhalten langfristig nachverfolgen und einschätzen zu können – und um durchgehend hohe Qualität zu sichern.
Möchten Sie qualitativ hochwertige Inhalte schnell, individuell und dennoch kostengünstig, in großer Stückzahl und unterschiedlichen Sprachen bereitstellen? Dann sprechen Sie mit unseren Fachexpert:innen über Ihre spezifischen Anforderungen und Ziele. Wir stehen dafür gern zur Verfügung.
8 gute Gründe für oneword.
Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.
Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.