17.01.2024
Quality Time mit MittagQI: Entwickeln, was der Markt wirklich braucht
Es ist wieder Quality Time. In einer neuen Episode unserer Reihe von Expertengesprächen haben sich Dr. Juliane Schwab (Leitung oneSuite) und Jasmin Nesbigall (Fachleitung Terminologiemanagement und MTPE) mit Marc Mittag von MittagQI unterhalten. Ein aufschlussreiches Gespräch über das Übersetzungssystem translate5, die Besonderheiten, die es von anderen CAT-Tools abheben, und über die zunehmende Integration von generativer KI.
oneword bietet das browserbasierte Übersetzungs- und Lokalisierungssystem oneSuite auf Basis des Open-Source-Übersetzungssystems translate5, einem Produkt von MittagQI Quality Informatics aus Mössingen. Kopf und Namensgeber des Unternehmens ist Marc Mittag, der sich schon lange auf Webentwicklung im Bereich der Sprachdienstleistung spezialisiert hat, um die Automatisierung und Konfiguration von Übersetzungsprozessen zu unterstützen.
Marc Mittag (MittagQI), Dr. Juliane Schwab (oneword GmbH) und Jasmin Nesbigall (oneword GmbH)
oneword (OW): Hallo Marc. Schön, dass du Zeit hast, mit uns über translate5 zu sprechen.
translate5 ist ein Übersetzungssystem, dessen Weiterentwicklung von einem Konsortium von aktuell 15 Sprachdienstleistern – unter anderem von uns – kofinanziert wird. Die Mission lautet „Aus der Übersetzungsbranche für die Übersetzungsbranche“. Worin liegt für dich die Attraktivität dieses Geschäftsmodells?
Marc Mittag (MM): Ursprünglich war es gar nicht als Geschäftsmodell gedacht, sondern entstand aus meinem Impuls, dazu beizutragen – auch wenn das vielleicht abgedroschen klingt –, die Welt ein Stückchen besser zu machen. Ich komme aus der Webentwicklung und kannte in dem Bereich viele tolle Open-Source-Lösungen. In meinem ersten Job bei einem Sprachdienstleister habe ich dann gesehen, dass es das im Übersetzungsbereich überhaupt nicht gab.
Gleichzeitig waren die Systeme, die wir eingesetzt haben, teilweise gar nicht wirklich für die Benutzer:innen gedacht. Es gab tolles Marketing und Vertrieb, aber inhaltlich hat vieles einfach nicht gut funktioniert. Das war dann der Impuls, ein anderes System entwickeln zu wollen: für Benutzer:innen von Benutzer:innen, Open Source und ohne Marketing oder Profit im Vordergrund. Ich wollte das System anfangs sogar komplett kostenlos zur Verfügung stellen, aber dann haben mich heutige Konsortiumsmitglieder überzeugt, dass das nicht funktionieren wird.
OW: Das Modell bedeutet auch, dass Entscheidungen darüber, welche Funktionen weiterentwickelt werden, letztlich bei den Konsortiumsmitgliedern liegen. Welche Bedürfnisse gibt es da und was davon hat dich vielleicht überrascht?
MM: Das Hauptbedürfnis ist eine stabile und performante Software, die einfach funktioniert. Deshalb liegt unser Fokus auf einem guten und schnellen Support und schnellem Bugfixing – was uns sicherlich auch von anderen Tools unterscheidet.
Bei den Bedürfnissen zu Features und neuen Funktionen hat mich am meisten alles rund um InstantTranslate überrascht. Dieses Feature für direkte Online-Übersetzungen unter Einbindung von maschineller Übersetzung, Translation-Memory-Systemen und Terminologiedaten ist zu 100 Prozent aus Bedürfnissen des Konsortiums hervorgegangen, die ich so nie gehabt oder vermutet hätte. Auch der Anklang am Markt hat mich etwas überrascht. Das ist aber genau der Punkt, weshalb das Konsortium und das Motto „aus der Branche für die Branche“ so gut funktionieren: Wir entwickeln, was die Benutzer:innen wirklich haben wollen und nichts, was nur in der Theorie gut sein könnte.
„Wir entwickeln, was die Benutzer:innen wirklich haben wollen und nichts, was nur in der Theorie gut sein könnte.“
OW: InstantTranslate – bei uns heißt das Modul oneTranslate – hat einen Zeitnerv getroffen, denn maschinelle Übersetzung und KI sind aus unserer Branche nicht mehr wegzudenken. Sind es denn hauptsächlich ganze Module, die vom Konsortium vorangetrieben werden? Oder gibt es immer wieder auch kleinen Input zu Verbesserungen, zum Beispiel für Funktionen in der Qualitätssicherung?
MM: Sowohl als auch. Eines der ersten Features, das schon 2013 gewünscht wurde, war die Umsetzung einer Pivot-Sprache (auch Relais-Sprache genannt) im Review – und Review ist ja Qualitätssicherung par excellence. Für Reviewer:innen, die die Ausgangssprache der Übersetzung nicht verstehen, sollte eine Brückensprache eingebunden werden, zum Beispiel Englisch. 2023 haben wir das auf Wunsch von oneword sogar noch erweitert, sodass die Pivot-Sprache jetzt auch im Visual in der Echtzeitvorschau im Layout angezeigt werden kann.
OW: Für uns sind das Features, hinter denen unsere Endkund:innen und deren Bedarfe stehen. Ihr habt aber auch Industriekund:innen, die das Tool nutzen. Wie interagieren diese mit dem Konsortium, was Feature Requests und neue Ideen angeht? Es gibt sicherlich Anforderungen, die nur eine dieser beiden Seiten hat, oder?
MM: Beim Thema Industrieunternehmen und Konsortium wird es aktuell richtig spannend. Industrieunternehmen, die translate5 nutzen, gibt es schon seit 2017. Bisher haben diese ihre Feature-Wünsche selbst finanziert. Visual war zum Beispiel etwas, das aus einem Industriekundenbedarf entstanden ist und mittlerweile von allen genutzt wird. Und da sind wir schon bei der Interaktion: Als das Feature einmal da war, ist das Konsortium eingestiegen und hat sehr viel Weiterentwicklung vorangetrieben.
OW: Und rein technisch bzw. finanziell: Wenn etwas von Industriekund:innen finanziert wird, was muss dann passieren, damit es allen zur Verfügung steht? Oder steht alles, was entwickelt wird, immer allen anderen auch zur Verfügung?
MM: Wie gesagt wollte ich ursprünglich sogar mal alles, was wir entwickeln, auch allen kostenlos zur Verfügung stellen. Aber dann sagten Konsortiumsmitglieder, dass sie innerhalb ihres Unternehmens nicht rechtfertigen können, wenn sie viel Geld in ein Feature stecken, das die ganze Konkurrenz im Konsortium – und sogar außerhalb davon – danach kostenlos verwenden kann. Deshalb mussten wir andere Modelle finden, zum Beispiel kostenpflichtige Plug-ins. Verfügbar sind die Features also, sobald sie marktreif sind oder sobald sich ein Unternehmen entschließt, ein kostenpflichtiges Plug-in zu erwerben.
Eine Ausnahme bildet die Integration von ChatGPT: Es war das erste Mal, dass wir von MittagQI schneller vorangehen wollten, als wir finanzielle Unterstützung vom Konsortium und den Industrieunternehmen bekommen konnten. Also haben wir 300 Entwicklungsstunden ohne eine Finanzierung investiert. Diese Funktion werden wir als kostenpflichtiges Plug-in rausbringen und auf diese Weise unsere Arbeit refinanzieren. Für die Weiterentwicklung wollen wir aber auch hier das Konsortium und die Industriekund:innen mit ins Boot holen und es nicht im Alleingang weiter voranbringen.
OW: Kannst du uns noch ein bisschen Einblick in die Konsortiumsarbeit geben? Da sitzen 15 Sprachdienstleister, also potenzielle Wettbewerber:innen zusammen. Wie viel Einigkeit gibt es und wie oft musst du als Mediator vermitteln? Gibt es Konkurrenzsituationen oder ziehen eher alle an einem Strang, um das Tool voranzubringen?
MM: Was Features betrifft, ziehen eigentlich alle am gleichen Strang bzw. wenn sie in unterschiedliche Richtungen ziehen, dann tut das keinem weh: Ein LSP möchte vielleicht ein Feature, was ein anderer nicht braucht, aber es stört sich auch keiner daran, wenn es entwickelt wird.
Schwierigkeiten gibt es eher im Bereich der Kapazitäten, also bei der Frage, was zuerst entwickelt wird. Wir arbeiten nur mit festangestellten Entwicklern, um unsere hohe Qualität zu gewährleisten. Also können wir nicht beliebig skalieren, wenn der Workload mal hoch ist. Im Konsortium gibt es zwar einen Mechanismus, um zu bestimmen, was die höchste Priorität hat. Aber ich kann nicht jedes Feature von jedem in meinem Team entwickeln lassen. Ihr kennt das ja selbst: Medizintechnik-Übersetzer:innen können auch nicht plötzlich im Automotive-Bereich eingesetzt werden, nur weil es da hohen Bedarf gibt. Und zu den Features kommen noch Bugfixes, also Daily Business, und da gilt es immer zu jonglieren.
Konkurrenzsituationen im Konsortium gibt es aus meiner Sicht nur, wenn es um perspektivische Ideen geht – also darum, welche Themen wir gemeinsam angehen wollen. Wenn alle 15 zusammen sind, wird da eher dicht gemacht aus Bedenken, der Konkurrenz zu viel zu verraten.
OW: Steht die Konsortiumsarbeit eigentlich im Kontrast zum tragenden Open-Source-Gedanken? Open Source bedeutet ja, dass der komplette Code offen zugänglich ist und von jedem genutzt, überprüft und auch weiterentwickelt werden kann. Funktioniert diese Philosophie für dich?
MM: Es ist ein weitverbreitetes Missverständnis, dass Open Source gleichbedeutend damit ist, alles kostenfrei runterladen zu können. Die Free Software Foundation, die bekanntesten Open-Source-Verfechter weltweit, sagen: „Verlangt für eure Open-Source-Software so viel Geld, wie Ihr nur könnt.“ Open Source meint das Recht, bestimmte Dinge mit dem Quellcode tun zu können, wenn ich ihn habe. Es meint nicht, dass ich diesen Quellcode kostenlos bekomme. Unsere kostenpflichtigen Plug-ins stehen auch unter einer Open-Source-Lizenz – nicht nur aus eigener Überzeugung, sondern weil wir darin Komponenten verwenden, die uns dazu verpflichten. Wir müssen sie deshalb aber nicht kostenlos rausgeben. Jeder, der den Quellcode hat, kann ihn lesen und potenziell korrigieren oder weiterentwickeln. Kostenlos downloadbar ist aber nur die Kernsoftware ohne Plug-ins.
OW: Wie groß ist denn das Interesse, dass Unternehmen oder Einzelpersonen an der Software mitentwickeln?
MM: Erstaunlich gering. Es spricht vielleicht auch für uns, dass wir das gut machen.
Es gab schon einige Contributions von Konsortiumsmitgliedern, die gute Softwareentwicklung gemacht haben, zum Beispiel für die Zahlenprüfung in der Qualitätssicherung. Grundsätzlich sind wir da auch sehr offen für, aber es passiert da wirklich wenig. Das liegt sicherlich an der Struktur unserer Kund:innen: LSPs haben den Fokus auf Sprachdienstleistungen und nicht auf Softwareentwicklung. Manche entwickeln selbst in Richtung Business Software für die Verwaltung ihrer Prozesse, aber was translate5 angeht, herrscht Einigkeit, dass die Wünsche lieber von uns umgesetzt werden sollen.
Ich sehe das als ganz großen Vorteil des Modells: Man muss nicht alles selbst machen, aber man hat genug Mitspracherecht und Einflussmöglichkeiten, um auch nicht nur ein fertiges Produkt einfach hinnehmen zu müssen.
OW: Apropos fertige Produkte: Kannst du uns drei Besonderheiten von translate5 nennen, die es von anderen bekannten Tools im Übersetzungsbereich abheben?
MM: Erstens das Open-Source- und Community-getriebene Modell, also dass wir machen, was unsere Kund:innen an uns herantragen – und eigentlich auch nur das. Daraus ergibt sich auch die Art, wie wir Support machen: Wenn du Open Source umsetzt, musst du auch einen guten Support haben, denn sonst suchen sich die Kund:innen den Support woanders.
Ein wichtiger Unterschied ist das Lizenzmodell. Wir stehen unter Open-Source-Lizenz und berechnen nicht, wie viele Nutzer:innen die Anwendung verwenden oder gar – wie bei anderen Tools – wie viele Wörter durch die Anwendung fließen. Die meisten Unternehmen haben bei uns ein Modell mit einer unbegrenzten Nutzeranzahl.
Und die dritte Besonderheit sind Features, die richtige USPs darstellen, wie Visual, InstantTranslate oder jetzt auch das neue GPT-Feature. Damit können wir Dinge bieten, die andere Tools aktuell einfach nicht können.
OW: Zum GPT-Feature hattest du gesagt, dass es eine Eigenentwicklung war, ohne dass es eine Finanzierung gab. Was hat euch angetrieben? Hat es euch einfach interessiert, wolltet ihr vor die Welle kommen oder habt ihr schon konkreten Bedarf gesehen?
MM: Eigentlich kamen alle drei Punkte zusammen. Im Herbst 2022 habe ich ChatGPT erstmal als Hype abgetan, aber dann schnell gemerkt, dass es die Branche doch sehr stark betrifft. Es gibt ein wahnsinniges Potenzial, was man mit generativer KI machen kann. Deshalb mussten wir einfach schnell sein.
Im ersten Schritt haben wir mit einem Industrieunternehmen zusammengearbeitet und wurden dann von einem Konsortiumsmitglied unterstützt. Ohne deren sprachliche Expertise hätten wir die Entwicklung gar nicht machen können, denn es ist viel sprachliches Know-how gefragt, um die Funktionen überhaupt entwickeln und natürlich auch die Ergebnisse bewerten zu können. Da hat die Mischung aus Industriekund:innen und Konsortium auch wieder richtig gut funktioniert.
„Es gibt ein wahnsinniges Potenzial, was man mit generativer KI machen kann. Deshalb mussten wir einfach schnell sein.“
OW: Was sind, abgesehen von den großen Faktoren, die das Tool von anderen unterscheiden, denn noch Punkte, die translate5 zum Beispiel in der Qualitätssicherung besonders machen?
MM: translate5 war ursprünglich ein reines Qualitätssicherungstool mit einer Hauptstärke, die nach wie vor erhalten geblieben ist: Es bietet eine Anwendungsumgebung, damit Menschen in die Qualitätssicherung von Übersetzungen eingebunden werden können, die sich nicht mit den ganzen Prozessen dahinter auskennen müssen. Daraus hat sich zum Beispiel auch stark das Visual-Feature entwickelt, mittlerweile auch für Dateiformate wie Videos und Apps.
Ein besonderes Detail ist die Quality Estimation, die wir als erstes Tool überhaupt schon vor drei Jahren zur Risikobewertung integriert haben. Quality Estimation meint, dass eine Maschine eine Einschätzung darüber gibt, wie gut die Qualität des übersetzten Segments ist. Der Algorithmus dahinter ist letztlich der gleiche wie bei maschineller Übersetzung: Die Maschine lernt auf Basis von vorhandenen Übersetzungen, sichtet dann Ausgangs- und Zieltext eines neuen Projekts und gibt einen Score pro Segment, wie hoch das Risiko ist, dass die Übersetzung falsch sein könnte.
OW: Damit lassen sich dann auch Aufwände beim Posteditieren reduzieren, weil Segmente mit sehr gutem Score gar nicht mehr gecheckt werden müssen.
MM: Genau.
OW: Sowohl bei Quality Estimation als auch bei GPT sind wir beim Hype-Thema Künstliche Intelligenz, an dem auch im Übersetzungsbereich keiner mehr vorbeikommt. Was hast du mit deinem Team in dieser Richtung denn noch vor?
MM: Sehr viel! Wir wollen die GPT-Integration nicht nur als zusätzliche Übersetzungsquelle, sondern als Funktion in der gesamten Anwendung vorantreiben. Als Übersetzungs-Engine ist GPT sehr einfach trainierbar, sodass man sich innerhalb von 15 Minuten eine spezifische Engine zusammenstellen kann – wofür man sonst Wochen und sehr große TM-Daten braucht. Auch Quality Estimation auf Basis von GPT ist sehr gut denkbar. Wichtig ist uns aber, dass wir die nächsten Schritte zusammen mit dem Konsortium und den Industriekund:innen gehen, also kommt es immer darauf an, welche Anforderungen es dort gibt und wofür wir Mehrheiten finden.
„Wir wollen die GPT-Integration nicht nur als zusätzliche Übersetzungsquelle, sondern als Funktion in der gesamten Anwendung vorantreiben.“
Auch Terminologieextraktion mit GPT als vorgelagertem Workflow-Schritt zur Übersetzung ist gut denkbar, sodass die Terminologie vor der Übersetzung erstellt und dann direkt in die Qualitätssicherung der Übersetzung einfließen kann.
Und dann planen wir ein Feature mit dem Arbeitstitel „InstantContent“: Auf Basis trainierter Sprachressourcen können zielsprachliche Inhalte generiert werden. Denn dahin wird sich die Branche entwickeln: Es wird nicht mehr nur übersetzt, sondern Inhalte direkt zielsprachlich erstellt.
OW: Wir sind wirklich sehr gespannt, was da kommt und woran wir im Konsortium aktiv mitwirken können. Jetzt kommt schon unsere letzte Rubrik „Kurze Frage, kurze Antwort“. Wir haben fünf kurze Fragen für dich und freuen uns über knappe Antworten aus dem Bauch heraus. Los geht’s:
Auf welches Feature freust du dich am meisten?
MM: Auf die GPT-Integration und die Verbesserung von Visual.
OW: Was sind deine drei Highlights aus dem Jahr 2023?
MM: Auch wenn es so oft kommt, hier ebenfalls: GPT bzw. alles, was wir bisher damit gemacht haben. Als Zweites das Stichwort „enterprise-ready“, also dass große Industriekonzerne auf translate5 umgestiegen sind und sich das Tool damit nochmal auf ganz neue Art bewiesen hat. Und als Drittes, dass wir als erstes Tool der Branche „cloud-native“ geworden sind und man translate5 on premises selbst in der Cloud installieren kann. Man kann die Software verteilt laufen lassen und beliebig skalieren. Das merkt man, weil einzelne Prozesse damit einfach deutlich schneller laufen.
OW: Vervollständige bitte folgenden Satz für uns: Softwareentwicklung ist für mich …
MM: … in erster Linie eigentlich Kunst. Code muss schön sein. Er muss auch funktionieren, klar, aber wenn er nicht schön ist, ist er irgendwann nicht mehr wartbar. Es ist wie bei Texten auch: Wenn ich auf einen Text schaue, sehe ich Buchstaben und Wörter, aber schön sieht das nicht aus. Die Schönheit kommt erst beim Durchlesen und Verstehen. So ist es auch mit Code: Es geht um Schönheit in der Struktur.
OW: Wenn du jetzt sofort eine Sache in das Tool zaubern könntest, welche wäre das?
MM: Dass wir out-of-the-box alle Content Provider dieser Welt nahtlos, kostenlos und reibungslos integriert haben, so wie wir das mit Blackbird – eine Plattform für Konnektoren der Übersetzungsbranche – vom Ansatz her schon können.
OW: Unsere letzte Frage: Wo siehst Du translate5 in fünf Jahren?
MM: Als sehr weit in der Branche verbreitetes Tool, sowohl bei Dienstleistern als auch bei Industrieunternehmen. Und als ein Tool, das stark mit KI verzahnt ist und dadurch viel sinnvolle Unterstützung im Arbeitsalltag bietet.
OW: Wir sind sehr gespannt auf alles, was da kommt! Vielen Dank für das Gespräch, Marc.
8 gute Gründe für oneword.
Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.
Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.