Maschinelle Übersetzung für Leichte Sprache

Das erste Tool für Leichte Sprache ist auf dem Markt

SUMM: Das Tool für Leichte Sprache. Studierende der Technischen Uni München haben das Tool ausgetüftelt, das mit Hilfe künstlicher Intelligenz Standardtext in Leichte Sprache umwandelt. Ich durfte es drei Monate lang testen. Ein Erfahrungsbericht.

Was genau ist SUMM?

SUMM ist ein einfach zu nutzendes Tool für die Übersetzung in Leichte Sprache. Es gibt eine Online-Version im Browser oder es wird als Add-in in Microsoft Word verankert und ist von dort aufrufbar. Ich habe hauptsächlich mit dem Add-in gearbeitet, was in Word am rechten Rand erscheint. Das Tool besteht im Wesentlichen aus drei Funktionen:

  • Übersetzen
  • Glossar
  • Synonyme

Übersetzen

Ich markiere in Word den zu übersetzenden Text und klicke im Add-in auf Übersetzen. Daraufhin erscheint eine maschinell generierte Übersetzung in Leichter Sprache. Das war’s auch schon. Es ist wirklich sehr einfach. Die Übersetzung kann ich wiederum mit Copy & Paste in mein Word-Dokument übernehmen und dort weiterbearbeiten.

Glossar

Taucht im Standardtext ein Begriff auf, der erläutert werden muss, schaue ich nach, ob es dazu schon eine Erläuterung gibt. Dazu markiere ich den Begriff und klicke auf Glossar laden. Es erscheinen Glossarbegriffe aus dem online zugänglichen Wörterbuch Hurraki, aber ich habe auch die Möglichkeit, eigene Begriffe im Glossar abzuspeichern.

Synonyme

Benötige ich für einen schwierigen Begriff eine einfachere Version, markiere ich den Begriff und klicke auf Synonyme. Ich erhalte eine Anzeige der Synonyme aus OpenThesaurus. Das heißt, ich muss nicht mehr die Oberfläche wechseln, um etwas nachzuschlagen. Als Mehrwert zeigt mir SUMM die Sprachniveaustufen basierend auf dem Gemeinsamen Europäischen Referenzrahmen (Sprachniveau A2, B1, etc.) an. So sehe ich auf den ersten Blick, welches Synomym besonders leicht ist.

Übersetzungsergebnisse

Die Anwendung des Tools ist wirklich denkbar einfach und erfordert null Einarbeitungszeit. Für Fremdsprachenübersetzungen gibt es schon lange zahlreiche Tools, die aber alle sehr komplex sind und viel Übung erfordern, bis man sie richtig beherrscht. Das ist hier ganz anders: Text aufrufen, markieren, klicken, fertig.

Die Übersetzungsergebnisse waren in der dreimonatigen Pilotphase sehr durchwachsen. Das ist nicht weiter schlimm, denn das Tool muss ja auch erst wachsen und lernen. Die Ergebnisse werden besser, je mehr Kontext das Tool hat. Ich gliedere also den zu übersetzenden Text in sinnvolle Abschnitte, die das Tool dann übersetzt. Damit habe ich die besten Ergebnisse erzielt. Probehalber habe ich auch nur einzelne Sätze übersetzen lassen. In diesen Fällen hat SUMM Informationen sinngemäß ergänzt, was zu unerwünschten Additionen führte. So lautete beispielsweise ein Originalsatz: “Die Prognose ist günstig.” Die maschinell erzeugte Übersetzung dazu: “Die Behandlung ist gut gelaufen. Die Gesundheit von dem Kind wird sich bessern.” Man sieht, dass das Tool versucht, Informationen sinnvoll zu ergänzen. In diesem Fall aber war der Zusammenhang falsch. Es ging gar nicht um die medizinische Behandlung eines Kindes. Lässt man statt einzelner Sätze einen gesamten Absatz übersetzen, erzielt man ein besseres, kontextbasiertes Ergebnis.

Die Vorzüge des Tools

Anfangs war ich ganz begeistert von der Synonym-Funktion, habe aber dann während der Pilotphase festgestellt, dass ich diese Funktion am wenigsten benötige. So häufig schlage ich gar keine Synonyme nach. Allerdings sind die von SUMM angebotenen Sprachniveaustufen wirklich hilfreich, um ganz schnell zu erkennen, welches Synonym besonders leicht zu verstehen ist.

Mein Favorit ist definitiv die Glossarfunktion: Darin liegt für mich der eigentliche Mehrwert des Tools: Bislang hatte ich kein vernünftiges System, mit dem ich Begriffe, für die ich einmal eine Erläuterung erarbeitet habe, abspeichern konnte. Ich habe es mit Excel-Tabellen versucht wie viele andere vermutlich auch. Aber das ist umständlich. Jetzt habe ich endlich die Möglichkeit, mein ganz eigenes Glossar zu erstellen und zu verwalten, was mir die Arbeit immer mehr erleichtern wird, je mehr das Glossar mit meinen eigenen Einträgen wächst. Das Tool zeigt auch die Glossareinträge des Wörterbuchs Hurraki an, aber diese Quelle ist für mich eher zu vernachlässigen: Viele Einträge sind qualitativ einfach nicht gut genug, um sie zu übernehmen. Ich baue da eher auf meine eigenen Einträge.

Und was fehlt noch?

In den drei Monaten stand ich in engem Kontakt mit dem Team und habe regelmäßig Feedback gegeben. In dieser Zeit hat das Team bereits einige Veränderungen und Verbesserungen am Tool vorgenommen und ich rechne damit, dass sich dies fortsetzen wird. Ich habe das Gefühl, dass die jungen Menschen bei SUMM mit Herzblut und großem Engagement bei der Sache sind und es macht Freude, die Entwicklung des Tools zu beobachten. Sie haben es verdient, damit erfolgreich zu werden. Vorab werde ich aber in der kostenlosen Version weiterarbeiten. Diese bietet mir zwar keine maschinelle Übersetzung mehr, erlaubt mir aber immerhin die Pflege meines Glossars und die Nutzung der Synonymfunktion.

Warum nutze ich nicht die kostenpflichtige Version? Hauptsächlich, weil das Tool die Übersetzung in der Reihenfolge des Originaltextes vornimmt. Ich hingegen (und die meisten meiner Kolleginnen) stelle aber den Originaltext meist völlig auf den Kopf: Wichtige Infos stelle ich an den Anfang; andere Infos fasse ich zusammen bzw. ich füge Erläuterungen hinzu oder lasse unwichtige Infos weg. Die Reihenfolge der Infos im Leichte-Sprache-Text entspricht also meist nicht mehr der Reihenfolge im Originaltext. Das kann das Tool bisher leider noch nicht abbilden. Und ich habe gemerkt, dass mich die künstlich erzeugte Version des Textes von meiner bisher üblichen Vorgehensweise ablenkt. Ich finde es aber wichtig, dass ich mich weiterhin dem Text nähere, indem ich erst einmal eine neue Reihenfolge herstelle bzw. die Informationen filtere und mich dann an die Übersetzung mache. Und so will ich es auch manuell beibehalten, solange SUMM das noch nicht beherrscht.

Wer sich für das Tool interessiert, findet alle Infos hier auf dieser Website.

Fun Fact

In einem Auftrag ging es um die Berliner Verkehrsbetriebe, die damit werben, dass sie das “gelbe Wahrzeichen” der Stadt Berlin sind. Auf Anhieb fiel mir dazu nichts Schönes, Leichtes ein. Also habe ich den Satz schnell mal durch das Tool geschickt. Die künstlich generierte Übersetzung dieses Satzes ergab: “Wir sind die gelben Busse von Berlin.” Süß, oder?