Der Sprachspezialist DeepL, bekannt für seine fortschrittlichen maschinellen Übersetzungstechnologien, hat ein neues Übersetzungsmodell vorgestellt, das auf einem speziell für Übersetzungen entwickelten Large Language Model (LLM) basiert. Dieses neue Modell verspricht eine deutliche Verbesserung der Übersetzungsqualität und -leistung im Vergleich zu früheren Versionen und Konkurrenzprodukten. In diesem Blogpost werfen wir einen detaillierten Blick auf das neue Modell, vergleichen es mit anderen Marktführern und analysieren seine Leistung anhand verschiedener Textbeispiele.
DeepL’s Fortschritte im Bereich maschineller Übersetzungen
Die Entwicklung eines neuen LLM
DeepL hat sich seit seiner Gründung durch kontinuierliche Innovationen und Forschung einen Namen gemacht. Das neue LLM basiert auf jahrelanger Forschung und Entwicklung und zielt darauf ab, die Genauigkeit und Natürlichkeit von Übersetzungen weiter zu verbessern. Laut Unternehmenschef Jarek Kutylowski sei dies erst der Anfang, und weitere Investitionen in Forschung und Entwicklung seien geplant.
Vergleich mit anderen Übersetzungsdiensten
In Blindtests wurde das neue DeepL-Modell von Sprachexperten häufiger bevorzugt als die Modelle von Google, Microsoft und OpenAIs ChatGPT-4. Konkret wurden DeepL-Übersetzungen im Vergleich zu Google Translate 1,3-mal häufiger, zu ChatGPT-4 1,7-mal häufiger und zu Microsofts Übersetzungen 2,3-mal häufiger bevorzugt. Ein weiterer wichtiger Aspekt ist die geringere Anzahl an erforderlichen Nachbearbeitungen im Vergleich zu den Konkurrenzprodukten.
Test und Analyse des neuen DeepL-Modells
Literarische Übersetzungen
Ein besonders anspruchsvolles Testfeld für maschinelle Übersetzungen ist die literarische Übersetzung. Wir haben das neue Modell mit dem ersten Absatz von James Joyces „Ulysses“ getestet:
Original: „Stately, plump Buck Mulligan came from the stairhead, bearing a bowl of lather on which a mirror and a razor lay crossed. A yellow dressinggown, ungirdled, was sustained gently behind him by the mild morning air. He held the bowl aloft and intoned: ‚Introibo ad altare Dei.‘ Halted, he peered down the dark winding stairs and called up coarsely: ‚Come up, Kinch. Come up, you fearful Jesuit.'“
Neue Version: „Der stattliche, wohlbeleibte Buck Mulligan kam vom Treppenabsatz und trug eine Schale mit Seifenschaum, auf der ein Rasiermesser und ein Spiegel lagen. Ein gelber Morgenmantel, der nicht gegürtet war, wurde von der milden Morgenluft sanft hinter ihm gehalten. Er hielt die Schale hoch und intonierte: ‚Introibo ad altare Dei.‘ Er hielt inne, spähte die dunkle Wendeltreppe hinunter und rief grob: ‚Komm rauf, Kinch. Komm rauf, du ängstlicher Jesuit.'“
Alte Version: „Der stattliche, mollige Buck Mulligan kam von der Treppe herab und trug eine Schüssel mit Seife, auf der ein Spiegel und ein Rasiermesser gekreuzt lagen. Ein gelber Morgenmantel, der nicht gebügelt war, wurde von der milden Morgenluft sanft hinter ihm hergetragen. Er hielt die Schale in die Höhe und stimmte ein: ‚Introibo ad altare Dei.‘ Er blieb stehen, spähte die dunkle Wendeltreppe hinunter und rief grob hinauf: ‚Komm hoch, Kinch. Komm herauf, du ängstlicher Jesuit.'“
Obwohl beide Versionen ihre Stärken haben, zeigte die neue Version einige Fehler, wie das Unterschlagen von „crossed“ und die Übersetzung von „plump“ als „wohlbeleibt“. Hier zeigte die alte Version eine leichtere Lesbarkeit und Präzision.
Technische Übersetzungen
Ein weiteres Testfeld waren technische Texte, wie die Bedienungsanleitung des Commodore 64:
Original: „This chapter talks about how BASIC stores and manipulates data. The topics include: A brief mention of the operating system components and functions as well as the character set used in the Commodore 64. The formation of constants and variables. What types of variables there are. And how constants and variables are stored in memory. The rules for arithmetic calculations, relationship tests, string handling, and logical operations. Also included are the rules for forming expressions, and the data conversions necessary when you’re using BASIC with mixed data types.“
Neue Version: „In diesem Kapitel wird erläutert, wie BASIC Daten speichert und verarbeitet. Die Themen umfassen: Eine kurze Erläuterung der Betriebssystemkomponenten und -funktionen sowie des im Commodore 64 verwendeten Zeichensatzes. Die Bildung von Konstanten und Variablen. Welche Arten von Variablen es gibt. Und wie Konstanten und Variablen im Speicher abgelegt werden. Die Regeln für arithmetische Berechnungen, Beziehungstests, String-Handling und logische Operationen. Außerdem werden die Regeln für die Bildung von Ausdrücken und die Datenkonvertierungen behandelt, die erforderlich sind, wenn Sie BASIC mit gemischten Datentypen verwenden.“
Alte Version: „In diesem Kapitel geht es darum, wie BASIC Daten speichert und manipuliert. Die Themen umfassen: Eine kurze Erwähnung der Komponenten und Funktionen des Betriebssystems sowie des Zeichensatzes, der im Commodore 64 verwendet wird. Die Bildung von Konstanten und Variablen. Welche Arten von Variablen es gibt. Und wie Konstanten und Variablen im Speicher abgelegt werden. Die Regeln für arithmetische Berechnungen, Beziehungstests, String-Handling und logische Operationen. Ebenfalls enthalten sind die Regeln für die Bildung von Ausdrücken und die Datenkonvertierungen, die notwendig sind, wenn Sie BASIC mit gemischten Datentypen verwenden.“
Hier überzeugte die neue Version durch eine natürlichere und flüssigere Formulierung, während die alte Version steifer und weniger organisch klang.
Juristische Texte
Zuletzt testeten wir das Modell mit einem Abschnitt aus der Präambel des deutschen Grundgesetzes:
Original: „Im Bewußtsein seiner Verantwortung vor Gott und den Menschen, von dem Willen beseelt, als gleichberechtigtes Glied in einem vereinten Europa dem Frieden der Welt zu dienen, hat sich das Deutsche Volk kraft seiner verfassungsgebenden Gewalt dieses Grundgesetz gegeben.“
Neue Version: „In the awareness of its responsibility before God and man, and inspired by the will to serve the peace of the world as an equal member in a united Europe, the German people have given themselves this Basic Law by virtue of their constituent power.“
Alte Version: „Conscious of its responsibility before God and mankind, inspired by the will to serve the peace of the world as an equal member of a united Europe, the German people has given itself this Basic Law by virtue of its constituent power.“
Beide Übersetzungen hatten sprachliche Ungenauigkeiten, wobei die neue Version etwas natürlicher klang, aber dennoch Fehler enthielt.
Fazit und Ausblick
Insgesamt zeigte das neue DeepL-Modell in vielen Bereichen Verbesserungen, insbesondere bei technischen Texten. Bei literarischen und juristischen Texten gab es jedoch noch Raum für Verbesserungen. Es ist offensichtlich, dass maschinelle Übersetzungen weiterhin eine Nachkontrolle und Nachbearbeitung durch menschliche Übersetzer erfordern, um höchste Qualität zu gewährleisten.
Die Rolle von Kapitel H
Kapitel H bietet umfassende Dienstleistungen im Bereich der maschinellen Übersetzung und Lokalisierung an. Mit unserer Expertise in der Integration von fortschrittlichen KI- und ML-Lösungen unterstützen wir Unternehmen dabei, ihre internationalen Kommunikationsstrategien zu optimieren. Unsere Dienstleistungen umfassen die Anpassung und Feinabstimmung von Übersetzungsmodellen an spezifische Branchenanforderungen, die Entwicklung maßgeschneiderter Übersetzungslösungen und die Bereitstellung von Schulungen und Support für den effektiven Einsatz dieser Technologien. Vertrauen Sie auf Kapitel H, um Ihre globalen Geschäftsziele zu erreichen und sprachliche Barrieren mühelos zu überwinden.
Quelle: https://www.deepl.com/de/press-release#:~:text=Köln%2C%206.%20Februar%202020,von%20jedem%20frei%20genutzt%20werden.