Remy_Blaettler_LocWorld_Supertext

Supertext behauptet sich im Silicon Valley – zweiter Platz an der LocWorld35 Innovation Challenge

Supertext-CTO Rémy Blättler präsentierte eine Lösung zum Thema AI TM and Terminology Onboarding. Und verwies dabei sogar Weltkonzerne wie IBM auf die Plätze.

Mit grosser Spannung reiste Supertext an die LocWorld im Silicon Valley, die führende Technologie-Konferenz der Lokalisierungsbranche. Rémy Blättler, Mitgründer und CTO von Supertext, hatte für seinen Auftritt eine eigens entwickelte Software zur Erstellung von Termbases und Translation Memories bei Neukunden im Gepäck.

6 Monate in 15 Minuten

Im Rahmen der Process Innovation Challenge pitchte Blättler die innovative Lösung in zwei Kurzpräsentationen gegen Entwicklungen namhafter Branchen- und Technologieriesen wie Moravia und IBM. Und grüsste am Schluss als zweiter vom Podest.

Je kürzer die Präsentation, desto intensiver die Vorbereitung. So auch in diesem Fall. Über ein halbes Jahr tüftelte das Supertext-IT-Team zusammen mit Spezialisten der ZHAW School of Engineering und Spinning Bytes an der Umsetzung. Die Veröffentlichung ist für Sommer 2018 geplant.

TM und Termbase für alle. Vollautomatisch und kostenlos.

Die Software löst ein verbreitetes Problem der Übersetzungsbranche. Bei einem Agenturwechsel bringt der Kunde meist keine bestehenden Translation Memories (Übersetzungsspeicher) und Termbanken mit. Diese Datenbanken führen zu massiven Kosteneinsparungen, sind aber sehr aufwändig aufzubauen. Gerade im direkten Vergleich mit bestehenden Lieferanten haben neue Agenturen darum oft Mühe, die geforderte Effizienz an den Tag zu legen.

Die Supertext-Software schafft hier Abhilfe übers Web. Und sie braucht dazu nichts weiter als die URL der Firmenwebsite. Das Tool crawlt die Website und legt mit allen mehrsprachig vorhandenen Inhalten automatisch ein Translation Memory an. Mittels Alignment wird dieses direkt um eine Termbank ergänzt. Das Resultat sind je ein tmx- und tbx-File, die dann in CAT-Tools wie SDL Trados eingelesen werden können.

Hinter dem simplen Konzept steckt ein Zusammenspiel verschiedenster Technologien. Und ganz viel künstliche Intelligenz: Die Term Extraction basiert auf GENSIM word2vec, einem «Shallow Neural Network». Beim Alignment kommen Konzepte der Neural Translation mit Blue-Score-, Gale-Church- und Levenshtein-Algorithmen zum Einsatz. Der WebSpider wurde komplett in-house mit C# und .NET Core implementiert. Damit auch dynamische Javascript-Webseiten eingelesen werden können, läuft im Hintergrund ein kompletter Browser der mit Phantom.js angesteuert wird. Mehr technische Details finden sich hier in der Präsentation von Rémy Blättler.

Titelbild via Twitter: Rémy Blättler (links) zusammen mit dem Moderator Jeff Kiser und dem Sieger Tomas Franc.



Ähnliche Beiträge


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert