Samsung Research und das Samsung R&D Institute Poland (SRPOL) nahmen am Workshop zur maschinellen Übersetzung (WMT) teil. WMT ist eine der weltweit größten Forschungsveranstaltungen zur maschinellen Übersetzung, um die Qualität ihrer Übersetzungstools zu vergleichen. Teams aus der ganzen Welt nahmen an den acht Wettbewerben für maschinelle Übersetzungsaufgaben teil. Neue und innovative Wege finden, um die menschliche Sprache mithilfe von Maschinen und Computerprogrammen zu verstehen.

Samsung Global Newsroom

Biomedizinische Übersetzungsaufgabe

Das Team des Sprachlabors des Samsung Research Global AI Center nahm an der biomedizinischen Übersetzungsaufgabe teil. Die Aufgabe zielte darauf ab, Systeme zur Übersetzung von Sätzen aus dem biomedizinischen Bereich zu evaluieren. Die Gruppe nahm den ersten Preis für das erfolgreiche Dolmetschen von zwei Sprachkombinationen mit nach Hause: Englisch ins Spanische und Spanisch ins Englische. Sie erzielten in beiden Sprachpaaren die höchsten Punktzahlen. Dies zeigt ihre Fähigkeit, Sätze zwischen den beiden Sprachen genau und flüssig zu übersetzen. Um dies zu erreichen, integrierte das Team eine Terminologieübersetzung mit weichen Einschränkungen. Es gibt Hinweise in Form von Ausgangssätzen über die terminologischen Einschränkungen der Zielsprache.

Lesen Sie auch: 8 zukunftssichere technische Fähigkeiten, die nicht durch Roboter und Automatisierung ersetzt werden können

Verbesserung der domänenspezifischen Übersetzungsleistung

Im Falle einer domänenspezifischen Übersetzung ist die Terminologieübersetzung einer der wichtigsten Faktoren, die ihre Qualität bestimmen. Dies kann im Vergleich zu allgemeinen Bedingungen eine Herausforderung sein. Denn normalerweise werden Fachbegriffe seltener verwendet und sind daher schwerer zu lernen. Um dieses Problem anzugehen, hat das Sprachlabor des Samsung Research Global AI Center eine Terminologieübersetzung mit weichen Beschränkungen entwickelt, die Hinweise in Form von Einschränkungen in der Zielsprache liefert. Zusammen mit darin eingegebenen Quellsätzen. Dadurch wird sichergestellt, dass domänenspezifische Terminologien wo immer möglich in den Übersetzungsergebnissen widergespiegelt werden.

Derzeit untersucht Samsung Research die Bereitstellung von Patentübersetzungsdiensten (Koreanisch – Englisch) auf ihrem Onlinedienst namens SR Translate. Das Ziel hier ist es, genaue und zuverlässige Übersetzungen für Benutzer bereitzustellen. Da sie schnell Übersetzungen benötigen, ohne Probleme mit der Genauigkeit oder Relevanz zu haben. Die Probleme treten aufgrund falscher Terminologien auf, die beim Übersetzen von einer Sprache in eine andere verwendet werden. Mit dieser Technologie hoffen sie, die Benutzererfahrung im Umgang mit domänenspezifischen Sprachen verbessern zu können. Zum Beispiel Patente und andere juristische Dokumente usw., indem die korrekte Verwendung aller relevanten Terminologien bei solchen Übersetzungsaufträgen sichergestellt wird.

Die Einbindung von Soft-Constrained-Terminologieübersetzern hat sich seit ihrer Einführung bereits als sehr nützlich erwiesen. Es erwies sich als nützlich, da es die Genauigkeit verbesserte, wenn es darum ging, komplexe Aufgaben mit mehreren Sprachen gleichzeitig zu erledigen. Vor allem diejenigen, die sich auf spezialisierte Bereiche wie Patente, Rechtsdokumente usw. beziehen. Es sollte auch dazu beitragen, den Zeitaufwand für die manuelle Überprüfung übersetzter Inhalte auf Fehler oder Unstimmigkeiten zu reduzieren. Dadurch wird der gesamte Prozess viel reibungsloser als zuvor. Der Einsatz fortschrittlicher Technologien wie dieser kann sich jedoch nicht nur für Unternehmen als vorteilhaft erweisen. Aber auch Endnutzer, die darauf angewiesen sind, dass genaue Informationen innerhalb eines angemessenen Zeitraums geliefert werden.

Konzentrieren Sie sich auf die Verbesserung der Korporaqualität

Während Wettbewerben, wie dem International Workshop on Spoken Language Translation (IWSLT) erhalten Teams in der Regel eine begrenzte Anzahl von Korpora. Corpora ist eine Sammlung von strukturierten Texten, die auf ihr Übersetzungsmodell hin analysiert werden können. Das SRPOL-Team führte seinen Erfolg auf die Konzentration auf die Verbesserung der Qualität dieser Korpora zurück. Mit Hilfe von Prozessen wie Datenvorverarbeitung und-filterung. Sowie die Optimierung der Architektur ihres Modells und des KI-Trainingsprozesses.

Das maschinelle Übersetzungsteam von SRPOL erstellte einen Klassifikator unter Verwendung eines maschinellen Lernrahmens unter Verwendung des verbesserten Korpus. Das Framework heißt BERT (Bidirectional Encoder Representations from Transformers). Dieser Klassifikator war in der Lage, Millionen von Sätzen aus dem Korpus erfolgreich in verschiedene Domänen zu kategorisieren. Es ermöglicht SRPOL, Modelle für allgemeine Übersetzungen, medizinische und juristische Übersetzungen zu erstellen.

SRPOL hatte großen Erfolg auf dem Gebiet der maschinellen Übersetzung und gewann vier Jahre in Folge die Herausforderungen der IWSLT. Dies zeigt, dass das Ziel, ein menschenähnliches Sprachverständnis zu erreichen, in greifbare Nähe gerückt ist. Da maschinelle Übersetzung und Sprachverständnis immer üblicher werden, wird Samsung an der Spitze dieser Technologie bleiben, um die Tools zur Überwindung von Sprachbarrieren zu entwickeln und unser tägliches Leben zu verbessern.

Lesen Sie auch: Genießen Sie kontinuierliches Surfen mit Samsung zwischen Galaxy Smartphones und die Galaxy Book-Reihe

By Maxwell Gaven

Ich habe 7 Jahre im IT-Bereich gearbeitet. Es macht Spaß, den stetigen Wandel im IT-Bereich zu beobachten. IT ist mein Job, Hobby und Leben.