三星研究院和三星波蘭研發中心 (SRPOL) 參加了機器翻譯 (WMT) 研討會。 WMT 是世界上最大的機器翻譯研究活動之一,用於比較其翻譯工具的質量。來自世界各地的團隊參加了八項機器翻譯任務競賽。尋找新的和創新的方法來使用機器和計算機程序理解人類語言。
Samsung Global Newsroom
Biomedical Translation task
來自Samsung Research Global AI Center’s Language Lab的團隊參與了Biomedical Translation任務。該任務旨在評估翻譯生物醫學領域句子的系統。該小組因成功翻譯兩種語言對(英語到西班牙語和西班牙語到英語)而獲得一等獎。他們在兩種語言對中都取得了最高分。這證明了他們在兩種語言之間準確、流利地翻譯句子的能力。為實現這一目標,該團隊採用了軟約束術語翻譯。它以源語句的形式給出有關目標語言術語限制的提示。
另請閱讀:8 種機器人和自動化無法替代的面向未來的技術技能
提高特定領域的翻譯性能
就特定領域的翻譯而言,決定其質量的最重要因素之一是術語翻譯。與一般術語相比,這可能是一個挑戰。因為通常技術術語使用較少,因此更難學習。為了解決這個問題,三星研究全球人工智能中心的語言實驗室開發了軟約束術語翻譯,以目標語言約束的形式提供提示。以及輸入其中的源語句。這可確保特定領域的術語盡可能反映在翻譯結果中。
目前,三星研究院正在研究在其名為 SR Translate 的在線服務上提供專利翻譯服務(韓語-英語)。這裡的目標是為用戶提供準確可靠的翻譯。因為他們需要快速翻譯,而沒有任何與準確性或相關性相關的問題。出現這些問題是由於在從一種語言翻譯成另一種語言時使用了不正確的術語。借助這項技術,他們希望能夠在處理特定領域語言時改善用戶體驗。例如,通過確保在此類翻譯工作中正確使用所有相關術語,專利和其他法律文件等
軟約束術語翻譯器的結合自推出以來已經證明非常有用。當涉及到一次涉及多種語言的複雜任務時,它通過提高準確性變得很有用。特別是與專利、法律文件等專業領域相關的那些。它還應該有助於減少手動檢查翻譯內容是否有任何錯誤或差異所花費的時間。因此,使整個過程比以前順利得多。儘管如此,事實證明,使用諸如此類的先進技術不僅對公司有益。但最終用戶也依賴於在合理的時間內提供準確的信息。
專注於提高語料庫的質量
在國際口語翻譯研討會等競賽期間(IWSLT),團隊通常會獲得有限數量的語料庫。語料庫是結構化文本的集合,用於分析其翻譯模型。 SRPOL 團隊將他們的成功歸功於專注於提高這些語料庫的質量。借助數據預處理和過濾等過程。以及優化模型的架構和 AI 訓練過程。
SRPOL 的機器翻譯團隊使用改進後的語料庫,利用機器學習框架創建了一個分類器。該框架稱為 BERT(Bidirectional Encoder Representations from Transformers)。該分類器能夠成功地將語料庫中的數百萬個句子分類到不同的領域。它允許 SRPOL 為一般翻譯、醫學和法律翻譯創建模型。
SRPOL在機器翻譯領域取得了巨大的成功,連續四年贏得了IWSLT的挑戰。這表明達到類似人類的語言理解水平的目標是可以實現的。隨著機器翻譯和語言理解變得越來越普遍,三星將站在這項技術的最前沿,開發克服語言障礙和改善我們日常生活的工具。
另請閱讀:享受三星在 Galaxy 之間的連續瀏覽智能手機和 Galaxy Book 系列