WIPO推出先進的神經網絡機器翻譯工具WIPO Translate

世界智慧財產權組織(WIPO)於2016年10月31日宣布,已開發出一種以新的突破性人工智慧技術為基礎的專利文件翻譯工具,納入現有的WIPO Translate,該工具是利用先進的神經網絡機器翻譯(neural machine translation)技術,可將高技術性專利文件轉為文體和句法都更接近一般用法的第二種語言,表現優於過去以其他技術建立的翻譯工具。

WIPO已初步「訓練」這個新技術來將中文、日文及韓文專利文件翻譯為英文,2014年這3種語文的專利申請案約占全球總申請量55%,現在使用者可以在WIPO網站的公共測試平臺試用中/英翻譯。

翻譯的高精確度是透過訓練神經網絡機器翻譯工具的結果,是以中國大陸知識產權局(SIPO)提供WIPO PATENTSCOPE資料庫的專利文件中6千萬個句子,以及這些案件向USPTO申請時的英譯本進行比對。

WIPO計畫將神經網絡機器翻譯服務擴充到法文專利申請案,接著再擴及其他語文,PATENTSCOPE資料庫整合了網路上免費提供的其他翻譯引擎,並繼續在使用現行的統計式翻譯技術下翻譯品質良好的語言。WIPO已將此翻譯軟體分享其他國際組織,包括聯合國會議管理服務、糧食及農業組織、國際通信聯盟、國際海事組織、國際貿易組織及對抗愛滋病、結核病和瘧疾,目前聯合國的翻譯系統係與WIPO的統計式翻譯版本整合,未來幾個月將升級至神經網絡版本。

神經網絡機器翻譯是一項新興技術,係利用以前翻譯過句子的龐大神經網路模式來「學習」,與過去「詞組為本」(phrase based)的統計模式相較,其特異性在於它譯出的字句更自然。在最近的測試中,WIPO-Translate的神經網絡翻譯品質在如日/英或中/英這些差異大的語言 (distant language pairs),也比其他非WIPO的翻譯服務好,由於此WIPO工具是專門訓練用於專利文件,而非各種不同的文本,故翻譯品質較高。

註:
PATENTSCOPE資料庫在國際專利合作條約(PCT)申請案公開當日開放全文格式資料,亦提供成員國專利局的專利文件,可用多國語文以關鍵字、申請人姓名、國際專利分類及其他方式檢索,收錄約5千8百萬筆資料。
相關連結: WIPO , http://www.wipo.int/pressroom/en/articles/2016/article_0014.html