智慧財產權月刊 277期

111.1 智慧財產權月刊 VOL.277 35 本月專題發展正體中文專利審查數位工具之分析討論壹、前言我國專利文書以正體中文記載，為一大特色，因此本文嘗試初步討論運用中文自然語言處理（ Natural Language Processing, NLP ）技術至專利文件分析或處理等相關工作的可行性：藉由檢視人工智慧（ Artificial Intelligence, AI ）當今現實（ State of the Art ）技術層面及中文 NLP 技術之發展現況，分析中文 NLP 是否有能力或有潛力支持以 AI 檢索專利引證之所需，以及如何謀定關鍵資料準備、開始蒐集工作，以因應洶湧而至的專利 AI 相容化浪潮，係本文設定目標。貳、機器學習、深度學習及自然語言處理首先簡述機器學習、深度學習及自然語言處理等三個 AI 技術之發展、應用領域 1 ，以及機器學習與深度學習兩者間的關係。一、機器學習如圖 1 所示，「機器學習」（ Machine Learning, ML ）是 AI 的子集，包含可自行從資料學習而增進自身效能的各種 AI 技術。 ML 系統能從以「資料」代表的「實際環境」、「實務經驗」中學習，自我改進，故無須要求設計者在設計的最初就決定了系統最終的樣貌；一般而言，建立、運用 ML 系統之流程為：在建立時，由設計者（至少包括程式編寫者，可加入問題所屬領域之專家等）針對「問題」設定系統模型（一模型例如：包含種類相異之多個函數，函數個別之待定參數，及組合多個函數之輸出的待定權重等）及目標函數，根據訓練資料及目標函數訓練（進行最佳化（ optimization ）演算）而求得最佳化的（ optimized ）系統模型；在運用時，以上述最佳化模型設定系統，讓系統根據「測試資料」判斷給定「問題」的答案。 1 Paula Carreirão, Unraveling the Enigmatic Artificial Intelligence and Its Wonders, A SKSUITE , 1, https://asksuite.com/blog/backstage-of-artificial-intelligence/ ( last visited Oct. 26, 2021).