智慧財產權月刊 277期

111.1 智慧財產權月刊 VOL.277 35 本月專題 發展正體中文專利審查數位工具之分析討論 壹、前言 我國專利文書以正體中文記載,為一大特色,因此本文嘗試初步討論運用中 文自然語言處理( Natural Language Processing, NLP )技術至專利文件分析或處 理等相關工作的可行性:藉由檢視人工智慧( Artificial Intelligence, AI )當今現實 ( State of the Art )技術層面及中文 NLP 技術之發展現況,分析中文 NLP 是否有 能力或有潛力支持以 AI 檢索專利引證之所需,以及如何謀定關鍵資料準備、開 始蒐集工作,以因應洶湧而至的專利 AI 相容化浪潮,係本文設定目標。 貳、機器學習、深度學習及自然語言處理 首先簡述機器學習、深度學習及自然語言處理等三個 AI 技術之發展、應用 領域 1 ,以及機器學習與深度學習兩者間的關係。 一、機器學習 如圖 1 所示,「機器學習」( Machine Learning, ML )是 AI 的子集,包含可 自行從資料學習而增進自身效能的各種 AI 技術。 ML 系統能從以「資料」代表的 「實際環境」、「實務經驗」中學習,自我改進,故無須要求設計者在設計的最 初就決定了系統最終的樣貌;一般而言,建立、運用 ML 系統之流程為:在建立時, 由設計者(至少包括程式編寫者,可加入問題所屬領域之專家等)針對「問題」 設定系統模型(一模型例如:包含種類相異之多個函數,函數個別之待定參數, 及組合多個函數之輸出的待定權重等)及目標函數,根據訓練資料及目標函數訓 練(進行最佳化( optimization )演算)而求得最佳化的( optimized )系統模型; 在運用時,以上述最佳化模型設定系統,讓系統根據「測試資料」判斷給定「問 題」的答案。 1 Paula Carreirão, Unraveling the Enigmatic Artificial Intelligence and Its Wonders, A SKSUITE , 1, https://asksuite.com/blog/backstage-of-artificial-intelligence/ ( last visited Oct. 26, 2021).

RkJQdWJsaXNoZXIy MTYzMDc=