智慧財產權月刊 277期

58 111.1 智慧財產權月刊 VOL.277 本月專題 發展正體中文專利審查數位工具之分析討論 另一方面,亦可將適用於特定專業領域之同義詞定義為包含不同語言之同一 技術名詞。以「 DNA 」為例,其同義詞可定義為包括「去氧核醣核酸」、「デ ィーエヌエー」、「 디엔에이 」、「 Deoxyribonucleic acid 」⋯⋯等;以「瘦肉 精」 58 為例,則可定義為包括「乙型交感神經受體致效劑」、「 Beta-adrenergic agonist 」、「萊克多巴胺」、「 Ractopamine 」⋯⋯等;當請求項經斷詞分析而得 到兩個技術特徵「 DNA 」與「瘦肉精」,理想上可自動建構出擴展檢索式如下: 【( DNA or 去氧核醣核酸 or ディーエヌエー or 디엔에이 or Deoxyribonucleic acid or ⋯) @de AND (瘦肉精 or 乙型交感神經受體致效劑 or Beta-adrenergic agonist or 萊克多巴 胺 or Ractopamine or ⋯) @de 】, 這串繁雜的擴展檢索式包含多種語言之查詢詞彙,故可直接用於同時對世界 各專利局之專利資料庫進行檢索,得出所有包含「 DNA 」、「瘦肉精」及其同義 詞之相關專利。初步檢視檢索結果後,專利工作者根據專業並透過適當使用者介 面快速增刪關鍵詞、同義詞,遞迴數次即可快速逼近理想或符合其需求的最佳檢 索式。 肆、結語 中文之自然語言處理技術是值得關注之技術發展主題,它是中文文件電子 化、資訊化之後的下一步,讓運用者可進一步讀取中文文件裡包含的文字資料, 並將初始的資料提煉、轉化為更具價值的資訊,以供進一步分析、利用;一旦可 以有效提取中文文件中的進階資訊,我國現有的所有中文文件資料庫便都成了發 展大數據的無價寶庫、重要基石;透過大數據技術的分析能力,研究者或許將能 得到更多現在還完全想像不到的資訊。 58 維基百科,瘦肉精 , https://zh.wikipedia.org/wiki/%E7%98%A6%E8%82%89%E7%B2%BE ( 最 後瀏覽日: 2021/10/26 )。

RkJQdWJsaXNoZXIy MTYzMDc=