北蟲草專利檢索策略研究

才智咖 人氣:3.9K

摘要:北蟲草作為長白山代表藥物,隨著長白山資源的開發與利用,如何提升北蟲草專利研究的水平,增強專利資料來源的可信度,成為北蟲草專利檢索的核心問題。針對中國專利檢索策略的一般思路,引入詞頻分析與比較分析的方法,研究適用於北蟲草專利研究人員的中國專利檢索策略方法。

北蟲草專利檢索策略研究

關鍵詞:檢索策略 專利 詞頻分析 北蟲草

我國是蟲草資源分佈最多最廣的國家,國內外對已經成功誘發蟲草子實體的種類研究認為, 北冬蟲夏草食用和藥用價值可與天然冬蟲夏草媲美, 這一發現, 引起了世界各地對北冬蟲夏草的需求量激增, 因此, 人工培育具有自然形態的北冬蟲夏草子實體, 具有特殊意義。

通過專利檢索發現,長白山藥用植物資源產業系列品種開發的專利申請數量較多,但是其他品種從專利申請上難以看出優勢。應在北蟲草、鹿胎、林蛙等方面加大研發攻關力度,力爭開發新藥物、優勢藥物新劑型,獲取基本專利,增強核心競爭力。

在滿足專利檢索目標的前提下,實現專利資料集的全面與準確,是制定專利檢索策略的目的。如何保證查全率與查準率是專利檢索中的關鍵。常用的專利檢索策略大多依賴於技術專家提出的關鍵詞或者分類號檢索,因而在專利檢索中必然存在專家知識的主觀判斷。因而,基於技術資訊資源的客觀分析方法更應該得到應用和推廣。本文基於專利文獻和學術文獻中的詞頻分析以北蟲草的專利檢索為例設計一種更為客觀的檢索策略。

一、關鍵詞檢索

具體的來說有以下幾方面的問題:關鍵詞檢索很難全面獲取所需的專利文獻。北蟲草由於是近些年發現其可替代冬蟲夏草,因此較早的專利文獻少有記錄。翻譯方面存在不足、同義詞太多。由於北蟲草屬於中藥,在古書記載名稱較多,而英文翻譯水平有限,在檢索時存在難度,少有英文文獻記錄。專指性不強。由於早期對北蟲草的認識較少,因此至今依舊容易將北蟲草與冬蟲夏草混淆,難以檢索明確。

二、分類號檢索

分類號檢索的原理是基於專利局的專家們根據文獻主題對專利文獻進行分類所產生的序列號。因此,分類號檢索是專利檢索的有效檢索途徑。存在的問題:寬泛的分類標準:國際專利的分類在不同領域有不同的分類標準。分類號滯後:國際專利分類系統每5年才釋出一次分類號,對檢索人員來說參考價值大為縮水。分類號過時:很多免費的資料庫,甚至是收費昂貴的資料庫,都沒有提供舊的分類號和更改後的分類號之間的連結,只有美國國家專利和商標局提供了這類服務。本文將資料採集中確定並獲取專利資料集合的方法定義為“專利檢索策略”,即明確專利分析物件與研究主題,結合專利分析研究的具體需求,整理並收集相關領域的背景資料,整合包括專家意見在內的多方資源與反饋資訊,制定資料採集的目標資料集與檢索詞並進行多次修正,最終獲得專利資料集合的過程。整個專利資訊獲取策略的流程分為詞頻分析、比較分析和結果修正三個階段。

三、詞頻分析

詞頻分析是一種透過詞頻現象看內容本質的科學方法,也是目前內容分析法中最重要也是使用最多的工具。本文通過詞頻分析方法獲取北蟲草技術領域的關鍵詞集合以輔助專家決策,解決了單純依靠專家諮詢獲得檢索詞時可能存在的主觀性或偏差性等缺陷。例如,為了解北蟲草研究的總體特徵、研究之間的內在聯絡以及研究的發展方向等,就可以通過對期刊文獻中的關鍵詞或專利文獻中的技術核心詞進行詞頻分析來進行一定的歸納[4]。進行詞頻分析的目的是採用文獻計量學的手段統計出相應技術領域的熱點主題詞,再將主題詞轉化成適用於專利檢索的專利檢索詞。事實上,專利檢索詞與熱點主題詞( 即技術術語) 仍然存在差異。同時,任何一篇文獻的關鍵詞並非僅僅侷限於同一個領域,而是總結並概括了該篇文獻相關的全部核心技術。因此,通過詞頻分析獲得的主題詞中必定會存在一部分或偏離既定研究領域,或不適用於作為檢索詞彙的熱點主題詞。對於這些主題詞,需要依靠專家判斷進行清除。

四、比較分析

所謂的比較分析是指在專利檢索策略制定過程中通過將當前檢索策略與常用檢索策略、既往專案檢索策略進行比較,不斷地獲得反饋並對檢索策略進行修正的過程。通過比較分析,可以發現當前專利檢索策略的缺陷與不足,將多種檢索策略進行優化組合,以達到更全面和準確的檢索結果。其具體流程如下:假設通過詞頻分析所得到的關鍵詞檢索策略A 所獲得的資料集合為M,而常規檢索策略B 所對應的資料集合為N。首先找出這兩個資料集合所共有的資料,然後將兩種檢索策略間的不同結果進行比較。對屬於檢索結果資料集合M 但不屬於檢索結果資料集合N的資料,即是檢索策略A所得到的獨有資料集,稱為M1,對M1中的專利文獻進行逐項分析,以判斷這些資料是否是冗餘資料。其次,對屬於資料集合N 但而不屬於資料集合M 的資料,即是檢索策略B 所得到的獨有資料集,稱為N1,對N1中的資料進行逐項分析以判斷這些資料是否是遺失資料。通過以上比較分析方法,將關鍵詞檢索策略與常用檢索策略分別進行比較,並根據反饋結果對當前檢索策略進行反饋與修正,最終獲得修正的'檢索詞集。然後再請該技術領域的專家對檢索詞集進行補充和完善,這樣使得最終的檢索詞集既可以兼顧客觀規律又可以反應專家的智慧。

五、結果修正

結果修正階段首先需要通過對資料集進行包括關聯分析、統計分析與聚類分析在內的專利分析,其目的在於嘗試通過資料探勘的手段找到資料集合中的異常資料,以期達到對檢索策略進行再次修正的目的。其中,統計分析的重點在於詞頻統計,對於不符合檢索目的的檢索詞或IPC 要及時剔除; 關聯分析與聚類分析則側重於尋找偏離整體的散點群,並判斷散點群的成因。一般而言,此類散點群或為相應領域的技術創新點,或為無關資料。對於後者,應及時修正檢索策略。在完成結果修正之後,檢索策略最終完成,其對應的專利檢索資料集即為最終資料集合。

六、結論

本文以專利檢索四條標準為基礎,以北蟲草為例綜合運用詞頻分析、比較分析等定性、定量分析技術方法,創造性的建立了一套適用於中國專利的檢索策略制定方案,提高了國內外中國專利研究中資料來源的可靠性,具有較高的實用性與科學性。為長白山藥用植物專利申請和檢索提供了新的方法。綜上所述,本套專利檢索策略在參考當前國內外先進科技文獻檢索方案的基礎上,綜合運用定性分析與定量分析的方法,結合北蟲草的實際檢索情況,制定與推廣有助於增強國內專利資料檢索可信度,提升我國專利研究水平。