漢語言文學資料的檢索方法論文

才智咖 人氣:2.03W

自改革開放以來,我國的政治、文化和經濟等多方面都有了較大水平的發展,我國的語言資料檢索技術也有了一定的發展。在不斷地發展中,人們開始逐漸將現代高度發達的計算機技術和網際網路技術應用到語言檢索中,極大地提高了現代漢語言文學資料的檢索效率。與此同時,傳統的手檢方法也以其自身的優點而被人們廣泛地使用。充分了解兩種檢索方法,使得在漢語言文學資料檢索時,使用適當的檢索方法,能夠更加準確高效的檢索相關資料。

漢語言文學資料的檢索方法論文

1語言資料檢索概況

1.1語言檢索的定義

語言檢索指的是人們通過標引查詢文獻用的一種人工語言。語言檢索通常由採用人為特定標記成的檢索標識組成,在大多數情況下,人們採用的檢索標記的形式主要分為三種,分別為分類語言、主題語言和程式碼語言。分類語言通常是由數字和字母共同結合而成的一種基本字元標記語言。在人們利用分類語言進行檢索標識的過程中,人們為了方便查詢,大多采用的是字母來進行標識,而字母的選擇通常是根據所標記數目中的詞彙而定,因此分類語言檢索標識相較於另外兩種標識語言來講比較複雜。主題語言的構成主要是自然語言文字,其中多以名詞術語為主要的標記字元,此種檢索語言標記方法通常採用的是書目中的邏輯關係,這種方法標記的表述語言主要包括標題詞語言、單元詞語言、敘詞語言和關鍵詞語言四種。最後,所謂的程式碼語言主要指的是人們在描述某一事物時,通過事物自身所具有的特徵來用程式碼的形式加以編譯,形成的一種查詢編譯標識語言。

1.2檢索語言的表達形式

檢索語言的表達形式分為兩種,一種是通過詞表的方式建立綜合詞表和各類專業詞表,另一種則是詞表的聯機顯示。基於詞表的方式主要是通過受控檢索語言對詞表中的同義詞、近義詞等關係進行檢索查詢,因此產生了以敘詞為主的受控檢索語言和以全文檢索的自然語言。在此過程中,因為檢索的書目各有不同,所以存在多種主題詞表,目前我國比較權威的主題詞表主要是應用分類法組織文獻資訊的《中國分類法》和應用主題發組織文獻資訊的《漢語主題詞表》。另外,在分類主題一體化中比較權威的是《中國分類主題詞表》。詞表的聯機顯示主要指的是人為地將敘詞輸入計算機後,計算機的應用選單通過相關程式的處理,形成一個電子版的多視窗聯動的顯示介面。在顯示的頁面中,連帶顯示其相關關係,使得檢索能夠達到更高的水平。

2漢語言文學資料的檢索方法