網路教學資源搜尋增強論述論文

才智咖 人氣:3.24W

摘要:網路教學資源服務物件包括教師、學生、社會培訓者等,其對應多種學科、類別,資源數量較大,使用者需要通過搜尋獲取所需的特定資源,因此如何提高資源搜尋的效能和實用性就十分重要。文章主要針對網路教學資源的搜尋效能、實用性進行搜尋增強研究。

網路教學資源搜尋增強論述論文

關鍵詞:教學資源;搜尋增強;效能;實用性

伴隨著網路技術的不斷髮展,教育對教學資源建設的重視,為網路教學資源庫的建設提供了契機。網路教學資源服務的物件包括:教師、學生、社會培訓者等,其對應多種學科、類別,資源數量較大。使用者對資源的需求不一樣,需要通過搜尋獲取所需的特定資源,因此如何提高資源搜尋的效能、實用性是網路教學資源庫開發所需要解決的一個重要問題。本文主要針對網路教學資源搜尋的效能、實用性進行增強研究。

1搜尋效能增強策略研究

1.1使用索引提高搜尋效能

索引是對列值進行排序的一種結構,正確地利用索引能夠加快對資料表相應資訊的訪問[1]。索引雖然能夠提高資料的檢索效能,但是也提高了資料維護的成本。因此,要合理使用索引,在建立索引前,需要確定使用哪些列和要建立的索引型別。索引包括聚集索引和非聚集索引[2]。聚集索引適用於含有大量的不重複值的列、可用於範圍值計算的列、結果集較大的查詢及經常使用連線或分組的列,非聚集索引中鍵值邏輯順序和物理順序沒有關係。將主鍵設定為聚集索引並非最佳方案,在教學資源庫中資源編號是標記列且設為主鍵,會把資源編號設定成聚集索引。在實際應用中,並不會針對資源編號進行搜尋,這就導致讓資源編號作為聚集索引是不正確的選擇。其次,資源編號都不相同,也不符合“很多資料不同值的列不應該設定聚合索引”的規則。下面以在1000萬條資料量的資源資訊表中查詢近180天的資源資訊速度為例(180天內的資源資訊資料為30萬條,資料通過程式生成,供測試使用),其分析如表1所示。表1索引設定與用時對比索引設定用時(毫秒)只在主鍵(資源編號)上設定聚集索引129652主鍵(資源編號)上設定聚集索引,日期上設定非聚集索引54128在釋出日期(vDate)上建立聚集索引2446通過上述的資料分析,正確地建立聚集索引是十分有必要的。必須根據實際中的應用範圍和資料本身的構成來確定聚集索引,而非固定使用預設的主鍵作為聚集索引。

1.2優化SQL語句提高搜尋效能

資料庫管理系統本身具備了一定的查詢分析優化能力。在MSSQL中的“查詢分析優化器”,會檢測查詢的各個組成部分,並判斷要求掃描的組成部分是不是有用,如果某個組成部分能夠作為一個掃描引數,則稱該組成部分為可優化,並使用索引對所需資料進行快速獲取。如果某個表示式不能滿足掃描引數的條件,就不能控制掃描範圍,“索引”對不符合掃描引數條件的表示式是起到作用的。因此,在SQL查詢語句的編寫過程,要注意where子句的優化,讓“索引”的作用得以充分發揮,最大限度地提高搜尋效能。在搜尋過程對資訊欄位的獲取要遵循“需要多少,提取多少”的準則[3],不要採用“select*”。欄位提取的多少對速度的影響如表2所示。1.3自定義分頁提高搜尋效能在資料的查詢過程中,若一次性將查詢結果讀出,當資料量較大時,勢必需要消耗較多的讀取時間,影響搜尋結果的最終呈現速度。因此,在專案的實際開發中,可以應用自定義分頁的形式提高搜尋的`效能,若將實現自定義分頁的過程使用儲存過程的方式來實現,充分利用儲存過程的優點,搜尋效能將會得到更進一步的提高。自定義分頁每次查詢只從查詢結果中讀出當前頁所需的資料,以資源搜尋結果為2000條資料,系統每頁呈現20條資料為例,普通分頁與自定義分頁相比,如圖1—2所示。通過圖1—2可以看出,採用自定義分頁,僅從資料表中讀出當前頁的20條,資料控制元件也不需要進行控制元件內分頁,其效能在資料讀取和資料呈現上都有良好的提升。

2搜尋實用性增強策略研究

2.1純粹模糊查詢實現搜尋的不足分析

純粹模糊查詢實現搜尋指在搜尋的過程中,僅將使用者輸入的關鍵字在資料的查詢過程中,用資料庫本身提供的模糊查詢功能,與資料庫表中的相關欄位值進行匹配,並將匹配正確的值提取至搜尋結果。其操作簡單,但存在以下2點不足:(1)相關詞無法匹配。相關詞無法匹配造成搜尋結果的部分性,是純粹模糊查詢的最大不足之處。(2)容錯性低。由於未對輸入的搜尋關鍵詞進行分析,一旦關鍵詞中包含無用詞或錯別詞時,將導致搜尋結果零資料返回。通過上述分析,要解決相關詞無法匹配和容錯性低的兩大不足,需要對搜尋實用性增強進行研究。

2.2增強相關詞匹配

相關詞的界定很難由程式自動判斷,因為相關詞有客觀構成,也有主觀構成。如:電腦與計算機、computer為客觀相關詞,而電腦與微軟、馮諾依曼則為主觀相關詞。客觀相關詞為事實存在,為大多人所共知,而主觀相關詞需要在特定的條件下成立,人們通過“電腦”可以聯絡到軟體巨頭“微軟公司”或電腦科學家“馮諾依曼”,需要一定的知識延展性,甚至“電腦”可以延伸到“計算器”,不同的使用者有不同的認識。因此,主觀相關詞具備一定的不確定性與抽象的特點。增強相關詞匹配可通過增加相關詞欄位或建立相關詞庫的方法來實現。相關詞的匹配涉及匹配的深度和廣度,越全面、精準則其投入成本越高。增加相關詞欄位。指通過在資料表中增加“相關詞”欄位,當用戶在新增資訊時,輸入與此資訊的相關詞。相關詞的界定及輸入由資訊編輯者進行操作,採用增加相關詞欄位的方式來提高相關詞匹配,其實現方式簡單,操作過程也容易,但相關詞的界定由編輯者確定,相關詞的個人主觀性較強。建立相關詞庫。指通過建立相關詞庫表,當用戶輸入搜尋關鍵詞時,系統自動在相關詞庫表中搜索其相關詞,一併歸入關鍵詞中進行處理,對搜尋的實用性有很大的提高。當用戶輸入搜尋關鍵詞時,系統將自動遍歷搜關鍵詞的相關詞,達到相關詞匹配的目的。建立相關詞庫的方式,其相關詞並非由編輯者個人界定,而且相關詞可以靈活調整,不斷補充。因此,建立相關詞庫的方式更加全面、客觀,但構建一個完善的相關詞庫需要較大的投入。增加相關詞欄位與建立相關詞庫兩者各有優缺點,但兩者並非對立。在一個系統中,可以同時採用這2種方式或者其中之一以增強搜尋相關詞匹配,提高搜尋實用性。具體實施方案還需要考慮到實際需求和投入成本預算。

2.3增強搜尋容錯性

在搜尋的過程中,使用者對搜尋關鍵詞的輸入具備不確定和冗長等特點。不確定主要指關鍵詞的選詞不確定和關鍵詞的是否正確不確定,而冗長指使用者輸入的搜尋關鍵詞包含多餘的資訊。如果系統的搜尋過程未對使用者輸入的搜尋關鍵詞進行分析和處理,那麼,其搜尋結果將有可能得不到使用者所需要的資料。從搜尋易用性與實用性的角度出發,搜尋功能必須具備一定的容錯性。要增強搜尋的容錯性,就需要解決搜尋關鍵詞的不確定與冗長的特點。將搜尋關鍵詞按一定的規則進行拆分,簡稱分詞。將長詞轉化為短詞,並捨去重複的部分,可以提高搜尋相關詞的匹配,降低長詞中錯詞、別詞的構成,從而提高搜尋的容錯性。分詞搜尋可以在一定程度上解決搜尋的容錯要求,提升搜尋的功能與精確度。分詞技術主要分為3種:(1)字串匹配的分詞方法。字串匹配的分詞又分為4種,分別是:正向最大匹配法、反向最大匹配法、最短路徑匹配法、雙向最大匹配法。(2)詞義分詞法。詞義分詞法根據機器語音進行分詞判斷,通過對句法、語義的分析,使用句法資訊、語義資訊進行分詞。但詞義分詞法目前還不成熟,尚處於測試階段。(3)統計分詞法。統計分詞法依據片語的統計,針對相鄰的字出現的次數多少,認定詞的重要程度,作為關鍵詞的分詞分隔符。盤古分詞作為一種分片語件,大大降低了系統進行分詞搜尋的投入成本,避免重複造車的現象,非常方便應用在基於技術進行開發的系統中。

3結語

通過對索引的合理利用、SQL語句的優化和自定義分頁的使用,對搜尋效能有良好的提升,融入盤古分詞的強大功能,結合相關詞匹配技術,能夠提高搜尋的實用性。本文從搜尋效能與實用性兩方面研究了搜尋增強技術,並將其應用於學院的教學資源庫建設中,雖然取得了一定的成效,但還需要繼續努力。

[參考文獻]

[1]張玉峰,袁方,湛燕,等.基於索引結構的關係資料庫關鍵詞檢索[J].河北大學學報(自然科學版),2015(1):95-101.

[2]魏威,馬國峰.基於索引的關係資料庫查詢優化[J].洛陽大學學報,2007(2):83-86.

[3]徐新靜優化技術及應用[J].天津冶金,2011(2):25-27.