淺析教育資源網格分散式檢索子系統的研究與設計

才智咖 人氣:1.39W

論文關鍵詞:資源網格 分散式 資源檢索

淺析教育資源網格分散式檢索子系統的研究與設計

論文摘 要:在資源網格系統中,資源往往處於不同地區、不同結構的資源節點上,使用傳統的集中式的檢索機制無法勝任大量異構資源的檢索和發現。為了解決這個問題,研究設計了一個以XML為基礎的分散式檢索子系統。該系統通過同構的XML檔案對不同資源節點上的本地資源進行描述,生成該節點上本地資源的描述XML檔案,並以此為基礎,對多節點的大量資原始檔實現了分散式的檢索。
  
  目前,隨著現代資訊技術在教育領域的廣泛應用,各地的中國小都擁有大量各種各樣的教學資源,包括教學課件、教學案例、精品課程教學視訊和各類輔助教學軟體等,但這些資源往往只能在有限的地域內尤其是校內才能訪問,互相之間發現和共享資源都十分困難,形成了許多的“資訊孤島”,限制了不同學校、不同地域的資訊交流和資源共享。因此,如何實現不同學校、不同地域之間的資源共享,提高資源的利用效率,避免同類資源的重複開發,是目前中國小教育資訊化建設迫切需要解決的問題。
  大量資源被分佈在不同區域的不同資源節點上,每個節點對其所擁有資源的描述和儲存方式各有不同,有的通過各種資料庫,有的則通過一些資源描述檔案來組織其本地資源,加之各種資料庫、描述檔案之間往往是異構的,其各自的資源檢索機制也是多種多樣[1]。顯然,在這種下,使用傳統的集中式的檢索機制無法勝任大量異構資源的檢索和發現。網格作為一種日益流行的分散式計算平臺,為教育資源的共享提供了一種有效的解決方案。在網格的環境下,分佈在不同地域、不同主機上的資源可以通過鬆散耦合的方式實現共享,其中資源的、儲存機制與傳統的集中式的資源組織方式有著很大的不同。
  XML是一種開放標準、簡單易用的,它支援國際化,與平臺、工具、資料庫、協議、程式語言無關,並且XML檔案是基於文字的,易讀易寫,也易於在網路中。本文正是利用了XML語言的這些優點,通過同構的XML檔案對不同資源節點上的本地資源進行描述,生成該節點上本地資源的描述XML檔案,並以此為基礎,對多節點的大量資原始檔進行分散式的檢索。
  
  一、分散式檢索子系統的體系結構分析
  在教育資源網格的體系結構中,對資源的儲存和管理一般被分散在若干個具有不同結構的子節點上,本文定義這種節點為一個資源節點。資源節點一般位於一個較小的教學部門內,儲存了該部門一定數量的教學資源,並以web服務的方式供使用者和其它資源節點訪問。但不同資源節點的資源組織方式往往不同,有的是通過資料庫,有的是通過一些描述檔案,而且資料庫的種類和結構也有很大的差別,這就導致不同資源節點之間資源共享和發現都十分困難。
  在以上所描述的環境中,使用者如果想訪問這些資源,需要登陸每一個資源節點進行檢索和下載,但因為資源節點分佈廣泛,數量眾多,使用者要儘快的檢索到自己所需要的全部資源存在一定的難度。分散式資源檢索策略可以有效的解決這一問題,該策略的思想是當用戶登陸任何一個資源節點的時候,這個節點除了要檢索自己本地的資源以外,還又作為一個客戶端,自動地去連線其它資源節點併發出檢索請求,將檢索結果進行合併和彙總後返回給使用者[2]。
  
  二、本地資源的XML描述
  在教育資源網格系統中,資源通過各種協議由資源釋出人上傳至資源節點。資源釋出人在上傳過程中,需要指定資源的標題、所屬年級、學科、作者等描述資訊,這些資訊往往是資源檢索的依據。因此,本地資源的XML描述檔案需要記錄以上的資源資訊。為了實現所有資源的統一組織,這個XML文件在不同的資源節點上應該是同構的。
  根據以上的思想,需要對XML文件進行統一規範。在一個資源節點的XML描述文件中,XML頭部顯式定義文件使用UTF-8作為編碼方式,以廣泛地支援各種字符集。XML文件以allresource作為根元素,表示該元素下的子元素描述了該資源節點全部資源的資訊。allresource元素下包含至少一個resourceitem元素,表明了該資源節點下的一個資源項。在resourceitem元素之下,又分別定義了該資源的各種描述資訊,包括標題、所屬年級、學科等。
  在每一個資源節點上,只需一個節點管理程式,該程式會隨著其所屬本地資源的變動維護一個XML文件,它的作用實質上是充當一個資源發言人的角色。其他站點只要通過這個XML文件,就可以得到這個資源節點所管理的所有資源的資訊,包括資源的描述資訊和資源的地址資訊。因此,對資源的檢索過程也就轉化為對這個XML文件內容的檢索過程。
  
  三、基於XPath的本地資源檢索
  通過以上論述,對一個資源節點的檢索過程可以通過檢索其資源描述的XML文件內容來完成。XPath是一門在 XML 文件中查詢資訊的語言,它可以用來在 XML 文件中對元素和屬性進行遍歷,使用路徑表示式來選取XML文件中的節點或者節點集,可以通過XPath語言構造資源檢索語句。
  在 XPath中,有元素、屬性、文字、名稱空間、處理指令、註釋和根節點七種型別的節點。在遍歷過程中,XML 文件是被作為節點樹來對待的。樹的根被稱為根節點,在根節點下,路徑表示式可以通過類似Windows作業系統資料夾的`形式構造。
  通過XPath語言構造出的資源檢索語句需要返回XML文件的資源描述中所包含的使用者所提供的檢索字串中的資源項。在上文資源描述的定義規範中,對資源項的具體資訊描述,如標題、所屬年級、學科等,都是以子元素的形式位於該資源項元素之下,因此,要想獲得該資源項元素,需要對已經查詢到的包含使用者檢索字串的元素進行軸路徑查詢,以向上回溯獲得該元素的父節點,即所要返回的資源項元素。