聚集學術機構知識的中心:機構庫(Institutional Repository)探析

才智咖 人氣:2.51W

1 引言
    早在1988年,Peter Drucker就在《即將到來的新組織》一書中預言,“對一個組織來說,最重要的是該組織所擁有的知識資源,對其加以有效管理是組織成功的最關鍵因素。”[1]學術機構是人才和知識的集中地,收集、管理、利用其成員在學術科研等多方面的高質量數字資訊資源,對增強機構實力、贏取競爭優勢等都具有重要意義。時至今日,各學術機構成員可在網際網路上以各種方式發表、傳播和交流學術資訊,這給組織、管理這部分資訊帶來了相當大的困難的同時,傳統出版模式的侷限性也日趨明顯,不利於學術交流的開展。有鑑於此,2001年,俄亥俄州立大學的高階行政官員和該館館長布蘭寧(Joseph in)在探討開開發遠端教育體系時,提出並著手建立俄亥俄州立大學知識庫(Ohio State University Knowledge Bank),以儲存該校師生員工的數字知識資源,這也成為機構庫(Institutional Repository,以下簡稱IR)最初的雛形。2002年,麻省理工大學(Massachusetts Institute of Technology,MIT)和惠普公司(Hewlett-Packard Corporation)合作推出DSpace,宣告IR的正式誕生。同年,在“第六屆歐洲數字圖書館先進技術研討會”上,MacKenzie Smith做了《DSpace:來自MIT圖書館和惠普實驗室的機構庫》的學術報告,詳細介紹了DSpace的構建原理、執行情況及在開放學術交流和數字資源長期儲存中的重要作用[2],這一報告引起了各國學者的關注,也促成了世界範圍內關於IR的大規模理論與實踐研究。

      2 機構庫的定義

    關於IR,目前尚無統一的定義,比較有代表性的兩種觀點是:
    (1)美國網路資訊聯盟(Coalition for Networked Information)的常務董事Clifford Lynch認為,IR是指大學為方便其共同體組織、整理、儲存和利用師生員工相關的數字知識資源而提供的一系列服務[3]。此定義強調IR的目的是為使用者提供一系列服務,但服務物件侷限於IR所屬的機構成員,服務的目的是協助大學共同體組織、利用其師生員工的數字知識資源。
    (2)加拿大研究圖書館協會(Canadian Association of Research Libraries,CARL)則提出,所謂IR就是指蒐集、儲存學術機構成員的知識資源,並提供檢索的數字知識庫,同時認為IR可以作為一個全球知識庫的子庫,為世界範圍內的網路使用者服務[4]。此定義認為IR是一個聚集數字資訊資源的知識庫,其資源對任何國家的所有網路使用者開放,但該定義遺漏了一個重要的內容,即IR中的絕大部分資源可免費獲取。
    據此,筆者認為:所謂IR,就是以蒐集、組織、儲存學術機構(大學、大學共同體等)相關數字知識資源為主要任務,並將其中絕大部分資源對任何網路使用者免費開放的知識庫。

      3 機構庫產生的原因及其主要特點

    2.1 機構庫產生的原因
    IR之所以在人類剛跨進21世紀的時候興起,原因是多方面的,但最為根本的原因在於:
    (1)網路給資訊組織帶來的困難。網路環境下,學術機構成員可以通過各種方式(如個人網站、blog等)在網際網路上發表、傳遞各種學術資訊資源,據MIT的統計資料表示,43%的學者會把預印本(preprint)上載到個人網站上,60%的人則通過e-mail傳遞預印本文獻[5]。發表、傳遞方式的多樣性雖然在一定程度上促進了學術交流,但由於這些方式的隨意性太強,使得蒐集、組織、儲存、利用某一學術機構的知識資源就相當困難,給相關機構造成難以估量的損失。這也是建立IR最根本的原因。
    (2)傳統的期刊出版模式帶來了學術交流障礙。近年來,隨著出版機構的兼併和商業化,期刊價格大幅度攀升,大大超過了圖書館經費所能承受的範圍。美國研究圖書館協會(Association of Research Libraries,ARL)的統計表明,在1986-2000年之間,科學、技術和醫學方面的學術期刊價格增長了226%,同期商品零售價格指數增長幅度為57%,在此期間,圖書館購買期刊的經費增長了192%,但購買的期刊品種卻下降了7%[6]。雖然圖書館也嘗試通過館際互借、加大資料庫的購買力度、遠端文獻傳遞等措施來緩解經費短缺的壓力,但效果並不理想,也沒有從根本上解決學術交流的問題,從而促使人們思考傳統的期刊出版模式之不足,並探討新的方式以促進學術交流。
    (3)網格技術和開放原始碼的推動。網格計算源於元計算(Metacomputing),其初衷是將分佈的多臺超級計算機連線成為一個可遠端控制和訪問的元計算系統,網格體系根據高速和共享兩大特徵,正在不斷向基於更大的網、共享更多的資源、構建更大的計算能力的目標邁進。網格技術將有助於解決大併發量訪問、海量資訊檢索以及資源共享等方面的技術問題。而開放原始碼的意義則在於將人類大量寶貴的創造力從“重複創造”中解放出來。近年來,開放原始碼在數字圖書館領域的應用已經相當普遍。美國的OCLC,英國的UKOLN,以及紐西蘭的DL專案都是圖情領域推動開放原始碼應用的代表[7]。網格技術和開放原始碼為IR的建立奠定了關鍵的技術基礎,使IR思想的實現和快速發展成為可能。
    3.2 機構庫的特點
    (1)綜合性。IR不僅包括常見的研究性學術資源,如期刊論文、電子預印文字、技術報告、會議論文、學位論文、資料庫及數字圖書館資源,還包括部分學術資料庫所不收錄但又具有較高價值的資源,如工作檔案、影象、音訊和視訊檔案、學習資料等[8]。這樣IR即可全面系統地反映所屬學術機構的教學和科研成果,不僅有利於分析自身教學、科研的優勢與不足,衡量現有的研究水平和明確今後的發展方向,還可作為對外展示其綜合實力的視窗,以提高該學術機構的知名度和影響力。
    (2)開放性。進入新世紀以後,實現學術資源、科研成果的開放共享已經成為國際潮流。IR以其開放性的特點成為開放共享運動中的弄潮兒,IR對世界範圍內的所有使用者不抱任何偏見,任何使用者隨時都可以通過網際網路不受限制地合理利用其中的知識資源,這既利於本領域學者之間的學術交流,也利於其他學科研究者跨學科獲取知識與資訊,更重要的是它打破了國家界限,特別是有助於開發中國家的科學研究者追蹤世界著名學府研究的最新發展,從一定程度上縮小開發中國家與已開發國家之間的知識鴻溝。
    (3)動態性。一般來說,資訊一旦輸入資料庫就不再發生變化,IR則不同,為了使最新研究成果能在最短的時間內釋出,提交者可根據自己的最新研究隨時修改、更新之前提交給IR的資訊,使IR體現出明顯的動態性特點。這一特點雖然可以加快學術交流的速度,但也有可能使IR中的內容更迭過於頻繁,對其穩定性產生負面影響。

4 國內外相關專案簡介

    近兩年來,隨著各學術機構對IR的日益重視,IR的建設也取得了初步成效,現選取其中具有代表性的3個專案介紹如下:
    4.1 DSpace
    2000年3月,惠普公司出資1800萬美元,與MIT圖書館合作開發DSpace,2002年11月,DSpace正式面世並迅速成為一個由劍橋大學、哥倫比亞大學等七家著名學府直接參與的聯合機構庫。DSpace是目前全球最有影響力的機構庫,其收錄的資訊資源主要包括研究報告、資料庫、音訊和視訊檔案以及其他格式的MIT認為確實重要的檔案,但不收錄MIT學生的研究資料、機構記錄以及非MIT教師的研究成果等。DSpace提供一系列遵循開放檔案資訊系統參考模式(Reference Model for an Open Archival Information System)的上載、管理、傳播數字資訊的工具,並使用DC、OpenURL與OAI-PHM等一系列開放標準,因而成為其他機構開發IR的首選軟體,據統計,在成立後不到一年就已經有3500家來自全球的機構下載了DSpace的開放原始碼[9]。因此可以說DSpace是一個蒐集、管理、標引、傳播數字資訊的系統、工具和平臺。
    DSpace的垂直體系結構包括三級層次:儲存層、事務邏輯層和應用層,每一層都內嵌API(Application Programming Interface),方便系統的升級,同時也使其他大學在開發IR時能根據實際情況調整相關部分,提高DSpace的靈活性。儲存層的主要功能是儲存數字化資訊,事務邏輯層是整個系統的核心部分,主要包括工作流管理模組、內容管理模組、檢索和瀏覽模組,這些子模組也都相應地嵌有API;應用層則主要作為使用者檢索資訊的介面[10-11]。
    4.2 CARL機構庫導航專案
    CARL機構庫導航專案(The CARL Institutional Repositories Pilot Project)由加拿大12所大學於2002年發起建設,目前主要由西蒙·弗雷澤大學、多倫多大學等5所大學圖書館負責操作管理,導航專案旨在通過聯合加拿大眾多學術機構的知識庫,提高加拿大學術機構及研究人員的曝光度和影響力,同時,通過實踐操作為加拿大其他機構開發IR提供經驗。2004年,西蒙·弗雷澤大學推出名為“CARL收割機”(The CARL Harvester)的搜尋引擎,作為導航專案檢索服務的操作介面,通過此介面任何國家的使用者都可以免費檢索其中的資源。目前該搜尋引擎已經收錄了來自馬尼托巴大學等9個IR的4493條記錄並保持每日更新,提供簡單檢索、高階檢索和分類瀏覽等3項檢索功能,使用者可按任意詞、作者、題名、摘要、索引號、日期、語種等多種途徑查詢所需資訊[12-13)。
    4.3 學術資訊庫
    為推進香港中文大學(The Chinese University of Hong Kong,CUHK)印刷文獻的數字化程序,加強圖書館的電子導航功能,CUHK圖書館於2004年夏天開始建設學術資訊庫(Scholarly Information Repository,SIR),SIR以儘可能多地收錄CUHK共同體成員出版物資訊為目標,收錄的文獻種類包括學校出版物、各院系及教師出版物、教師工作文件、期刊論文、報紙、書籍、書籍篇章、學位論文、會議論文、技術報告以及專利資訊,除提供引文和簡單著錄資訊之外,還儘可能地提供全文的連結。
    提交者通過SIR系統中的“引文輸入系統”輸入出版物的詳細資訊,這部分資訊在傳遞給SIR系統的同時,還會傳送給研究與科技管理局中的線上出版輸入系統,SIR的檢索介面則允許使用者瀏覽和檢索所需資訊,並在結果中提供圖書館所購買的電子資源、網際網路上免費和有償電子資源的連結[14]。

共2頁: 1

聚集學術機構知識的中心:機構庫(Institutional Repository)探析

論文出處(作者):