從節點屬性角度對教師科研專案合作網路視覺化分析

才智咖 人氣:2.12W

目前的科研合作網路視覺化通常以節點連線圖和鄰接矩陣為主要方法,下面是小編蒐集整理的一篇探究教師科研專案合作網路視覺化的論文範文,供大家閱讀檢視。

從節點屬性角度對教師科研專案合作網路視覺化分析

合作研究對於資訊獲取、思想交流、知識創新有重要的意義,是科學研究的重要模式。學者對科研合作網路進行了大量的探討和研究。隨著視覺化技術的發展,社會網路視覺化已成為分析科研合作網路的重要手段。通過對合作網路中的節點之間的聯絡進行視覺化建模,將科研合作網路資料以圖形化方式展示出來,不僅可以科學高效地協助使用者清晰地認識合作網路的內部結構,同時也有助於挖掘隱藏在網路內部的有價值資訊。目前已開發出的多款社會網路視覺化軟體,如UCINET,Pajek,NWB等都能用於科研合作網路的可視分析。然而當前絕大多數網路可視分析雖然能較好地揭示網路結構,卻往往忽略了節點本身的背景資訊(如屬性)。實際上社會網路不僅僅是一系列匿名的節點和連線,同時還應包含行動者的社會屬性和他們的關係。Breiger指出作為行動者社會層次的屬性資訊通常有重要的社會影響。因此分析社會網路不僅要關注所呈現出來的網路模式,同時也應關注隱藏在屬性中的社會結構。比如在學者合作網路中,一個學者的所在單位資訊包含學院、學校和國家3個不同的層次,如果能從不同的社會層級(從個體,到跨部門,到國際合作)來分析學者行為,將有助於深入理解學者的合作行為以及影響力的分析。針對目前社會網路視覺化難以支援節點屬性挖掘的問題,本文提出一種從節點屬性角度對社會網路進行可視分析的方法,該方法能在展示單個節點間相互關聯關係的同時,展示單個節點與其所屬群體和其他群體間的層次關係,以及不同群體間的關聯和從屬關係,側重於對節點本身的屬性資訊和群體間的從屬關係進行挖掘。筆者以某學院教師科研專案合作網路為例進行分析,從多尺度和跨尺度對教師的科研合作進行了展示,彌補了以往可視分析只注重網路結構特性的不足,為更深入全面地瞭解合作網路提供了幫助。

 1、相關工作

圖形視覺化正在成為了解不斷擴大的社會交流協作網路的重要手段。由於這樣的網路有著更大、更復雜的連結和結構,傳統的直線圖和力引導佈局不能有效地揭示關係和結構,這便導致許多新視覺化技術的產生,如層次聚類和連線集束方法。

1.1層次視覺化的相關研究

在當前的層次視覺化研究中常見的是類似於樹根的有根樹結構,這種方法是使用與計算機拓撲網路結構相類似的直線連線和層次佈局來表示一個層次網路;也有將節點的聚類根據其層次情況按照不同的深度排列在一個圓形整體中的氣球佈局;還有使用基於空間填充設計技術的樹形層級圖,這種方法通過將矩陣中的方塊按照不同的權重和從屬關係進行巢狀處理來表示層次關係。層次聚類圖則是融合以上層次視覺化方法,同時引入視覺化互動技術的一種視覺化方式,因為它擁有總覽、縮放以及篩選的功能。該技術假定一個或多個項被當作一個整體節點在視覺化圖形中輸出,然後構建節點的分層或聚類叢集,為這些分層或聚類叢集分配一定的顯示空間,這種視覺化方法與當前的力引導佈局對節點的位置計算所不同的是,該方法直接使用節點本身的屬性資訊來進行節點位置的定位,既保留了原始資料中節點的分層結構屬性,又避免了力引導佈局所需要的大量計算。

1.2連線集束的相關研究

節點之間使用直線連線是一種常用的關係表示方法,但隨著資料量的增大,這種方法會由於連線交叉的增多而迅速導致視覺上的混亂。Fekete等為了減少直線的交叉提出使用弧線連線來儘可能避免直線的交叉,而Kauf-mann等為了避免連線的交叉將聚類的方法應用到視覺化研究中,將位置相近的連線捆綁成束以減少視覺化圖形中線的數量,避免密集的連線對視覺化圖形可讀性的影響。en融合以上方法的優點提出將邊緣匯聚技術應用到預先定義過層次的複合視覺化圖形中,針對的是既包含層次關係又包含連線關係的網路資料。在樹形結構中直接新增網路關係連線會使樹結構的可讀性受到極大的影響,為了解決視覺化畫面雜亂的問題,這種既可以顯示節點的層次屬性,同時藉由視覺化互動技術,通過點選縮放可以展示層次屬性的細節,使不同層次的資訊能夠按照使用者的需求進行資訊的約減及擴充套件的連線集束的視覺化方法被提出,較好地滿足了將網路資訊和層次屬性相融合的需求。該方法使用階層式的方式來顯示節點的樹形結構,並且通過一定的聚類和集束來減少連線交叉所形成的間隙,通過使用相近連線共享同一個路徑而兩端散開的連線方式,減少了在大資料的顯示中由於連線的交叉而帶來的視覺上的混亂。

 2、資料模型

通常社會網路是用圖模型G={V,E}來表示的.。

其中V代表所有節點的集合,而E代表所有邊(關聯)的集合。本文在這個基本的圖模型上進行擴充套件來包含節點的屬性資訊。每個節點具有多個屬性,例如一個學者的社會屬性的隸屬關係可以在國家、地區、學校、學院、系等多層面進行描述。所以定義有多個層級屬性的社會網路為N={VN,EN},其中VN為所有社會行動者(節點)的集合,而EN為所有社會關係(邊)的集合,每個節點有m個屬性,屬性之間是有層次關係的。屬性之間的層次關係定義為樹結構Ti=(VTi,ETi),其中VTi表示來源於第i個屬性的樹的節點,ETi是樹形結構的邊,表示屬性的父子關係。為了分析社會網路和社會層次屬性資訊,使用TreeNet圖模型,一個由樹形結構和網路兩個子圖所構成的複合圖。一個TreeNet圖模型TrNi可以寫成:TrNi=(Ti,N,ρ),其中ρ是一個網路節點在樹結構中葉節點的對映,ρ(nTi)→nN,nTi∈VTiL,nN∈VN,VTiL是Ti樹形結構裡的葉節點,該模型被用於整合具有不同層次屬性的社會網路。

 3、案例分析

以武漢大學資訊管理學院教師科研合作網路為例進行可視分析。該資料集包括72名教師以及141個專案,這些專案分別為該學院在2006—2012年獲批的國家自然科學、國家社會科學和教育部3類專案。節點屬性有兩層,學院和系,具體來說為1個學院,5個系,分別是圖書館系、資訊管理科學系、檔案與政務資訊系、出版系、資訊系統與電子商務系。針對該學院科研合作網路的構建是以教師為節點,教師的合作關係作為邊。這是一個無向有權重的社會網路,任意兩名教師同時參與的專案數作為這兩個節點之間邊的權重。整個網路的邊權重總和為364。與以往分析整個網路結構特性不同的是,從節點屬性角度來分析學院科研合作網路,具體來說,從多尺度和跨尺度的角度來揭示合作模式。比如針對科研管理人員來說,不僅需要知道整體的教師合作次數,更關注系與系之間的合作模式有何不同,哪兩個系合作最為頻繁哪些教師跨系合作多,是連線不同系的科研人員。為此筆者利用EXTRAVIS構建了一個合作網路視覺化系統,通過互動介面實現多尺度和跨尺度分析,為科研管理人員提供快速、易理解的評估和更有效的交流手段。多尺度體現在個人與個人、系與系合作模式展現,跨尺度體現在個人跨系合作模式展示。

3.1系與系合作關係的視覺化分析

基於節點屬性資訊和節點關聯資訊而生成的各系間的專案合作總圖。左側選單可以對資料模型中的ρ進行調整,這樣可以選擇是否對關係連線進行匯聚,而右邊則通過列表的形式對系內和跨系合作的數量情況進行巨集觀展示。連線的粗細表示專案合作次數的多少,而連線中標註的數字則量化地描述了合作次數的多少,從圖1可以清楚地看到每個系與其他系的合作次數,提示資訊管理系與電子商務系是合作最多的兩個系。在此基礎上很容易得到以係為單位的合作情況(如表1所示),可以發現資訊管理科學系是與其他系發生合作次數最多的系,其總數達到了80次,其次是資訊系統與電子商務系58次,出版系36次及檔案與政務資訊系32次,圖書館系28次。

在圖1的基礎上進行擴充套件,點選系所屬資訊片使其展開而得到了圖2的合作關係詳細檢視。通過展開每一個系節點,能夠得到包含每個系教師詳情資訊的系合作關係詳圖,從中可以看到兩級節點,第一級是系,第二級是個人。詳圖除了進一步顯示資訊管理系與電子商務系間最為密切的合作關係外,還顯示了全部參與合作的二級節點(教師)的情況,從整體上顯示了系內和系間存在的合作關係。圖2提示資訊管理科學系中教師間合作關係連線最為密集,內部合作有63次,其次為電子商務系30次。

3.2個人在系內及跨系合作關係視覺化

為了解個人在系內以及跨系的合作情況,可以將整個系的節點進行縮放以觀察個人跨系合作情況,以“LuoLin”(以下簡稱“LL”)節點為例項,展示跨系合作次數檢視並進行分析。在圖3中可以發現“LL”節點屬於資訊管理科學系,“LL”跨系合作涉及的繫有4個,分別是電子商務系、出版系、圖書館系、檔案與政務資訊系。

如果需要進一步瞭解個人究竟與哪些個人進行跨系合作,可以通過視覺化互動式技術將所有與“LL”節點有聯絡的節點都通過附加標註的方式在圖4中進行展示,通過由指向性而展開的附加標引,提示與“LL”節點有聯絡的相關節點和具體的節點資訊及數量。

從圖4可以看出,與“LL”節點有合作的系內節點共有7個,系跨系節點有4個,與“LL”節點有合作關係的節點以文字的形式在畫面上縱向排列,可以讀出節點數共有11個,它們分別是“LP”、“ZYF”、“XLF”、“LG”、“ZXJ”、“ZXG”、“YL”、“TXQ”、“LW”、“LQ”、“MFC”,且在右邊的資訊分列欄中,高亮的位置(計算機顯示)同樣可以輔助使用者讀取與“LL”節點有關聯關係的節點位置。由此可見層級式邊緣集束模型對同層級間資料的視覺化也有著良好的資訊傳遞效果,圖4中的資料可以概括成為表2的“LL”節點個人與系合作情況表,“LL”節點共與5個系中的11個節點有過12次合作。

若按照系整體的角度對跨系合作數進行統計,資訊管理科學系最多,有80次合作,而最少的圖書館系也有28次,由此可以發現跨系合作非常頻繁,有的系跨系合作次數甚至與系內合作次數相當,同時有的節點還成為跨系合作中的橋樑,如“LL”、“HRH”等均與所有繫有過合作。

這說明在目前的科研合作中跨系交流現象十分明顯,實際上科研合作並沒有受到組織結構的影響。

 4、分析

目前針對科研合作網路的研究大體可分為3類。第一類是針對機構內部成員合著情況的研究,如Perianes-Rodríguez通過對大學內合著分析來識別研究小組,並對其進行可視分析。歐陽霞探討了EAMOLA成員的科研合著行為,分析了合著網路結構、密度、核心作者分析,以及專案實施前後合著網路結構變化分析。第二類是針對某一領域的作者以及機構合著情況分析,如邱均平和王菲菲通過構建國內競爭情報領域作者的合作關係網路,分析作者的外在合作關係,同時輔以作者關鍵詞耦合分析挖掘該領域內潛在的合作團體。Arif等學者研究了印度計算機領域研究機構的成員合著網路。李長玲等人對我國圖書情報學研究機構的合作網路進行了可視分析。第三類是針對期刊的合著研究,如李亮和朱慶華選擇了《情報學報》的合著作者為物件,對國內情報學領域的合著網路進行了實證研究,評價了學者在合著網路中的地位,發現了合著網路中聯絡緊密的團體。孟微和龐景安以《情報理論與實踐》合著網路為例,對其中有代表性的子網路進行了具體的分析。餘豐民、楊江明以《圖書情報工作》為研究物件,除了對作者合著進行分析外,進一步對機構合著和區域合著現象進行了研究,以評價某種刊物的作者、地區和機構的合著水平和能力。雖然研究物件不同,但以上這些研究的方法基本相同,大都採用科學計量方法和社會網路分析法,通過統計文獻數目、合作情況和高頻詞,挖掘出該領域的重點研究主題以及核心人物。但在合著網路視覺化方面存在層次屬性被忽略、關係資訊展示不充分等問題。因此只能進行單尺度(個體—個體)的關聯分析,無法實現多尺度(機構—機構、地區—地區、國家—國家)和跨尺度(個人—機構、個人—地區、機構—地區、機構—國家)的關聯分析,因此很難回答哪些機構合作最多,哪些地區合作最多,哪個學者跨機構、跨地區合作最多,哪個機構跨地區、跨國家合作最多等問題。而本文提出的合作網路視覺化方法通過互動介面提供快速,可縮放、多尺度和跨尺度可視介面,能夠很好地彌補之前的不足,協助使用者輕鬆地獲取對複雜合作網路的更深層理解。

 5、結束語

目前的科研合作網路視覺化通常以節點連線圖和鄰接矩陣為主要方法,僅注重節點的分佈和邊的排列,忽略了節點的屬性資訊。為此,本文提出了從節點屬性角度對科研合作網路進行可視分析的方法,並以武漢大學資訊管理學院專案合作網路為例,對該網路進行了多尺度和跨尺度的可視分析,彌補了傳統的社會網路視覺化方法在表現層次屬性視覺化方面上的不足。

該方法不僅具有易讀性的優勢,而且具有極好的可擴充套件性,能夠滿足多層資料的可視縮放。在本文中節點的屬性層次僅考慮了兩層,資料集相對簡單,在下一步的研究中,將擴大資料集到學校範圍以探測學院間的合作模式。另外將融合文獻計量學方法對大量關聯資料及屬性資料進行整序和排列,以提供更多的分析功能。