社會網路資料與通常資料的比較論文

才智咖人氣：4.69K

1社會網路分析的獨特視角

對於大多數人來說，社會網路是由人和人之間的關係所組成的網路，如果將人看成是點或頂點，而將關係看成是連結或邊，那麼社會網路則是由點和邊組成的網路。對社會網路進行研究的歷史，可以說比任何其他如計算機網路都更加久遠，而且所探討的問題也更加深入。在社會學中，個體一般通常稱為行動者（又稱為行為人），本文也遵從社會學的這種慣例。社會網路是一種基於網路而非群體的社會組織形式，是西方社會學從1960年興起的一種分析方法和視角。社會網路分析是研究社會關係的，而不是個人屬性的。如果從社會網路分析的觀點來看，社會環境可以表述為互相作用的行動者之間的關係模式或規律性，將關係中存在的一般模式稱為結構，將測度結構的量稱為結構變數。社會科學中所探討的關係可以是多種多樣的，比如經濟的、政治的、情感的等，不勝列舉。從本質上看，探索關係以及關係模式的關鍵在於需要一組與傳統統計學和資料分析方法截然不同的方法及分析觀念。

1.1社會網路分析的獨特之處

在社會科學中，社會網路分析和研究方法具有其獨特的視角。這個獨特之處是：社會網路分析是建立在互相作用的行動者之間關係的重要性假設之上。社會網路視角包括以關係的概念或過程表達的理論、模型和應用，即由行動者之間的關係（又稱連結）所界定的關係是網路理論的基本成分。隨著網路分析的深入研究和應用越來越廣泛，逐漸達成對網路視角賴以存在的中心原則的共識。這些原則就構成了社會網路分析區別於其他社會學科的研究方法論。除了關係概念外，還有其他幾項也是重要的：（1）行動者和他們的行動被視為相互依賴的，而不是相互獨立的自治的個體；（2）行動者之間的聯絡（連結）是資源轉移或“流動”的通道；（3）行動者的網路模型將網路結構環境視為行動者行動的機遇或限制。於是，網路模型將（社會、經濟、政治等）結構概念化作為行動者之間關係的穩定形式，關於網路模型的建立、分析以及構成是社會網路分析的中心任務。研究社會網路現象並進行網路建模的過程，一般是針對某個要探索的社會網路現象，運用有關統計及網路分析的觀念，來設計產生關係資料，得到有關的特定網路概念，再進行網路資料的統計分析及建模等，隨後對實際統計結果給予適宜的綜合解釋，整個過程如圖1所示。社會網路分析方法的獨特之處在於，網路分析的分析單元或構件要素不是行動者，而是一個由行動者和他們之間的連結所組成的實體。網路方法集中於二元組（兩個行動者和他們的關係）、三元組（三個行動者和他們的關係）或者更大的系統（比如個體的子群或整個網路）。在社會網路分析中，社會行動者的可觀測屬性，例如人們的種族或民族特性，或者像公司或民族國家等集合體的規模和生產力，是通過行動者之間的關係模式或結構得以理解。行動者之間的相關關係是主要的，行動者的屬性則是次要的。

1.2社會網路分析的視角

給定一組行動者，社會網路分析能夠測度這個子集內行動者的結構變數。一個群體或更大型社會系統的關係結構，是由行動者之間的關係模式組成。網路概念強調這樣的事實：每個行動者和其他行動者都有聯絡，其他行動者中的每一個又都與或多或少的其他行動者相聯絡，等等。“社會網路”這個詞指的是行動者集合和他們之間的聯絡。網路分析的研究目的就是設法模擬這些關係來描述一個群體的結構。然後，研究這一結構對群體運作的影響或者這一結構對群體內行動者的影響。假如我們對一個大都市區域的企業行為感興趣，諸如給予本地非營利和慈善組織的貨幣支援的水平和型別。對於標準的社會和經濟科學方法來說，首先要界定一定數量的相關個體（企業），對其進行隨機抽樣調查（如果數量相當大），然後測度各種各樣的特性比如大小、行業、收益，對當地慈善機構或其他非營利組織的支援水平等。這裡關鍵的假設是某一個體的行為不會影響其他任何個體。網路研究者則反對做出這種假設。實際上，公司決定做它們所要做的事存在許多種方法，例如用捐贈來支援非營利組織。公司（和其他此類行動者）傾向於考慮其他行動者的行為，甚至嘗試彼此模仿。為了得到這種行為的完整描述，必須把著眼點由公司轉向公司關係，例如董事會交叉任職情況、公司高層的相識度、彼此之間的業務往來和其他關係變數。簡而言之，需要一種網路觀點來充分地理解和模擬這種現象。

2社會網路資料的特性

以往社會科學資料是由測量獲得的矩形列陣所構成的，如表1所示。列陣中的行表示案例、物件或觀察項，這裡是某組織的四個人員。列表示屬性、或變項或測量的分值，這裡是人員的年齡屬性。列陣中每一個小格子表示某行動者在某屬性方面的分值。在有些情況下，可能有第3個維度來表示不同觀察項組或多元分組。就通常資料而言，通過考察行的屬性不同來比較行動者之間相似或不相似之處。或者更常見方法是，基於不同變項在所有行動者中的分佈，考察變項的相似或不相似之處。就純形式而言，網路資料是一種測量資料的方形列陣，其行表示案例、物件或觀察項，而列表示同一組案例、物件或觀察項。和通常資料相比，這點構成了關鍵性的差異。列陣中每一個小格子都描述了行動者之間的關係。如表2、圖3以及圖4所示。網路資料結構，也能以屬性資料的方式來看待，通過對列陣中的行進行比較，考察不同行動者選擇的相似性；通過對列進行比較，考察不同行動者被選擇的相似性（如表2所示）。這是一種非常有用的方法，因為它有助於認識瞭解行動者在網路中的相似位置。這一點是網路分析首先要強調之處，即觀察行動者如何處於和嵌入在這個網路之中。網路分析也可以從第二種方式來考察資料結構，第二種方式是採用整體性或全域性網路視角。網路研究者發現，在表2中的0與1的數目是幾乎相同的。這表明，喜歡的行為具有中等密度。另外，可比較對角線上下二半的小格子，觀察行動者有無相互選擇行為。例如，張三選擇趙五，趙五選擇張三嗎？這是網路分析第二個要強調之處，即觀察行動者的選擇模式如何形成整體性或總體模型。儘管可將網路資料描述成一種特別形式的通常資料，但網路分析對於資料解讀確實具有根本的不同方式。不同於將行動者之間連結描述成“自我”的屬性，網路分析則是考察連結的結構，哪些行動者是嵌入其間的。行動者是以關係來描述的而非屬性。而且，關係本身與行動者一樣重要。圖2給出六個行動者及其某個x屬性的分值表示。圖3給出a行動者與f行動者，d行動者與e行動者,b行動者與c行動者具有連結的情況，以及某個x屬性的分值表示。圖4提供六個行動者及其友誼交往的情況，以及網路資料表示。綜上所述，網路資料與通常資料的最主要差異在於：通常資料專注於行動者及其屬性，而網路資料則聚焦於行動者及其關係。這裡所要強調的差異，將會影響到研究者後續在研究設計抽樣、實施抽樣、選取尺度以及資料處理時所做的決定，因此，網路分析所使用的工具與其他社會科學研究的大部分相同，但網路分析研究的特別目的及其所強調的重點則不同，進而導致了網路資料統計分析具有特殊之處。

3網路資料不是“獨立的”

網路資料是由行動者與關係（或‘結點’與‘連線’）所定義的。將結點（note）或行動者看成為網路的一部分再明確不過了。儘管社會科學中的其他經驗方法，也會研究案例、物件或樣本元素等，但網路資料卻具有一項重大的差別，即資料如何蒐集而來，也就是所關注的樣本及總體的種類。網路資料研究行動者間的關係，而不是個別的行動者及其屬性，這意味著行動者不是像其他許多研究那樣可以獨立抽樣，最典型的就是抽樣調查。假如我們研究友誼關係，若張三選為樣本，而張三又指認出七位朋友，如此就必須詢問這七位朋友的友誼關係，這七位朋友為樣本是因為張三是樣本，反之亦然，可見樣本元素不是“獨立的”。在以往非網路研究中，結點或行動者通常是獨立的概率抽樣結果。網路研究比較傾向於將自然發生的邊界內容的行動者納入進來。一般地說，網路研究也不使用樣本，至少不是傳統意義上的樣本。網路研究傾向於包含某個或多個總體的所有行動者。當然，網路研究的總體可以是更大總體的樣本。比如，研究一個班級同學的互動模式，所有該班的同學都被列入分析，也就是班級的全體成員，而班級本身可能是通過概率方法從班級總體中抽選出來的。

3.1總體、樣本及邊界

在許多網路研究中，以整個總體作為觀察物件，對於研究者來說，必須要相當清楚所探討的總體的邊界以及個體觀察項是如何被選擇進來的，這是一件極為重要的事。網路資料集合通常涉及多個層次的分析，而行動者就嵌入在最低層，所以才會出現使用嵌入或巢狀這樣的術語來刻畫網路設計。社會網路分析幾乎很少進行抽取樣本的工作。一般地說，網路分析要確認出總體，然後實施普查，也就是得到總體中的所有元素作為觀察單元。網路分析考察所感興趣的全部名詞與物件，例如在生日聚會中的所有人，或宗族、組織、鄰居、社會階級如某個地區的貴族成員。抽樣調查方法經常採取截然不同的方式來決定哪個結點必須要加以研究，它將所有結點編列成名冊，有時加以分層或者聚類，然後經由概率方法選擇出個別元素。此方法的邏輯是將每一個個體處理成單獨的‘複製品’，也就是在某種意義上，彼此之間可以互換。由於網路資料重視行動者間的關係，無法將行動者獨立抽樣出來觀測。如果一位行動者被選取，也就必須同時選擇這為自我所連結的其他行動者。因此，網路方法研究的往往是由普查而非抽樣所得到的全體成員。網路分析所研究的總體是各式各樣的。在某種極端的情況下，總體可能是所感興趣的符號，或是口語中的聲音；而在另一種極端情況下，國際體系中的國家組成了節點的總體。當然，最常見到的情況是由個人所構成的總體。無論在何種情況，總體元素之所以被加以研究是取決於某個邊界而定義的。網路分析所研究的總體邊界主要存在兩種型別。一種最常見的型別是行動者本身所形成或創造的邊界。比如，班級、組織、社會、鄰居以及社群的所有成員構成了總體，他們自然而然地構成叢集或網路。所以，在某種意義上，網路分析研究通常是以一個已知的或先驗的網路來設定總體邊界。另一種型別是網路分析也時常運用‘人口統計’或‘生態方法’來定義總體邊界。確定觀察物件是通過聯絡那些在同一空間區域中聯絡的所有人，或者那些符合某項資格的人員，如家庭收入年均超過100萬人民幣的。在這種情況下，有理由質疑這個網路的真實性，不過這些研究物件是由研究者所設定的抽象彙集，而不是由參與者所認定的制度化社會行動模式。網路分析研究者可通過複製總體而擴充套件其研究的邊界，不僅探索一處鄰居社群，而且研究多個鄰居社群。這樣的'設計形式是利用抽樣方法來選取總體，就能通過比較總體來進行復制或假設檢驗。另一種同樣重要的擴充套件方式是藉助於容納多層次分析，或者多模分析來加以擴充。

3.2模分析與層次分析

網路分析傾向於將個人行動者處理成嵌入在某個具體面對面關係網路中的人。通常，這些人際網路會成為一種社會事實，並自我發展。例如，家庭是由具有親密關係的人所組成的網路，但這種特定的網路已經制度化，並且擁有稱謂與事實，從而超越僅僅是成員結點的組合的網路。在工作關係中，個人被嵌入在組織中；在休閒關係中，個人被嵌入在自願社團中。網路資料集合描述了單一總體中的結點以及節點間的關係。假如感興趣的是一個班級的友誼模式，研究物件是同學友誼。可是，一個班級存在於學校之中，所以學校被設想為連結班級與其他行動者（校長、教員、圖書館員等）的網路，而學校又隸屬於學區，於是學區又可看成是學校與其他行動者（學校董事、研究機構、人事部門等）的網路，學區間也可能存在某種連結模型，比如交換學生、教師等。大多數網路研究者將個人處理成被層層網路所嵌入的人。網路研究者將這樣的結果稱為‘多模’。在前面例子中，個別的學生和老師構成單模形態，而班級是第二個模態，學校則是第三個模態等。如果資料包括兩種不同社會實體，比如人員和組織，則稱為雙模網路或二模網路。當然，這種看待社會結構本質的觀點並非社會網路研究者所獨有。統計分析就以層次或巢狀涉及來研究同樣的問題。理論研究者也討論所謂巨集觀、中觀、微觀分析，或發展出區別層次的方案，如個別、小組、組織、社團、機構、社會、全球秩序等，是社會科學中最常見的系統。但是，網路思考及方法的優勢之處在於：它使得分析人員一開始就同時聚焦多元層次分析。也就是，網路分析總是對個體如何嵌入在結構中，以及結構是如何從個體微觀關係中形成的而感興趣。映射出這種多模關係的網路方法的威力，就是其獨特而自成體系的研究關鍵。

4社會網路資料的收集

網路資料設計的另一半任務是要選取哪些結點或關係需要進行測量。關於這個專題有兩個方面的內容。在許多網路研究中，某個給定型別的所有節點都被納入研究，也就是實施普查。有時候，因為經濟因素或需要進行推廣，而採用連結抽樣。在網路資料中，執行的連結抽樣存在兩種形式，一組行動者可以被不同型別的節點與關係所連結，例如一個班級的學生可能彼此喜歡或不喜歡、在一起玩或不在一起玩等。當進行收集資料時，通常從所要測量的某類關係中的集合中來選取或抽樣。對於給定的行動者或節點來說，有許多策略可以決定如何收集行動者間的關係。一種方法是“全網路”方法，此方法是尋求最大可能的資訊，但其成本極高且難以執行，也可能難於推廣。另一種方法是和以往抽樣調查研究相類似的方法，這個方法會收集相對較少的網路結構資訊，但其成本較低，一般說來也較容易從樣本觀察推廣到更多的總體上。實際上，對於研究的專題和問題而言，不存在所謂“正確”的方法。

4.1全網路方法

全網路方法需要收集每一位行動者間的所有連結資訊。從本質上看，此方法就是針對行動者總體中的連結執行普查，而不是抽樣。例如，從國際貨幣基金組織(IMF)收集所有國與國之間的銅礦轉運資料，或者計算某國家兩兩城市間的交通流量等。由於所收集的是一對或對點之間的資訊，全網路資料提供了對於總體關係的完整景象。大部分的網路分析特殊途徑及方法都是為了研究全網路資料，許多網路分析的結構概念需要通過全網路資料來定義與測量，例如中介性。全網路提供了社會結構相當有利的描述與分析，但其成本極高，且不容易收集。即便對於任何小群體來說，收集所有成員資料，並請成員間相互評價或排序都是一件挑戰的任務。可見，對於大型總體，要獲得所有成員以及關係方面的資料幾乎是不可能的。

4.2滾雪球方法

從一個焦點行動者或一組行動者開始，每位行動者指出與其他行動者的部分或全部連結，然後追蹤所有（不在原始名冊中）的行動者，並詢問他們所擁有的部分或全部連結，這個過程一直持續到沒有新的行動者被提出來為止，或者研究者決定停止為止，這種方法稱為滾雪球方法。滾雪球方法非常適用於尋找特殊總體。事業網路、社群精英、親族網路以及其他可通過滾雪球方法有效確定與描述的結構。有時，滾雪球方法也不如想象中那麼難以找到終結的範圍，有限的強連結數目以及連結的互惠趨勢，都有助於找到邊界。儘管滾雪球方法擁有實用方便的優點，但也有一定的侷限性。其侷限性可以歸納為兩點：（1）沒有被連結的行動者也就是孤立點，無法通過此方法找到，而孤立點的存在與否對於有些研究目的來說是十分重要的總體特徵。（2）滾雪球方法無法保證找到總體中的所有連結的個體。應該從哪一處開始滾雪球訪問呢？如果起始點出現錯誤了，就可能漏失那些相互連結但卻與起始點不相連的整個次級行動者群體。

4.3自我中心網路

在許多情況下，從焦點節點找出整個網路是不可能的或者不需要的。一種替代方法是選取焦點節點，然後觀察其所連結的其他節點，最後再觀察其他節點間的連結情況。這就需要訪問每個節點，有時可以要求自我報告出其他節點間的連結情況。這種方法可相當有效地從非常大的總體中來收集關係資料，並與屬性方法有機結合起來。例如，從一所大學的男性大學生中隨機抽樣，再詢問誰是他們的好朋友以及這些朋友間的交往關係。這個方法對於此類嵌入個體的網路提供相當清晰可靠的景象，它說明節點有多少連結，以及這些節點交織成群的程度，這對認識嵌入在網路中的自我所擁有的機會及侷限性具有很大的幫助。自我中心網路聚焦在個體而非整個網路，通過收集與焦點自我形成連結的關係資訊，可以獲得明確的“區域性網路”或個體鄰居景象，這有助於認識網路是如何影響個體的，同時也描繪出整個網路的部分特質的景象。在以往的社會科學行動者與屬性資料集合中，每一個行動者都可由多個變數來刻畫。在最常用的社會網路行動者與行動者的資料集合中，僅僅是描述了一類關係，如同我們總是對行動者的多元屬性感興趣一樣，行動者在網路中的多種型別連結也同樣引人關注。比如，設想在某所大學的某系教師間的網路連結，他們可能共有一群學生，就任於某個共同的委員會，或有一個或多個相同的專長，甚至曾共同發表論文。儘管文獻中已經出現一些研究多重關係資料的方法，例如網路相關等，但不像單一關係，探索多重關係資料的方法發展較緩慢。

5測量尺度

5.1關係的二值測量

迄今為止，最常用的測量關係（如賦予數字）是直接區分關係之有無，不存在關係為0，存在關係為1。例如，在調查採訪中，詢問受訪者“名單中你喜歡哪一位？”這就是一個二值測量，任何被選中的都要編碼為1，未被選中的就編碼為0。大部分的數學圖論，以及對行動者和網路屬性的測量演算法，其發展都是針對二值資料。二值資料在網路分析中被廣泛運用，因此，在正式分析之前都要將‘較高’層次的測量資料轉換成二值資料。為此，首先選取一個“割點”，然後重新對這個割點之上下賦予新值（1與0）。這樣將資料二分，其實是一種資訊的取捨。研究者必須考慮什麼是相關的（比如，理論的重點是什麼？是涉及聯絡之有無或模式，還是聯絡的強度？需要利用何種演算法來決定資料編碼的合理性呢？由於二值資料非常簡明，所以出現數據的損失也是值得的。

5.2關係的多類別名義測量

在收集資料時，要求受訪者依據名單，用最適當的方式來區分名單中的人員：朋友、商業夥伴、親戚或者無關係。於是，就將名單中的人用“1”、“2”等資料辨識不同關係。這些都是名義或定性尺度，即受訪者與名單中的每一個人的關係是以類別而不是強度來編碼的。和二值名義不同的是，多類別名義測量是一種多元選擇。多類別名義測量方法最經常被用於構建一系列的二值測量。也就是上述訪問所獲得的資料，以朋友、商業夥伴、親戚等關係分別建立不同的數值集合，這類似於統計分析中處理多項選擇時所使用的“虛擬編碼”。然而，在考察所得資料時必須注意，在構建網路中每一個節點只有一個連結，即由於訪問問題所致，一個人只有親屬關係或非親屬關係——不能同時是二者，所以網路的密度會偏低，且矩陣之間也會存在負相關。這類多元選擇資料也能加以二值化處理，也就是可以忽略某些型別的連結直接對二元間是否存在關係進行編碼，這對某些分析來說是可行的。分組次序測量可用於反映關係的一系列不同的數量特性。網路分析通常想要描述連結的“強度”，而強度表示許多意義。互動的頻率是其中一個揭示行動者每日、每週或每月等聯絡情況的。另一個內容是強度，也就是通常反映關係所引發的情緒情況。當連結是互惠時，也被看成是較強的連結，互惠性通常利用詢問成對行動者的彼此感覺來評估。當然，也可探尋每位行動者對於互惠程度的認知：你認為你們彼此不喜歡對方嗎，或是喜歡X超過X喜歡你，或X喜歡你多於你喜歡X，或你們彼此喜歡的程度相同呢？最高階的測量層次是可使關係區分達到能明確表示的程度，比如“這個連結是那個連線強度的兩倍”。這時，連結強度的陳述尺度1與2之間所反映的差異正如同23與24間的差異一樣。許多種類的關係強度的區間尺度是非常容易建立的。但是，通過問卷或訪問方式請求受訪者指出其連結的頻率與強度細節，其結果就未必可靠，尤其是所追蹤的關係不是相當顯著或頻率不高時更是如此。因此，與其詢問兩個人間有無來往，不如計算兩人間的e-mail、電話、辦公室信件往來的數目；與其詢問兩個國家間是否有貿易往來，不如觀察兩個間收支平衡的統計資料。在許多情況下，可以運用人工資料或觀察（如針對某個其他目的而收集的統計資料）來建立關係強度的區間尺度。

6結論

社會網路分析已經融合社會學、數學、統計學等多學科的內容及方法，並發展出獨具特色的研究手段和途徑。就統計分析而言，社會網路分析既採用通常統計資料的分析方法，又採用‘數學社會學’的方法，這裡數學方法傾向於運用決定論視角處理資料，即將測量所得關係及其強度看成真實反映最終的或者均衡的網路狀況。數學方法傾向於假設：觀察物件不是較大總體的樣本，而是將觀察物件看成通常的關注總體。統計分析則傾向於將關係強度的特定數值看成是一種潛在的真實趨勢的隨機或概率表現，或者關係強度的概率分佈。同時，統計分析傾向於將特定的網路資料看成較大類別或網路總體的樣本，並關注當前研究成果能否在下次研究的相似抽樣中被複製出來。描述統計工具確實是概述分值分佈特性的演算法，也就是數學運算。推斷統計方法之所以成為統計領域的主流，原因在於評估所描述的模式重複性或似然性。推斷統計學能夠運用網路資料分析，但因網路資料不是“獨立”的及探索問題的視角不同，所以直接將推斷統計用於網路資料方面，還是具有相當大的差異性。因此，對網路資料進行統計推斷是一個仍有待進一步探索的前沿領域。

TAGS：論文