因子分析法在地球化學測量樣品分析中的應用論文

才智咖 人氣:3.25W

摘 要:在地球化學沉積物取樣調查過程中,採取的樣品的數量極其龐大,潛在控制變數較多,如何快捷有效地提取關鍵資訊,分析資料變化找出異常區域,是樣品資料分析的核心問題。利用因子分析方法處理複雜的元素資料,通過計算將龐大的資料劃分成少數重要因子,結合區域前期的勘察結果,對因子所代表的古環境進行探討分析並統計成表、繪製成圖,在減少工作量的同時使得資料變得更為直觀可靠。為區域地質調查提供了有價值的參考依據,並在後續的勘探過程中得到了驗證。

因子分析法在地球化學測量樣品分析中的應用論文

關鍵詞:因子分析;地球化學測量;水系沉積物;R型因子

1 因子分析的不同方式及其適用範圍

因子分析法,其基本目的在於用較少的因子,描述或解釋整個事件中變數的關係,不同於主要成分分析,它是通過降維的思想,將原始的研究資料通過矩陣(或協方差矩陣)的形式,以其內部變數關係相互關係為出發點,將錯綜複雜的變數用少數變數因子來表示的多元統計分析法。

因子分析可根據其出發點不同分為:R型因子分析、Q型因子分析,以及Q-R型因子分析:

R型因子分析,是針對變數所做的因子的分析,其基本思路為通過對變數的相關係數矩陣結構組合的研究,找出能夠表現所有變數的少數幾個隨機變數來描述大多數隨機變數之間的相關關係。再根據其相關性的大小對變數進行分組,使同組內的變數之間的相關性較高,而非同組變數之間的相關性較低。

Q型因子分析,是針對樣品所做的因子分析。它與R因子的出發點不同,但核心的思路是相同的。它的計算是從樣品的相似係數矩陣出發,而R型因子分析的計算是從樣品的相關係數矩陣出發的。換而言之就是考慮指標的重要程度,決定保留哪些去掉哪些;Q型聚類分析考慮的是指標之間的相關性,哪幾類指標可以合併組成一個類,使得組內距離而小組間距離大(組內距離、組間距離根據具體問題進行具體的調整分析)。

Q-R型因子分析巧妙的運用了R型因子與Q型因子的對偶關係,將變數與樣品特性投影在一個因子空間內,使得樣品型別特徵可以以空間內其他變數點來解釋。

水系沉積物樣品分析中,核心問題是研究元素共生組合關係,因此R型因子分析被視為樣品分析的有效手段和方法,就像原子內部規律組合的結構,R型因子將其所代表的多項變數因子進行整合,實現降維,不僅能體現出元素在含量上的相互關係,更可以反應元素內部成因關係。換而言之,R型因子分析結果可以用來進一步的分析元素的賦存狀態和形成方式。在地質事件過程中,經常會伴隨物質成分的活化和轉移,從而形成新的元素關係網,並在因子分析過程中得到體現。

Q型因子在計算過程中會對指標進行縮減,將保留的重要指標用以代表整體變數,排除分析的過程中因為更大的誤差和異常的數值而造成不必要的干擾,並減少了計算量。但在樣品分析的過程中,異常值往往是特殊構造、特殊解釋的突破口,為了保證實驗分析的準確性,往往不採用Q型因子分析法。

Q-R型因子分析的主要應用於研究變數和樣品之間的關係,由常用的R型因子分析,可以輕易的轉化成Q-R型因子分析,但Q-R型因子分析較少被提及應用不廣泛。

因子分析法在樣品分析中已經有了實質性的應用,尤其針對土壤、水系地球化學測量過程中分析元素種類龐大,圖件數量龐大,單憑人力很難快速準確地進行資料處理分析。相對於其他方式的普查,水系沉積物、土壤沉積物地球化學勘探有著取樣簡單、成本低、適用範圍廣等優勢。而水系沉積物的成分、含量特徵與物源巖性存在著複雜的關係,資料處理是整個地球化學勘探的核心部分,有效的分析方法不僅可以提高樣品分析的速度,更可以提高沉積物樣品的準確度,對地球化學測量有著重要的意義。

2 因子分析法在實際中的應用

在某長江中下游地區的1:20萬普查勘探過程中,針對3025個水系沉積物樣品進行了28種化學元素的分析。並利用R型因子對元素進行降維,提取有效的公共因子,根據少數公因子提供的變數,來反映不同元素之間的組合關係,進而劃分元素共生組合型別。在該地區的水系沉積物樣品分析過程中,將28種元素中資訊的'重疊部分進行組合,提取成為公共因子,以這少數變數綜合表現多個變數(此劃分基礎建立在原樣品中具有較多的共同特徵)。在實際使用過程中使用了Bartlett球度檢驗以及KMO檢驗,在準備過程中對樣品進行了相關性檢驗,對樣品相關KMO值進行分析,對實驗所得KMO數值進行劃分:KMO0.9非常合適;0.8 對區域內28種元素進行分析後,利用正交旋轉因子在和矩陣對元素進行整合,將計算結果特徵值進行綜合對比,最終選取前五個公共因子為重要因子(其特徵根數值分別為R1-2.354、R2-1.521、R3-1.358、R4-1.186累計特徵根百分比為75%)。這五種重要因子代表工作區內五中元素組合:(1)As,Sb,Mo;(2)Pb,Ag,Bi;(1)ZN,Cu;(4)W;(5)Au。上述五種聚類結合實際資料可以對各種元素之間的親疏關係進行識別。

聚類分析中所得到的R1組合對應Mo、As、Sb因子組合,代表了高溫熱液活動的特徵。R2組合對應Pb、Ag、Bi因子組合,R3組合對應As、Sb、Mo因子組合,對應為多金屬礦化的物質屬性,說明上游地區有較為活躍的熱液活動。而通過實際勘探已經發現上游地區多為溫熱型礦床,基本與實驗資料相符。R4組合對應KMO計算結果中的W因子,通過兩方面證明了W元素具有較強的獨立性。R5組合對應Au因子,充分說明Au元素獨立的元素特徵。

3 結束語

利用因子分析所得出的結論,將區域內28種元素減少為5個公共因子,極大的減少了工作量,使得原本無從下手的大資料處理簡化成了5個因子的組合,進而轉化為較為直觀的資料表。將資料加以解釋處理按照其分佈梯度繪製成圖,即可將原資料70%多的資訊簡單的呈現在了眼前。在實際應用中,圖件的辨識度極高,異常明顯,元素共生伴生關係便於解釋,為下一步的工作打下了良好的基礎。

參考文獻

[1]董毅,範麗琨,段煥春,等.青海大阪山地區水系沉積物測量元素組合分割槽[J].地質與勘探,2009,45(1):70-74.

[2]董毅.因子分析在水系沉積物測量地球化學分割槽中的應用探討――以青海都蘭地區為例[J].礦產與地質,2008,22(1):78-82.

[3]於林松,邱成貴,劉偉.青海省北部綠草山地區化探元素組合分類資訊探討[J].山東國土資源,2014,30(20):54-57.

[4]趙博.幾種統計分析方法在化探資料處理中的應用[D].北京:中國地質大學,2010.