LFS構造原理的分析

才智咖 人氣:3.22W
LFS構造原理的分析
摘 要:隨著Linux使用者的增加,越來越多的人願意自己定製自己的作業系統,LFS就是一種流行的從原始碼構建Linux的一種。本文該方法的構建原理,重點分析了Binutils、Gcc和Glibc在構建過程種編譯多次的原因。

關鍵詞:定製 LFS Binutils Gcc Glibc
一、引言

Linux 是和 Unix很相似的一種作業系統,具有Unix的全部特徵,並和POSIX相容。它是一個真正的多使用者多工作業系統,是一個優秀的軟體開發平臺。Linux最大的特點是它是自由的,這種自由有雙重含義。一方面, Linux的自由的意義是它是免費的,不必花費成本就可以得到它。Linux自由還有另一個重要的體現,那就是Linux 可以提供無限寬廣的技術發揮的自由空間。在購買到Linux之後得到的不僅僅是一個作業系統,還得到了系統的原始碼。這樣如果不喜歡Linux 的工作方式,就可以改變它(不僅僅是做微小的改動,你甚至可以安裝你的需求去改動整個作業系統)。只要按照通用公共許可證(General Public License)的要求,即可以無償地自由採用,改進,。這也正是Linux發展如此迅速的一個原因。

開放原始碼,也使越來越多的人不甘於使用現成的發行版,要想對Linux完全滿意,必須從頭構建自己的系統。本文的LFS正是構造Linux的一個方法。

二、LFS及其特點

LFS是Linux From Scratch的縮寫。"From Scratch"是一個片語,它的意思是"從零做起,白手起家,從無到有"的意思,因此"Linux From Scratch"本質上不應當理解為一個Linux發行版名稱。它最貼切的含義應當是一種"方法/思想":一切從原始碼開始的方法/思想。如果把 LFS 比作建築房子,那麼LFS 提供房子的框架藍圖,但是需要你自己建造它。

使用現有的 Linux 系統來開發自己定製的系統,這個"完美的"Linux 系統將擁有各種發行版的優點而沒有它們的缺點。使用者可以控制系統的所有特徵,包括目錄佈局、指令碼設定和安全設定等等。最終的系統將從原始碼直接編譯生成,使用者可以指定在哪裡安裝、為什麼安裝以及怎樣安裝每一個程式。可完全按照自己的需求定製Linux 系統,而且對系統有更多的控制權。

三、LFS的好處

LFS 存在的一個重要原因是可以幫助人們 Linux 系統內部是如何工作的。構建一個 LFS 系統會幫助演示是什麼使 Linux 運轉,各種元件如何在一起互相依賴的工作。最好的事情是通過這種學習可以獲得完全根據自己的需求定製 Linux 系統的能力。

LFS 的一個關鍵的好處是它讓使用者對於系統有更多的控制,而不是依賴於他人的 Linux 實現。在 LFS 的世界裡,你自己坐在司機的位置,掌控系統的每一個細節。

LFS 的另一個好處是可以建立一個非常小巧的 Linux 系統。當安裝一個常規的發行版時,人們經常要被迫安裝一些可能永遠不會用到的程式。這些程式浪費寶貴的磁碟空間,更糟的是佔用 CPU 資源。自己定製 Linux 系統的另一個好處是安全性。通過從原始碼編譯整個系統,你能夠審查任何東西,打上所有的安全補丁,而不需要等待別人編譯好修補安全漏洞的二進位制包。除非是你發現並製作補丁,否則你無法確保新的二進位制包被正確編譯並修正了。

四、LFS的構造原理

要基於原始碼的方式來編譯整個系統,那首先要解決的就是工具鏈的問題,即需要一個編譯環境。所以構造LFS系統分兩大步:一是構造一個臨時的編譯環境;二是構建LFS系統。

臨時編譯環境其實也相當於一個小的 Linux 系統。只不過這個系統將僅包含必要的工具,能夠構建最終的LFS系統。構建這個小系統分兩步進行,第一步是構建一個新的不依賴於宿主系統的工具鏈(編譯器、彙編器、聯結器、庫檔案以及一些有用的軟體),第二個步驟是利用這個工具鏈去構建其它基本的工具。

在工具鏈中最基本的是:Binutils、GCC和Glibc。Binutils 是一組開發工具,包括聯結器,彙編器和其它用於目標檔案和檔案的工具。GCC 軟體包包含 GNU 編譯器,其中有 C 和 C++ 編譯器。 Glibc 包含了主要的C庫。這個庫提供了基本的例程,用於分配記憶體、搜尋目錄、開啟關閉檔案、讀寫檔案、字串處理、模式匹配、數學等等。其它的工具必須在他們的基礎上建立。所以在下面講解的過程主要圍繞著這三個工具的安裝,以及工具鏈的調整為主。


那麼如何來建立一個這樣的編譯環境呢?那就需要一個現成的系統,稱它為宿主系統。現在總體的思路就是在宿主系統建立一個臨時的環境,可以chroot到這個環境,在該環境的基礎上構建一個乾淨、沒有的LFS系統。為了儘量的與宿主系統分開,所以要建立一個自包含、自依賴的工具鏈。由於這裡的工具鏈只起臨時作用,在完成LFS後可以將其剝離,所以可將編譯的所有檔案都放在同一個檔案中($LFS/tools)。在構建過程中應注意以下幾點:

1.這個過程在原理上與交叉編譯類似,通過把工具安裝在同一個目錄(使用相同的“prefix”)中以便協同工作,還利用了一點 GNU 的 “magic”。

2.小心處理標準聯結器的庫檔案搜尋路徑,確保程式僅連線到指定的庫上。

3.小心處理 Gcc 的 specs 檔案,告訴編譯器要使用哪個動態聯結器。

下面看看具體時如何實現的。

為了建立一個乾淨的工作環境,在宿主系統中新建立一個lfs使用者組,並添加了lfs使用者,在安裝過程中將一直使用該使用者。

首先編譯Binutils ,這時是使用宿主系統的環境。毫無疑問現在利用Binutils生成的程式會受到宿主系統的。例如:使用生成的ld(標準聯結器)程式將會連線到預設的/lib目錄(宿主系統)下的二進位制檔案。

然後編譯Gcc,仍然需要宿主系統的環境。顯然Gcc也受宿主系統的影響,這可以從它的編譯來看,它依賴的是宿主的Glibc,而Binutils可以使用剛生成的。Glibc提供了動態聯結器,用來找到並載入一個程式執行時所需的共享庫,在做好程式執行的準備之後,執行這個程式。此時生成的Gcc會使用/lib(宿主系統)下的動態聯結器,而不是$LFS/tools/lib下的。

通過上面兩步,我們就可以使用剛生成的bintuils和Gcc來編譯Glibc了。現在我們將bintuils、Gcc和Glibc都重新編譯了一次。接下來就要通過調整工具鏈來解決剛提到的兩個問題。一是重新編譯ld,將ld連線到$LFS/tools/lib下的函式庫。二是調整動態聯結器,修改Gcc的SPEC檔案,將動態聯結器連線到/tools/lib/.2(.2是動態聯結器的名字)。

到這裡看似可以編譯其它的工具了,但是接下來的工作並不是如此,而是再次編譯了bintuils和Gcc,然後用第一次生成的`Glibc和現在生成的bintuils、Gcc來編譯其它的工具,整個臨時環境才搭建成功。

這裡有個問題是為什麼要將Bintuils和Gcc編譯兩次,可以直接用宿主系統?第一次編譯bintuils和Gcc的目的一方面是為了編譯Glibc;另一方面是為了能自己編譯出第二遍的Gcc,即使得Gcc是自我編譯的。如果直接使用宿主系統可以滿足編譯Glibc的要求,但是Gcc就不是自我編譯了。這裡為了保證製造的正確性以及使Gcc是自我編譯,所以Binutils和Gcc比其它的工具都多編譯一次。

接下面其它工具的編譯都是使用第二次編譯的Binutils和Gcc以及第一次編譯的Glibc。至此,工具鏈就準備好了,我們可以利用這些工具生成最終的系統。同樣最先生成的軟體還是Binutils和Gcc,不過在編譯它們之前,我們先編譯出Glibc,它也是我們最終需要的C庫。再次調整工具鏈,讓隨後編譯的工具都連線到這個庫上。不難理解,在前面的調整中我們將工具鏈使用的庫從宿主系統轉向新安裝的庫目錄。同樣,現在將工具鏈所使用的庫從臨時的庫轉向LFS系統最終的庫目錄。

系統中的其它軟體都是由最新編譯的Binutils、Gcc和Glibc編譯的。最後就是經過配置一些簡單的系統啟動指令碼、建立fstab檔案、編譯核心並安裝載入程式,最終的LFS系統就可以啟動了。

五、LFS的擴充套件

通過上面的大致的過程:通過宿主系統搭建了臨時的工具鏈,然後通過工具鏈構建了最終的目標系統LFS。將LFS建成以後,就可以脫離臨時編譯環境。本文所說的編譯都是相同的平臺,前面也提到構造臨時編譯環境的原理與交叉編譯環境相似,結合我們搭建交叉編譯環境的過程,如果我們搭建的臨時工具鏈是一個交叉編譯環境,最終就應該可以實現一個跨平臺的目標系統。當然具體的細節問題還需要進一步探討。

六、小結

直接從原始碼構建Linux作業系統,不僅能夠定製自己理想的作業系統,更重要的通過構造LFS能夠加強我們瞭解Linux內部是如何工作。對於有志Linux系統的人,這個構造很有必要。同時,我們應該抓住開放原始碼的機遇,認真研究,同時做出自己的貢獻,推進其。



[1] 王景中. Linux安全最大化.出版社.2000.5.P3.

[2] Gerard Beekmans. .

[3] .換個角度看LFS——反向分析LFS. 2006.6.

[4] LFS (版本6.1.1) 安裝心得.
TAGS:LFS 構造