面向網路爬蟲的企業網站搜尋引擎優化

才智咖 人氣:3.15W

良好的網站地圖導航可在一定程度上彌補網路爬蟲無法識別圖片和動態網頁造成頁面不可見的情況,下面是小編蒐集整理的一篇關於網路爬蟲企業網站優化策略探討的論文範文,供大家閱讀檢視。

面向網路爬蟲的企業網站搜尋引擎優化

網路爬蟲作為搜尋引擎技術的核心技術,是按一定遍歷策略,以網頁之間的連結為路徑,抓取網頁必要資訊,並將其下載到本地儲存裝置上,以便進行資訊預處理的程式或指令碼。隨著網際網路的普及與搜尋引擎技術的不斷髮展,網路爬蟲技術作為搜尋引擎的核心技術,已被越來越多的企業重視。面向網路爬蟲的企業網站,優化策略研究成為企業網站優化推廣眾多手段中最節約成本且效果最好的方法。

一、面向網路爬蟲的企業網站優化策略

(一)網站導航

結構清晰的網站導航為網路爬蟲層層深入訪問網站提供了很大便利,是網路爬蟲比較重視的內容之一。可從以下幾方面對網站導航進行優化設定,以便網路爬蟲更好地抓取收錄網站。

1. 用文字連結設定導航

基於目前的技術水平,網路爬蟲能夠識別的內容大多是文字內容,而無法識別 flash 和 JS 等,因此,用文字連結設定導航對網路爬蟲來說比較合適。

2. 導航關鍵詞的設定

導航關鍵詞一般選用目標關鍵詞的長尾詞,避免和首頁目標關鍵詞衝突。導航上的錨文字也可看做是一些很有價值的關鍵詞,可按照從左至右,重要性依次降低的方法進行設定。此外,儘量避免使用一些沒有實際作用的欄目。

3. 網站地圖的設定

網站地圖也可看做是一種良好的網站導航,其作用不可小覷。無論是 html 還是 xml,現在的主流搜尋引擎都支援。良好的網站地圖導航可在一定程度上彌補網路爬蟲無法識別圖片和動態網頁造成頁面不可見的情況,當站點欄目或內容過多時,可藉助網站地圖導航方便使用者訪問。同時,這樣也更有利於網路爬蟲的爬行和抓取。

以文安縣麗祥彩鋼防盜門廠網站為例,本站導航如圖 1 所示,共有二級,層次較淺,並且採用文字連結,這種樹狀結構不管是從深度優先還是廣度優先的演算法,都大大降低網路爬蟲的工作難度,有利於網路爬蟲在短時間內更快、更準確地對網站內容進行抓取和收錄。

(二)關鍵詞

關鍵詞是搜尋引擎優化的核心,是網路爬蟲用來判斷網站主題及核心內容的重要指標。關鍵詞的研究和選擇是搜尋引擎優化至關重要的一步。

首先,在選擇關鍵詞時應該站在使用者搜尋的角度,選擇與企業網站方向和產品相關且比較具體的、具有針對性的詞語。其次,為避免同行之間的激烈競爭,儘量不要選擇熱門關鍵詞,在實際操作過程中可通過查詢百度指數觀察關鍵詞的搜尋量,以及某個關鍵詞的百度索引結果的量。再次,還可參考同類型網站,分析研究其關鍵詞的選擇和設定,並結合自身網站方向或產品特點,合理設定自己網站的關鍵詞。最後,合理設定關鍵詞的長度和個數,合理新增關鍵詞 alt 屬性,提升關鍵詞密度,增加網站權重,便於網路爬蟲檢索。例如,文安縣麗祥彩鋼防盜門廠網站中,其關鍵詞為:彩鋼房防盜門,快裝房防盜門,雅緻房防盜門,彩鋼房專用門,文安縣麗祥彩鋼防盜門廠。

(三)網站內容

網站的發展靠內容,網站內容也是網路爬蟲比較重視的。網路爬蟲在爬行和抓取檔案時會進行一定的複製內容檢測,遇到權重低的網站上大量的轉載或抄襲內容時,很可能不再繼續爬行。因此,網站內容最好是原創,且具有豐富內容,這樣的網頁被爬行的深度較高,被收錄的內頁也較多。當然,在保持文章意思不變的前提下,通過對文章標題及內容進行修改,達到偽原創的目的也是很多SEO 人員常用的`手法之一。在實際操作中,可根據自己的情況進行適當的偽原創。

(四)Alt 屬性

由於圖片或 flash 能帶來良好的視覺效果,很多企業在進行網站設計時,往往傾向於通過圖片或者 Flash 等形式展示企業形象。但由於網路爬蟲往往只能識別網頁中的文字資訊而無法識別圖片或Flash 資訊,因此,使用者無法通過網路爬蟲發現含有圖片或 Flash 資訊內容的網站,alt 屬性為解決這一問題提供了方法。由於 alt 屬性是用來對網頁上的圖片進行描述的,是網路爬蟲唯一能識別的圖片資訊,因此,可在所有圖片的 Alt 屬性中都新增文字描述,並將該頁面的關鍵詞放在其中,如:.

(五)合理的連結

連結是網路爬蟲爬行的路徑,因此,在網站建設期間,要保證在任何一個頁面上一級欄目可互通,一級欄目下的二級欄目也可互通,站內文章最好帶上一篇和下一篇,或是相關、類似文章,確保網站內的頁面互相通達,避免死鏈,確保網路爬蟲能夠通過站內連結,順利爬行網站。連結分析是搜尋引擎排名演算法中很重要的部分,一個網站如果能獲得大量其他網站給出的、能被網路爬蟲識別的大量高質量的連結,搜尋引擎就認為該網站是受歡迎的,這樣的網站一般都會在搜尋結果中獲得較好的排名。

因此,尋找和自己網站內容相關的、權重或 pr 值高的網站進行連結,對提升自己網站在搜尋引擎中的排名有一定作用。此外,由於一些大型論壇、入口網站空間部落格更新速度快,網路爬蟲的爬蟲比較頻繁,在這些站上留連結,也有利於網路爬蟲迅速抓取並收錄。

(六)頁面更新頻率

網頁更新頻繁會使網路爬蟲更加頻繁地進行訪問,頁面上出現的新連結,也會被網路爬蟲更快地抓取。因此,很多企業網站都會有行業動態、新聞動態這一板塊。除用於釋出相關訊息外,其最主要的目的是時常保持更新,吸引網路爬蟲來訪。

 二、企業網站搜尋引擎優化效果分析

網站主要通過關鍵詞密度檢測、關鍵詞排名、SEO 綜合資訊查詢等方面對搜尋引擎優化效果進行檢測,通過優化前後資料對比,可見文安縣麗祥彩鋼防盜門廠網站取得顯著效果。關鍵詞密度主要用來測量關鍵詞在網頁上出現的總次數與其他文字的比例,一般用百分比表示。關鍵詞密度越大,說明其出現頻率越高。通過 SEO 綜合查詢得知,經過近一個月的優化,“彩鋼房防盜門”的關鍵詞百度排名由優化前的第八位上升到第七位,站內連結由優化前的 85 上升到 88,最近一週收錄優化前為49,優化後為 69( 如圖 2)。

三、結語

基於網路爬蟲的檢索原理,並以文安縣麗祥彩鋼防盜門廠網站優化為例,通過對該企業網站的網站導航、關鍵詞、網站內容、robots 協議、ALT 屬性、更新頻率、網站連結等關鍵要素的分析及優化設計,具體介紹並分析企業網站面向網路爬蟲的優化策略,並通過 SEO 綜合資訊檢測關鍵詞密度、連結數、收錄情況等,通過搜尋引擎效果檢測得知,該網站在進行優化後,取得了一定效果。

參考文獻

[1]趙茉莉 . 網路爬蟲系統的研究與實現[D]. 成都:電子科技大學,2013.

[2]張磊,鍾聯炯 技術研究與應用[J]. 電腦開發與應用,2010,(3):22-23.

[3]鄺楚文 . 基於關鍵詞策略的搜尋引擎優化[J]. 矽谷,2012,(6):1.

[4]王春豔,王雷。SEO策略研究[J].科技創新導報,2012,(2):49-50.

[5]徐曉力 及其策略研究[J]. 電腦知識與技術,2010,(9):24-25.