網路資訊審計的現狀趨勢論文

才智咖人氣：2.44W

摘要：網路資訊內容審計是針對當前網路中出現的不良資訊或圖片傳播的問題，通過網路資料包獲取、資訊處理以及不良流量阻斷等多種技術來實現對於網路資訊內容的全面的控制。本文根據從主到次的思路，從底層到高層的角度來研究和論述網路資訊審計的內容。

關鍵詞：內容審計;社會網路熱點;審計評估

引言

隨著網路資訊的日益豐富，很多的不良內容在網路上出現已經成為亟待解決的社會問題，用什麼樣的手段來保證網路資訊的合法性與健康性已經成為了網路研究領域中的最新熱點，而隨之而來的是越來越高的關注度。本文試圖對內容審計所涉及的關鍵性技術進行論述，並且從中挖掘當今網路情況的研究熱點與難點，為以後內容審計技術研究奠定相關基礎。

一、審計關鍵技術

(1)模式匹配演算法

審計系統需要通過多種模式精確的匹配以及多種模式匹配演算法搜尋資料包中是不是存在敏感模式串，並且從中統計出其頻率，以便於支援文字內容的分析。

內容審計中的多種模式匹配有很多的特點：首先是在網路環境處於中英文混合的情況下，由於其編碼的原因，導致其資料包中會有相關的部分通常是英文字元，而與內容相關的則是中文字元，並且兩者會參雜其中。而就中文而言，因為漢字的簡繁體導致文中會包含兩種或兩種以上的編碼字元。其次是釋出不良資訊的人會在資訊中刻意加入干擾字元。除此之外，因為中英文存在著較大的明顯差異，例如英文的字母表小，字元較長，而中文則是大字符集語言，且字母表的數量也較為龐大，這些存在在其中的差異就造成了中英文混合環境下內容審計的模式匹配演算法也會發生變化。

如果涉及到中文的多種模式相似匹配就會變得愈發的複雜。已存在的多種模式相似匹配演算法允許在其模式串中隨意的加入字元，但是如果一箇中文字元就不允許插入任何字元了，在包含了n箇中文字元的字串中只存在n個禁止插入的位置，所以在中英文混合的網路環境中，多種模式相似匹配演算法就會導致錯誤的匹配結果。一種適合於中英文混合環境的多種模式相似匹配演算法就應該把所有的模式串轉換成很多個有限的自動機並且能夠利用模式串構建新狀態的驅動器，從而可以用待匹配的字元來驅動狀態驅動器，再由驅動器轉到每一個有限自動機。

(2)文字內容分析技術

本文的內容分析在審計過程中被用作深度識別的可質疑文字，與此同時也會發現當前的資訊流中存在的熱點資訊。本文的內容分析技術基本上以詞語為最初元素，構建了基礎表示模型，並且分析文字相似度分類等方式來確定其中的部分屬性。

而對於中文的詞語之間是不存在明確的隔斷標誌的，所以就需要做出分詞的處理。當前最常見的中文分詞的方法就是機械分詞方法以及知識分詞方法。前者是要求跟字典相匹配的，從而利用語法的規則來進行詞語的校正。而本文則會用機械分詞方法的形式來具體的描述模型，而模型就可以描述機械分詞法所能夠採取的演算法策略。而後者不僅僅要通過字典的匹配，並且要利用多方面的知識，同時還要通過人工智慧技術的分析推理來進行校正。

二、審計結果評估與處理

審計過程會根據審計結果對一定時間內的內容進行評估和預測，在特定時候則需要同網路安全防火牆進行聯動合作，實施線上攔截等多項防護措施，並且要向網路管理者提交需要制定的內容的安全審計的報告。

(1)內容安全態勢評估與預測

通過分析得出一定週期內的分析審計結果，對於目前的網路資訊內容的安全的情況進行仔細評估，並且對於未來的情況作出預測，得以實現對於不良資訊內容的.大範圍擴散的有利控制，一方面可以根據其嚴重程度來制定相應的應對措施以達到遏制其發展的目的;另一方面可以估算已有措施的有效程度，以方便以後的措施實施。

而從其本質上講，網路內容的安全問題也是使用者對於社會上的熱點資訊關注程度的體現。針對這樣的情況，研究者首先要根據傳染病模型和流言模型來建立關注熱點的不良資訊關注規模與趨勢的預測模型;其次要根據使用者關注熱點不良資訊的行為情況來研究相應的預測模型。

(2)線上處理與阻斷

如果出現違反安全策略的資訊，審計系統可以根據其情況採取相應的線上處理措施，有一部分的措施是在審計系統的內部就能夠完成;另一部分就要與安全防火牆聯動合作完成。

而在審計系統中線上攔截技術是最具有難度實現的。首先，對於資料包的準確性判定具有很大的難度，滿足什麼樣的條件才能被稱為是惡意資料包，這個標準很難界定。其次是線上攔截對於網路的流量的依賴是相當大的，因此會出現網路資料傳輸效率下降的現象出現，從而嚴重的影響了正常流量的使用。所以一般情況下，只有網路安全情況及其糟糕的時候才會採取線上攔截的手段。

三、審計研究的優勢與劣勢

(1)流媒體視訊內容審計

流傳的網路視訊的特點是其內容豐富，給人以感觀上的強烈衝擊，這也將成為不良資訊在網路上傳播的方式之一。怎樣做到準確且及時地識別出此類視訊且能夠在第一時間做出有效的管理措施就成為了目前亟待解決的問題。現存的識別方法大部分是要提取完整的視訊幀影象，繼而採取有效的識別方式來對其進行檢測。這樣的方法無論是從哪個角度都不能滿足內容審計的現狀需求。

(2)動態資訊流的特徵分析

不良資訊在網路中的傳播表面上看是沒有任何的規律可循，但是仔細研究就可以摸索到它的傳播是具有一定的規律性的，尤其是相對熱門的資訊。在具體研究的過程中，從核心內容及其傳播途徑入手，通過對熱點資訊的開始、傳播到擴散整個過程的研究，從中找尋其表現出來的特有的關鍵點，從而挖掘隱藏在其中的資訊流。

(3)關鍵詞列表動態更新

在現存的內容審計模式中，大部分都是要人工建立其關鍵詞表，從而將資料包中的內容與關鍵詞相匹配，以此來查詢可疑的資料包。一個全面的、客觀的並且可以及時更新的關鍵詞表是很難建立起來的，這也會導致傳統的處理方式其侷限性加大。尤其是在當今社會知識爆炸的大背景下，網路上出現的新興的詞彙會越來越多，而且這些熱點的詞彙也會關聯相當多的具有輿論價值的網路內容。所以，一定要通過特有的技術手段來跟蹤這些網路詞彙的出現以及其發展動態。

(4)主動式內容傳播檢測

現在使用的內容審計的常見模式就只是被動地接受檢測，無法進行整體的跟蹤監控，對於網路上傳播的不良資訊缺乏有力地控制手段。因此，實現主動地不良資訊的檢測就成為了首要解決的問題。首先可以假裝成不良資訊的獲取者或者傳播者，繼而瞭解其相關的特徵屬性，進而追根溯源發展釋出不良資訊的網站並且進入到其下載任務當中，從中獲取其網路使用者的規模以及其IP地址的大致分佈，就可以實現對於不良資訊傳播與擴散的全程的跟蹤與監控。

四、總結

網際網路網路已經逐漸地成為資訊交流過程中不可或缺的重要平臺，而控制網路上不良資訊的釋出及傳播已經成為了具有重要現實意義的研究課題。而網路資訊的內容的審計也將運用多種技術在網路的熱點處收集齊資料包，對於其所擴散出來的內容進行檢測審計與分析，從而實現對於網路資訊內容的全域性控制。

參考文獻：

[1]張秀英，王錚.一種基於流量識別技術的網路資訊審計模型[J].微處理機，2010，01：41-44.

[2]周聚.基於網路資訊審計的文字過濾的研究與實現[D].蘇州大學，2010.

[3]廖明濤，張德運，李金庫. 基於網路處理器的網路資訊審計系統[J].計算機工程，2007，19：140-142.

[4]許康，宋力，劉遇哲演算法在網路資訊審計系統中的改進研究[J].計算機與網路，2015，09：39-41.

[5]朱瑞，趙亮.基於內容的網路安全資訊審計系統研究[J].電力資訊化，2008，11：36-39.

[6]陶蕓輝.網路資訊內容審計研究的現狀分析[J].商業文化(上半月)，2011，12：337-338.

[7]李冰桐.網路資訊環境下的審計問題研究[J].現代經濟資訊，2013， 09：189-190.

[8]謝凌萍.淺談網路資訊在國家審計監督中的作用[J].行政事業資產與財務，2014，24：91-92.

TAGS：審計論文