行動通訊網路資料採集方法分析論文

才智咖 人氣:1.71W

摘要:移動網際網路是行動通訊與網際網路兩個概念結合的產物。目前行動通訊運營商3G、4G技術的發展以及Wifi覆蓋範圍的擴大也使得網速越來越快,使用者體服務需求體驗越來越迫切;想使用者之所想,急使用者之所急的商業競爭地位思維是需要大量使用者資料支撐並分析的前提。因此對使用者資料合理採集並不斷髮掘分析,才能滿足移動網際網路使用者日益增長的智慧化需求。

行動通訊網路資料採集方法分析論文

關鍵詞:行動通訊;WAP閘道器;使用者資料

1概述

目前行動通訊網路飛速發展,GSM、TD—SCDMA、CDMA2000以及WCDMA各制式無線網路基礎設施升級換代頻繁、核心網3G無線網路與核心網路與2G網路互相相容相容性,各地運營商根據實際需求考慮使用4G、3G與2G三大獨立的無線、接入、核心網路並存的局面。在全網同步引入HSDPA和HSUPA技術的同時,對2G核心網中對原有GPRS/EDGE網路升級改造。利用2G網路頻率範圍在890—960MHz的穿透性強的優勢,不僅減輕3G、4G基站的運維負擔,還可以彌補4G網路的覆蓋盲區。所以在行動通訊使用者資料採集時不能不考慮現存2G網路的豐富資料參考價值。隨著ISO和安卓系統的智慧手機的大眾化,曾經的GPRS技術裡資料經過WAP閘道器的處理逐漸弱化,使用者終端可接入行動網路經過GGSN閘道器連線網際網路並訪問其內容,2G網路GPRS資料業務和EDGE技術與WAP閘道器相連。2G時代,WAP無線協議網際網路無直接訪問功能,所以新增WAP閘道器是使用者上網。智慧手機之前的Symbian系統處理能力不及PC主機,無論是網速還是現實視訊、音訊、互動性媒體、釋出主題等等都與寬頻網際網路甚至光纖入戶的PC家用主機電腦無法匹敵,在2。5G時代,GSM通訊系統中的配套裝置模組中的WAP閘道器只能根據MS手機終端的應別能力進行通訊網與網際網路的交[1]。

2行動通訊網路資料

移動網際網路在2G/3G時代,核心網是兩個獨立的域,控制語音相關的叫電路域(CS域:CircuitSwitch),控制資料業務相關的叫分組域(PS域:PacketSwitch)。相應的.,與語音相關的控制都放在了電路域,比如上面的語音呼叫建立、返回振鈴、判斷並執行來電轉駁,業務簡訊等等。與資料相關的控制則放在了分組域,比如上面的與因特網伺服器(通訊網與因特網是兩張網)建立資料連線、區分當前流量是微信還是微博等等。自2G時代以來WAP閘道器是承載移動資料業務的網元。

2。1使用者資料

行動通訊的空間自由度與網際網路的內容形式豐富結合處移動網際網路的新品種。目前行動通訊運營商3G、4G技術的發展以及Wifi覆蓋範圍的擴大也使得網速越來越快,使用者體服務需求驗越來越迫切;使用者資料分為兩種:一種是使用者註冊資訊將自己的身份識別與手機號碼相關聯,在資訊層面上存入資料庫,咋資料層面上存入HLR中為通訊系統的呼叫、定址、和計費分配通道等工作提供服務;另一種是指通過無線基站近乎於log日誌的形式,使使用者主觀意願被動或不知情的前提下在系統儲存裝置上記錄使用者位置更新,小區切換,小區重選等為使用者提供的行動通訊服務功能。這類資料的產生不由使用者的主觀意願為選擇,是為了完成一次通訊系統使用者漫遊的一個必要手段和環節,但是在資料分析挖掘研究者看來,是有著非常意義的資料內容,通過資料的資料清洗:去重、去噪聲、去錯誤、插值等異常處理;資料整合:統一單位、去掉冗餘、選擇感興趣屬性列;資料變換:數值歸一化、離散化處理;資料脫敏:去隱私化,截斷與加密;資料演繹:特徵構造,根據原有的一個或多個特徵創建出新的特徵並填充。獲得群體使用者的地理位置特徵,在不同時段的移動基站下的人流密度,繪製出人口出行交通時段的密度視覺化圖等等,通過對使用者資料不斷髮掘分析,才能滿足移動網際網路使用者日益增長的智慧化需求。

2。2資料分析

在3。5G的LTE網路體系架構中,WAP/Web閘道器處在PGW後與外網互通,功能等同於PDSN,其餘介面並沒有什麼功能變化。經過BTS(基站)、傳輸裝置、BSCRNC等至PDSN(分組資料支援節點),在2G網路中發至WAP閘道器的資料分流發至智慧裝置;由裝置開啟使用者TCP連線,解析主機的URL使用者請求、判斷、處理,經過鑑權處理合法使用者,允許通過防火牆轉達請求接至網際網路提供鏈路連線分配IP地址提供服務,如果是欠費或非法使用者拒絕原服務請求。從移動網際網路的智慧手機應用端的使用業務流量角度來分析,使用者通過終端經過移動網際網路接入Internet網路不同的APP有不同的流量特徵,例如連線應用程式:電子郵件、即時通訊、GPS導航、遠端訪問;商業應用程式:移動銀行服務、股市跟蹤與交易、檔案處理及日程規劃;日常生活類應用程式:電子商務、賬單支付、健康監測、數字閱讀與社交;娛樂應用程式:新聞、遊戲、多媒體播放器、照片及視訊編輯器。

3研究方法

3。1資料流收集器

部署於SGSN和GGSN之間,並且不僅僅行動電話產生的流量會被記錄,上網絡卡所產生的流量也會被記錄。流量記錄中包含了時間、手機號、伺服器IP、資料傳輸大小、資料型別等資訊。本課題根據這些資訊建立了流量權值圖(簡稱流量圖)。其中,手機號和伺服器IP分別對應流量圖中的不同節點,手機號向伺服器IP的資料傳輸代表了流量圖的邊,從伺服器—IP到手機號是流量圖中對應邊的方向,資料傳輸大小代表了流量圖中邊的權值。通過上述對應方法,為不同型別的流量資料建立了各自的流量圖。並在流量圖的基礎上,對網路流量傳輸資料進行了分析。

3。2技術路線

SGSN與無線分組控制器之間同過Gb口連線,實現移動資料的管理;與歸屬位置暫存器通過Gr口連線,實現對使用者資料庫的訪問控制;與GGSN通過Gn口連線,進行IP資料包的傳輸以及協議變換。本文通過部署Gb介面(SGSN與BSS之間)的PC端擷取資料流之後,用網路爬蟲軟體對資料進行初步的收集。Gb介面是傳遞轉達SGSN和BSC之問的信令和使用者資料的功能。使用者通過移動終端將請求發給BTS,再通過基站子系統連線傳輸網路,Gb介面是終端入網的必經介面。本文是從Gb介面攔截移動網際網路產生的資料,並對資料盡情分類,聚類等資料探勘方面的研究[2]。原始資料由Gb介面得到,進行深層次的分析,不僅能夠實時地瞭解當前的網路質量,還能發現移動使用者的網路行為。以SGSN作為研究物件,GPRS是GPRS服務節點(ServiceGPRSSupportNode)是行動通訊核心網的重要組成部分,也是分組交換的核心部分。研宄流經具體SGSN的網路業務流量、接入使用者數以及訪問記錄數的情況,以此來表徵網路中具體節點的業務情況[3]。

4結語

當前的三代移動通訊系統(2G3G4G)並存的移動網際網路環境中,移動網際網路流量中雖然WAP流量不能構成主流的移動使用者流量的主要組成部分,原有的WAP內容正逐漸被WEB內容所代替。本文所研究在移動網際網路環境下,關於個人使用者資料隱私保護的資料探勘相關問題。採取從基礎的移動網際網路機制下的顯示存在的“混搭”網路為資料研究出發點,深入分析地研究不同代移動通訊系統所組成的網路中產生的網際網路使用者資料。針對每個個人為基本單位內容,採用“理論建模→方法論證→實驗認證”的研究方法。隨著移動資料接入的蓬勃發展,WAP閘道器面臨著各種問題。但是作為資料分析方,需要的是廣而全的資料,資料探勘使用者行為不是僅僅需要少數服從多數的統計,無論是Symbian系統的MS移動終端使用GPRS技術通過WAP閘道器訪問WML語言編寫的網站,還是早已去電路域依靠軟交換全網IP化實現核心網部分的閘道器轉接傳遞,每一個bit流量都代表這一個使用者一個群體的價值與意義。所以現網並存的三代移動通訊系統的資料全面採集的多樣性,才能展現其內在隱藏的特徵,才是正確的得到資料揭示真理的第一步。

參考文獻

[1]王璐。移動網際網路使用者行為分析[D]。重慶:重慶郵電大學,2013:86。

[2]趙其朋。WAP閘道器應對移動網際網路大流量的改造及演進[J]。廣州:行動通訊,2014:16。

[3]李威。移動網際網路使用者行為分析研究[D]。北京:北京郵電大學2012:82。

TAGS:論文 通訊