資料探勘技術對軟體工程的應用論文

才智咖 人氣:1.49W

摘要:我們如今的生活會遇到大量的資訊,一方面人們隨時隨地可以查閱相關資訊但是另一方面不利於人們來進行分門別類和快速的獲得主要資訊,資料探勘技術的使用使人們能夠段時間內完成資訊的處理。本文首先介紹了資料探勘技術的含義和包括的方法,然後闡釋了資料探勘技術的應用情況並對它面臨的問題進行了分析。

資料探勘技術對軟體工程的應用論文

【關鍵詞】資料探勘技術;軟體工程;應用

社會的發展使得技術也得到了快速發展,資訊科技營運而生,並且被人們廣泛的應用於機械、醫療、化工和教育等領域,發揮著越來越重要的作用。在當前社會的發展背景下,資訊科技中的軟體工程雖然發展規模不斷擴大,但是在技術上已經不能滿足對資源管理的要求,而資料探勘技術的到來彌補了軟體軟體工程的不足,促進了軟體工程的進一步發展

1資料探勘技術的簡介

1.1資料探勘技術的含義

所謂資料探勘,主要指的是在大量的資料資訊中利用科學、有效的演算法第一時間獲取到有用資訊的篩選過程。大量的資訊存在於生產和生活領域,使得人們在處理事情是無從下手,這樣大大降低了人們的工作效率,也浪費了工作人員寶貴的時間。而這一問題通過資料探勘技術的使用得到了很好的解決

1.2資料探勘技術所採用的方法

在具體的操作中,資料探勘技術會通過很多方法來使任務得以完成。具體的方法有如下幾種:1.2.1遺傳演算法的使用所謂遺傳演算法,主要是指基於生物自然選擇與遺傳激勵的隨機搜尋演算法,也是資料探勘技術常用的一種操作方法。遺傳演算法的有點就在於表面上看似無聯絡的事物,卻能在事物模型間建立相關的練習,實現事物之間共同發展,現在生物界越來越重視的遺傳基因等的研究,所以這種方法很受人們的歡迎。1.2.2採用決策樹方法這種方法主要用於對資訊的分類和整合,在遇到大量的資訊的時候,能夠在短時間內找出關鍵的資訊,能夠使資訊分類的快速化和簡單化,並且保證了資訊分類的準確度,但是此方法的不足之處就在於具有較差的抗噪效能,不能全面的來表述較為複雜的概念。1.2.3採用統計分析法往往會利用迴歸分析和主成分分析等方法來分析資料庫欄位之間的關係。在欄位之間的關係包括相關關係,函式關係也是其中的一種,不同的是函式關係可以用公式來表示,而相關關係則不能通過公示來表示關係,系統分析法的使用為這種關係的分析提供了便利。1.2.4採用視覺化技術視覺化技術是採用一些圖表來對資料進行表現,便於對資料的理解,比如,使用簡單圖形來展示存在於資料庫中的多個數據,使研究者看起來一目瞭然,使單調的資料形象化,更容易掌握資料的相關資訊。1.2.5採用神經網路方法它模擬人腦神經元結構,以MP模型和Hebb學習規則為基礎,用神經網路連線的權值表示知識,其學習體現在神經網路權值的逐步計算上。前饋式網路、反饋式網路和自組織網路是常用的三種神經網路模型,分別用於預測、聯想記憶和聚類等。

2軟體工程中資料探勘技術的應用表現

2.1用於軟體專案管理方面

軟體專案的管理呈現出複雜化和系統化的特點,資料探勘技術應用於軟體專案管理一方面表現在對組織關係的挖掘,比如公司舉辦年會等大型活動,在人員的分配上如果處理不好,就會出現混亂的局面,為了實現人力資源的合理配製,往往採用資料探勘技術來區分每個職員的職責,實現專案管理的有序化,提高了辦事效率;軟體專案管理中使用資料探勘技術的另一個方面就是挖掘版本控制資訊,在此係統面臨外系統入侵時提出警告是資料探勘技術所具備的功能之一,除此之外資料探勘技術可以檢測該系統的修復情況,版本控制資訊的作用就是方便了人們對版本資訊的檢視,而資料探勘技術的使用為系統的安全執行提供了更有利的保障,使得軟體專案的管理水平逐步提高。

2.2漏洞的檢測時資料探勘技術的使用

當資料探勘技術用於檢測軟體的漏洞時,第一步要弄清楚要檢測什麼樣的軟體,第二步就是要制定合理的計劃,計劃的目的是為了更好的對軟體進行檢測,不同軟體的構成和性質決定了檢測要採用不同的方式,緊接著就是對漏洞庫中的資料進行整理,對於不需要的資料進行清除,除此之外對於丟失的專案要採取措施補救回來,用數值表示來代替資料屬性。另外,要對合適的資料模型進行驗證,不同的專案會採取不同的方法,重要的是選擇合適的發掘方式來使其形成測試集,進而可以對全部的結果進行比較,通過比較找出最滿意的方式,資料探勘技術的應用不見可以檢測漏洞還可以對未知的漏洞進行防護,並且把漏洞的`種類進行分析,整合出修復的方法,能使的在第一時間找出漏洞並進行修復,使得軟體能夠保持良好的效能,使其執行速度不至於減慢。

2.3挖掘程式程式碼和結構中資料探勘技術的使用

在挖掘程式程式碼和結構方面比較常用的一種資料探勘方法就是克隆程式碼檢測法,該方法分為度量、文字對比、程式結構和識別符號對比這四種方法,四種方法各有各自的特點,具體的運用中需要考慮實際情況來確定到底使用那種方法。克隆程式碼檢測通常會複製貼上某一個程式碼,在特殊的要求下,會根據需求來改正某些程式碼,檢測這些程式碼主要是為了防止大面積出現故障,維護系統的安全,為軟體執行提供一個可靠的環境。另一個常見的就是Aspect的挖掘,Aspect的挖掘就是常見說的橫切關注點挖掘。軟體工程中面向方面軟體的改造需要解決好Aspect的挖掘,雖然可以採用大量的方式來解決這個問題,但是最重要的方法之一就是度量分析法。

3資料探勘技術在具體的使用中面臨的問題

3.1資料複雜化

目前的軟體工程資料主要包括結構化和非結構化兩類資料。非結構化資料包括軟體程式碼,結構化資料則跟軟體的版本資訊有關,非結構化資料和結構化資料之間聯絡密切,因此在使用資料探勘技術的時候,要對著兩種資料的關係進行考慮,這就增加了挖掘技術使用的難度。

3.2評價標準不一致

生產生活中很多領域都在使用資料探勘技術,在使用後對它的結果也採取了一定的評價方法,但是往往這些方法不能一致,在軟體工程中也很難統一評價標準,因為在軟體工程中出現的資訊一般比較複雜,而且往往通過不同的方法來表達,所以獲取者在進行資訊比較時候,面臨很大的苦難,所以導致不能準確的對資料探勘結果進行分析。

4結論

總而言之,時代的發展越來越離不開資料探勘技術的使用,這項技術很大程度上滿足了人們的需求,受到越來越多的重視,經過本文的論述之後,可以得知資料探勘技術不僅使軟體工程更加完善,而且使人們學會用新的方式來獲得資訊,雖然書籍挖掘技術在實際的應用中會因為軟體專案的資料複雜等原因會面臨一些挑戰,但是科技也在不斷進步,相信未來,資料探勘技術會得到更廣泛的應用。

參考文獻

[1]陳建樺.資料探勘技術在軟體工程中的應用研究[J].矽谷,2014(01):11-12.

[2]姚文濤.試論軟體工程中資料探勘技術的應用[J].河南科技,2014(23):45-46.

[3]雷蕾.關於資料探勘技術在軟體工程中的應用綜述[J].電子測試,2014(02):19-20.