資料探勘在軟體工程技術中的應用畢業論文

才智咖 人氣:7.46K

摘要】計算機技術在發展,軟體也發展的越來越複雜,而系統開發工作也顯得更加重要。資訊科技的廣泛應用會產生大量資料,通過對資料進行挖掘,分析其存在的規律,對實現資料資源的有效利用意義重大。本文就資料探勘技術在軟體工程中的應用作簡要闡述。

資料探勘在軟體工程技術中的應用畢業論文

關鍵詞】資料探勘技術;軟體工程中;應用軟體技術

隨著資訊科技發展而快速發展,但是其可控性並不是特別強。軟體在應用過程中會產生大量資料,資料作為一種寶貴的資源,有效的利用可以帶來價值增值。作為軟體開發行業,資料探勘技術應用則實現了資料資源的有效利用,通過對其中規律進行研究,為軟體工程提供相應指導,並且對於系統故障能夠有效處理,成本評估的有效性也能夠提升。

1資料探勘技術應用存在的問題

1.1資訊資料自身存在的複雜性

軟體工程所包含的資料可以分為兩個類別,結構化與非結構化。在非結構化資料中軟體程式碼發揮著重要作用。而對結構化資料產生影響的則是軟體版本資訊。結構與非結構化資料二者之間聯絡非常密切。實現資料有效利用就需要通過一定技術找出其中的規律。資料探勘技術則剛好滿足需求。利用該技術對結構與非結構化資料進行整合,提升其使用的有效性。

1.2在評價標準方面缺乏一致性

資料探勘技術在生活中的應用比較廣泛,通過該技術應用能夠更好的對實際情況進行評價,從而對結果進行優化。但是由於沒有統一標準,導致了軟體資訊複雜。而在表述方式方面自身又存有差異性。資訊獲取者無法有效的對資訊進行應用及對比。而資訊缺乏統一標準的原因就在於評價方式不一致。

2資料探勘技術在軟體工程中的應用

2.1資料探勘執行記錄

執行記錄挖掘主要是對主程式的路徑進行分析,從而發現程式程式碼存有的相關關係。其實質是通過對相關執行路徑進行分析,並進行逆向建模,最終達到目的。作用在於驗證,維護,瞭解程式。記錄挖掘的過程通常是對被分析的系統進行初步插裝,之後是記錄過程,該過程在執行上一步程式後,對應用程式設計介面,系統,模組的狀態變數記錄,最後是對所得到的資訊進行約簡,過濾,聚類。最終得到的模型能夠表達系統的特徵。

2.2漏洞檢測

系統或是軟體自身都會存在漏洞,漏洞自身具一定的隱蔽性,由於人的思維存在某些盲區,無法發現漏洞的存在,就需要藉助於某些軟體。檢測漏洞的目的就在於找出軟體中存在的漏洞及錯誤,並對其進行修復,從而保證軟體質量與安全。將資料探勘技術應用於軟體檢測,首先要確定測試專案,結合到使用者需要,對測試內容進行規劃,從而確定測試方法,並制定出具體方案。測試工作環節主要是對資料進行清理與轉換,其基礎在於漏洞資料收集,通過對收集與採集的資訊進行清理,將與軟體資料有關聯同時存在缺陷的資料篩選出來,而將剩餘無資料清理,對丟失專案採取相應措施補充,將其屬性轉換為數值表示。之後是選擇適當的'模型進行訓練與驗證,該環節要結合到專案實際的需要選擇挖掘方式,通過對不同資料結果進行分析與比較找到最適合的方式。之後則是重複應用上述方法,對軟體存在的漏洞進行定位與檢測。並將與之對應的資料收集於軟體庫,在對漏洞進行描述的基礎上分類,最後將通過挖掘得到的知識應用到測試的專案中.

2.3開源軟體

對於開源軟體的管理由於其自身的開放,動態與全域性性,需要與傳統管理軟體進行區別對待,一般情況下,成熟的開源軟體對於軟體應用記錄較為完整,參與的內容包括了錯誤報告,開發者活動。參與開發的工作人員會處在動態變化之中,存在動態變化的原因就在於軟體的開放性。同時對於軟體中動態性特徵的挖掘,可達到對開源軟體進行優質管理的目標。

2.4版本控制資訊

為了保證參與專案人員所共同編輯內容的統一性,就需要對系統應用進行控制。軟體開發工程應用中,開發工作管理與保護都會通過版本控制系統來實施。並且其應用方式主要是對變更資料探勘,找出不同模組及系統存在關係,並對程式中可能會存在的漏洞進行檢測。此類技術的應用,使得系統後期維護成本被有效的降低,而對後期變更產生的漏洞也有一定的規避作用。

3資料探勘在軟體工程中的應用

3.1關聯法

該方法作用在於尋找資料中存在的相關聯絡與有趣關聯。而體現的關聯規則有兩個明顯的特徵。①支援度;②信度。前者表示在某個事物集中,兩個子集出現的概率是相同的。而後者則表明了某事物在事物集中出現的概率,而另一事物也會出現。

3.2分類方法

該方法主要是應用於分類標號與離散值的操作。該方法的操作步驟是,首先要建立相應的模型,對資料進行描述,並利用模型對其進行分類。在分類方法選擇方面,常用的有判定樹法,貝葉斯法,支援項量機法等。判定樹法應用的基礎是貪心演算法。

3.3聚類方法

該方法常用的有劃分方法,基於密度,模型,網格的方法與層次方法。聚類分析輸入的是一組有序對,有序對中的資料分別表示了樣本,相似度。其基本的應用理論是依據不同的物件資料予以應用。

4資料探勘在軟體工程中的應用

4.1對克隆程式碼的資料探勘

在軟體工程中最為原始的是對克隆程式碼的檢查測試。就其方式而言有文字對比為基礎,識別符號對比為基礎。前者是利用系統中程式程式碼包含的語句進行判斷。該方法在後期改進過程中主要是對字串匹配效率進行提升。實際應用過程中是通過相關函式匹配對效率進行優化。

4.2軟體資料檢索挖掘

該方法同樣是軟體工程中原始的挖掘需求之一。該方法在應用時主要有以下三個步驟。

①資料錄入。其實質是對需要檢索的資訊錄入,並結合到使用者需要在資料中查詢使用者需要的資料。

②資訊查詢過程。確認了使用者需要查詢的資訊後,系統將依據資訊內容在資料庫中進行查詢,並分類羅列。

③資訊資料匯出與檢視。使用者可以依據自身需要將資料匯出或者是線上檢視。資料在匯出時會形成相應的記錄,客戶再次進行查詢時就會更加的方便與快捷。而將資料匯出則需要利用到相關的軟體。

4.3應用於設計的三個階段

軟體工程有許多關於軟體的資料,資料通常是存放於程式碼庫中。資料運用可以提升工作效率。軟體工程每一次迴圈都會產生大量的資料。基於軟體工程生命週期可以將其分為分析設計,迭代的開發,維護應用三個階段。

4.4面向專案管理資料集的挖掘

軟體開發工作到目前已經是將多學科集中於一體。如經濟學,組織行為學,管理學等。對於軟體開發者而言,關注的重點除過技術方面革新外,同時也需要科學規範的管理。除過對於版本控制資訊挖掘外,還有人員組織關係挖掘。對於大規模的軟體開發工作而言,對人力資源的有效分配與協調也是軟體工作領域需要面對的問題。例如在大型系統開發過程中,往往會有許多人蔘與其中,人員之間需要進行溝通交流。交流方式包括了面對面溝通,文件傳遞,電子資訊等。通過對人員之間的關係進行挖掘,有利於管理工作開展。員工群體存在的網路是社會網路。通過人員合理組織與分配,將會影響到專案進度,成本,成功的可能性。而對該方面實施研究通常採用的是模擬建模。

5結束語

軟體工程技術在生活中許多領域都有廣泛的應用,資料探勘作為其中的一項技術,其重要性及作用隨著技術發展而表現的越加明顯。為了保證挖掘技術的可靠性與高效,與其它工程技術有一定融合性。資料探勘在實際應用工作中體現出了巨大的經濟效益,因此應該大力推進其應用的範圍,並拓展其應用的深度與層次。

參考文獻

[1]李紅蘭.試論資料探勘技術在軟體工程中的應用綜述[J].電腦知識與技術,2016(34).

[2]雷蕾.關於資料探勘技術在軟體工程中的應用綜述究[J].電子測試,2014(02).

[3]孫雲鵬.資料探勘技術在軟體工程中的應用綜述[J].中國新通訊,2015(15).