數(shù)據(jù)挖掘技術(shù)在軟件開(kāi)發(fā)信息管理中的應(yīng)用論文
文章通過(guò)介紹數(shù)據(jù)挖掘技術(shù)概述,分析軟件開(kāi)發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),對(duì)數(shù)據(jù)挖掘技術(shù)在軟件開(kāi)發(fā)信息管理中的應(yīng)用展開(kāi)探討,旨在為相關(guān)人員基于數(shù)據(jù)挖掘技術(shù)概述、軟件開(kāi)發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)的促進(jìn)軟件開(kāi)發(fā)信息管理有序開(kāi)展研究適用提供一些思路。
數(shù)據(jù)的挖掘是一項(xiàng)復(fù)雜的系統(tǒng)工程,其主要指的是在龐大數(shù)據(jù)中收集有價(jià)值信息數(shù)據(jù)的過(guò)程。對(duì)數(shù)據(jù)挖掘技術(shù)在軟件開(kāi)發(fā)信息管理中的應(yīng)用展開(kāi)研究,有著十分重要的現(xiàn)實(shí)意義。
1 數(shù)據(jù)挖掘技術(shù)概述
1.1 數(shù)據(jù)挖掘流程
通常而言,數(shù)據(jù)挖掘可劃分成四個(gè)階段,分別為選擇、預(yù)處理、挖掘以及吸收,如圖1所示。其中,選擇是就有著極強(qiáng)交互性的龐大數(shù)據(jù)而言的,在工作期間受信息數(shù)據(jù)不斷更新影響,通常要對(duì)數(shù)據(jù)展開(kāi)重新選擇;預(yù)處理則是將沒(méi)有得到加工的信息數(shù)據(jù)變換成適宜挖掘處理的形式;挖掘是經(jīng)由科學(xué)計(jì)算方法將預(yù)處理數(shù)據(jù)輸入系統(tǒng),在龐大數(shù)據(jù)中收集有價(jià)值的信息內(nèi)容,從而完成分類(lèi)、聚類(lèi)等工作;吸收也就是數(shù)據(jù)的后處理,其是為了將有價(jià)值的信息數(shù)據(jù)反饋給用戶,使數(shù)據(jù)預(yù)處理、挖掘環(huán)節(jié)具備真實(shí)意義。
1.2 數(shù)據(jù)挖掘技術(shù)
現(xiàn)階段,在軟件開(kāi)發(fā)中數(shù)據(jù)挖掘技術(shù)諸如分析、聚類(lèi)、預(yù)測(cè)及統(tǒng)計(jì)等已經(jīng)得到較好的'應(yīng)用,這些技術(shù)的應(yīng)用能夠使數(shù)據(jù)挖掘繁雜工程得到一定的簡(jiǎn)化,也就是在海量的數(shù)據(jù)中盡可能快的時(shí)間內(nèi)找出人們所需的信息,且對(duì)系統(tǒng)予以反饋供人們使用。在數(shù)據(jù)挖掘工程中,較為常見(jiàn)的技術(shù)包括關(guān)聯(lián)發(fā)現(xiàn)、分類(lèi)樹(shù)、課時(shí)數(shù)據(jù)挖掘等,同時(shí)還有一些較為特殊的數(shù)據(jù)挖掘技術(shù)包括回歸建模、統(tǒng)計(jì)分析等。在軟件開(kāi)發(fā)信息管理中應(yīng)當(dāng)對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行科學(xué)合理的選擇,以完成好軟件開(kāi)發(fā)信息管理工作。
2 軟件開(kāi)發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn)
2.1 軟件開(kāi)發(fā)數(shù)據(jù)較為復(fù)雜
現(xiàn)階段,軟件開(kāi)發(fā)數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)為主,前一種數(shù)據(jù)多牽涉軟件版本對(duì)應(yīng)信息及缺陷報(bào)告等,后一種數(shù)據(jù)主要涵蓋相關(guān)軟件代碼及文檔等。該兩方面數(shù)據(jù)無(wú)法使用同一種算法,然而它們相互又有著很大的相關(guān)性。換而言之,在數(shù)據(jù)挖掘算法開(kāi)發(fā)方面,為了盡可能權(quán)衡到兩方面數(shù)據(jù)的復(fù)雜關(guān)聯(lián),很大程度上提升數(shù)據(jù)挖掘難度。
2.2 分析手段并非傳統(tǒng)模式
軟件開(kāi)發(fā)數(shù)據(jù)挖掘后續(xù)工作是把取得的信息提供給需要的用戶。在以往數(shù)據(jù)挖掘應(yīng)用期間,就好比電子商務(wù)或者金融行業(yè),就是把信息轉(zhuǎn)化為文字或圖表。然而,軟件開(kāi)發(fā)人員所需信息并非如此簡(jiǎn)單,其還涉及了缺陷定位、編程模板等用戶信息,所以對(duì)數(shù)據(jù)挖掘技術(shù)提供較高的要求。
2.3 數(shù)據(jù)挖掘結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)不統(tǒng)一
現(xiàn)如今,數(shù)據(jù)挖掘技術(shù)在諸多行業(yè)得到普及推廣,同時(shí)在結(jié)果呈現(xiàn)及評(píng)價(jià)標(biāo)準(zhǔn)等內(nèi)容上相對(duì)完備。然而,在軟件開(kāi)發(fā)新型管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用卻并非如此。軟件開(kāi)發(fā)人員要獲取諸多、繁雜的信息,且信息表示方法各不相同,如此很大程度上提升了對(duì)數(shù)據(jù)挖掘結(jié)果展開(kāi)定量準(zhǔn)確分析的難度。
3 數(shù)據(jù)挖掘技術(shù)在軟件開(kāi)發(fā)信息管理中的應(yīng)用
在軟件開(kāi)發(fā)信息管理過(guò)程中,經(jīng)對(duì)數(shù)據(jù)挖掘技術(shù)科學(xué)合理應(yīng)用,可為軟件開(kāi)發(fā)帶來(lái)極有利的幫助,達(dá)到軟件開(kāi)發(fā)信息管理低成本、高質(zhì)量、短工期的要求,消除軟件開(kāi)發(fā)信息管理期間存在的一系列問(wèn)題。全面軟件開(kāi)發(fā)行業(yè)在時(shí)代發(fā)展新形勢(shì)下,要與時(shí)俱進(jìn),大力進(jìn)行改革創(chuàng)新,運(yùn)用先進(jìn)的科學(xué)技術(shù)不斷優(yōu)化數(shù)據(jù)挖掘技術(shù)研究。
3.1 數(shù)據(jù)挖掘技術(shù)在開(kāi)源軟件開(kāi)發(fā)中的應(yīng)用
開(kāi)源軟件,即源代碼為開(kāi)放的軟件,此類(lèi)軟件現(xiàn)階段大部分對(duì)用戶是不收取費(fèi)用的,也正是受此影響提升了開(kāi)源軟件控制管理難度,鑒于此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)來(lái)改善開(kāi)源軟件的資料。就好比,日本某高校學(xué)生推出了一個(gè)分布式數(shù)據(jù)挖掘系統(tǒng),該系統(tǒng)一方面可對(duì)大型系統(tǒng)開(kāi)展數(shù)據(jù)挖掘,一方面能夠一系列開(kāi)源軟件開(kāi)展數(shù)據(jù)挖掘。
3.2 數(shù)據(jù)挖掘技術(shù)在軟件項(xiàng)目管理中的應(yīng)用
軟件項(xiàng)目管理中數(shù)據(jù)挖掘多表現(xiàn)于兩個(gè)方面,一方面為對(duì)組織關(guān)系開(kāi)展的挖掘,一方面為對(duì)版本控制信息開(kāi)展的挖掘。軟件項(xiàng)目管理作為一個(gè)系統(tǒng)工程,對(duì)組織關(guān)系開(kāi)展挖掘主要是指對(duì)人力資源開(kāi)展協(xié)調(diào)分配。就好比,一個(gè)龐大工程可能同時(shí)有千百余人參與,在工程運(yùn)行期間人員相互會(huì)出現(xiàn)頻繁的信息數(shù)據(jù)交互,經(jīng)對(duì)數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,能夠?qū)θ藛T組織關(guān)系展開(kāi)合理劃分,積極促進(jìn)軟件項(xiàng)目管理的有序開(kāi)展。同時(shí),數(shù)據(jù)挖掘技術(shù)還可應(yīng)用于挖掘版本控制信息,能夠有效縮減系統(tǒng)維護(hù)成本,改善軟件項(xiàng)目管理水平。
3.3 數(shù)據(jù)挖掘技術(shù)在程序代碼及機(jī)構(gòu)中的應(yīng)用
在數(shù)據(jù)庫(kù)中收集有價(jià)值的代碼、構(gòu)件,現(xiàn)階段,較為常用的手段包括經(jīng)由關(guān)鍵詞開(kāi)展索引、經(jīng)由記錄輸入-輸出關(guān)系索引以及以建立交互關(guān)系圖為基礎(chǔ)的方法等,我們常常使用的百度、搜狗等搜索引擎均能夠開(kāi)展數(shù)據(jù)檢索。
4 結(jié)束語(yǔ)
總而言之,在軟件開(kāi)發(fā)信息管理過(guò)程中,經(jīng)對(duì)數(shù)據(jù)挖掘技術(shù)科學(xué)合理應(yīng)用,可為軟件開(kāi)發(fā)帶來(lái)極有利的幫助,達(dá)到軟件開(kāi)發(fā)信息管理低成本、高質(zhì)量、短工期的要求,消除軟件開(kāi)發(fā)信息管理期間存在的一系列問(wèn)題;诖耍嚓P(guān)人員務(wù)必要明確認(rèn)識(shí)軟件開(kāi)發(fā)信息管理數(shù)據(jù)挖掘面臨的挑戰(zhàn),不斷鉆研研究、總結(jié)經(jīng)驗(yàn),積極促進(jìn)軟件開(kāi)發(fā)信息管理有序開(kāi)展。
【數(shù)據(jù)挖掘技術(shù)在軟件開(kāi)發(fā)信息管理中的應(yīng)用論文】相關(guān)文章:
科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文10-21
數(shù)據(jù)挖掘在CRM中的應(yīng)用論文04-10
網(wǎng)絡(luò)營(yíng)銷(xiāo)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用論文07-07
高校管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用途徑論文10-28
數(shù)據(jù)挖掘在培訓(xùn)管理中的應(yīng)用論文07-02
在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)論文06-29
數(shù)據(jù)挖掘技術(shù)在科技期刊網(wǎng)站中的應(yīng)用論文11-04
數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情危機(jī)管理中的應(yīng)用論文10-20