男人天堂日韩,中文字幕18页,天天伊人网,成人性生交大片免费视频

知識(shí)依賴度約簡(jiǎn)的論文

時(shí)間:2021-06-11 19:18:41 論文 我要投稿
  • 相關(guān)推薦

關(guān)于知識(shí)依賴度約簡(jiǎn)的論文

  基于知識(shí)依賴度約簡(jiǎn)的知識(shí)發(fā)現(xiàn)研究

關(guān)于知識(shí)依賴度約簡(jiǎn)的論文

  摘要:粗糙集理論中的屬性約簡(jiǎn)問題屬于NP難問題。以教育技術(shù)學(xué)專業(yè)讀者2013學(xué)年度圖書借閱歷史數(shù)據(jù)為原型,采用借閱類目的次數(shù)多少作為屬性重要度進(jìn)行啟發(fā)式選擇,利用粗糙集理論中的知識(shí)依賴度對(duì)類目約簡(jiǎn),挖掘出本專業(yè)和各年級(jí)借閱類目的核心集,并經(jīng)問卷調(diào)查證明其規(guī)律的正確性。通過與教育技術(shù)學(xué)專業(yè)學(xué)科知識(shí)體系結(jié)構(gòu)的比較,能夠發(fā)現(xiàn)學(xué)科知識(shí)體系結(jié)構(gòu)建設(shè)的不足之處,以促進(jìn)其更科學(xué)完善。

  關(guān)鍵詞:粗糙集;知識(shí)依賴度;數(shù)據(jù)挖掘;知識(shí)發(fā)現(xiàn)

  0 引言

  高校圖書館自動(dòng)化建設(shè)經(jīng)過多年發(fā)展,已經(jīng)積累了大量歷史數(shù)據(jù),這些數(shù)據(jù)不但完整,而且質(zhì)量高,充分反映了讀者學(xué)習(xí)成長(zhǎng)的過程。如何對(duì)其進(jìn)行挖掘提煉并從中發(fā)現(xiàn)有價(jià)值的知識(shí),是了解讀者需要、開展知識(shí)推送服務(wù)的重要信息來源。前人研究主要是根據(jù)讀者的借閱歷史數(shù)據(jù),利用關(guān)聯(lián)規(guī)則算法發(fā)現(xiàn)某類書籍之間的關(guān)聯(lián)規(guī)則[14],或利用聚類算法挖掘具有共同閱讀興趣的讀者群體[5],以及通過時(shí)間流分析得到讀者借閱時(shí)間的分布規(guī)律[6]等。

  也可以利用粗糙集進(jìn)行挖掘。例如,柳炳祥等[7]只是介紹有關(guān)理論,文章中并沒有對(duì)粗造集挖掘進(jìn)行深入闡述。這些挖掘結(jié)果往往只是反映讀者已往的借閱規(guī)律,而不能反映其當(dāng)前和今后一段時(shí)間的真實(shí)需要,因?yàn)檫@些讀者還需要不斷地進(jìn)行知識(shí)更新和深化學(xué)習(xí)。本文通過對(duì)教育技術(shù)學(xué)專業(yè)讀者群進(jìn)行數(shù)據(jù)挖掘,利用知識(shí)依賴度約簡(jiǎn)方法發(fā)現(xiàn)其學(xué)科知識(shí)體系結(jié)構(gòu),并通過與相關(guān)專業(yè)的知識(shí)體系結(jié)構(gòu)建設(shè)進(jìn)行比較,以發(fā)現(xiàn)建設(shè)中的不足之處。如果利用所得的知識(shí)庫(kù)進(jìn)行推送服務(wù),則能把讀者真正需要的知識(shí)推送給他們。

  1 粗造集有關(guān)理論

  粗糙集理論認(rèn)為“知識(shí)是一種對(duì)對(duì)象進(jìn)行分類的能力”,它將分類理解為在特定空間上的等價(jià)關(guān)系,而等價(jià)關(guān)系構(gòu)成了對(duì)該空間的劃分[8]。

  定義1(論域、知識(shí)):設(shè)U 是感興趣的對(duì)象組成的非空有限集合,稱為一個(gè)論域。論域U 上的任一子集XU,稱為論域U 的一個(gè)概念或范疇。論域U 中的任何子集簇(概念簇)稱為關(guān)于U 的抽象知識(shí),簡(jiǎn)稱知識(shí)[9]。在二維表中,知識(shí)是由某些列對(duì)所有行的劃分構(gòu)成的集合所表示。

  定義2(知識(shí)庫(kù)):給定一個(gè)論域U 和U上的一簇等價(jià)關(guān)系S,稱二元組K=(U,S)是關(guān)于論域U 的一個(gè)知識(shí)庫(kù)或近似空間。因此,論域上的等價(jià)關(guān)系即代表著劃分和知識(shí)。這樣,知識(shí)庫(kù)就表示了論域上由等價(jià)關(guān)系導(dǎo)出的各種知識(shí),即劃分或分類模式,同時(shí)代表了對(duì)論域的分類能力,并隱含著知識(shí)庫(kù)中概念之間存在的各種關(guān)系[9]。

  定義3(不可分辨關(guān)系):給定一個(gè)論域U 和U上的一簇等價(jià)關(guān)系S,若PS,且P≠,則∩P(P中所有等價(jià)關(guān)系的交集)仍然是論域U 上的一個(gè)等價(jià)關(guān)系,稱為P上的一個(gè)不可分辨關(guān)系,記作IND(P)。IND(P)的等價(jià)類稱為知識(shí)P的基本范疇[9]。

  2 知識(shí)發(fā)現(xiàn)

  2.1 樣本數(shù)據(jù)選取

  2.2 數(shù)據(jù)預(yù)處理

  在進(jìn)行數(shù)據(jù)挖掘之前,需要對(duì)數(shù)據(jù)進(jìn)行去噪、補(bǔ)缺和轉(zhuǎn)換等預(yù)處理操作。數(shù)據(jù)預(yù)處理步驟如下:①根據(jù)年級(jí)、專業(yè)代碼和時(shí)間段獲取讀者借閱歷史記錄,并通過匯總獲得借閱圖書的人數(shù)、未借閱人數(shù)和總借閱冊(cè)數(shù);②去除借閱書目的.種次號(hào),得到借閱類目,匯總后得到借閱類目數(shù)。由于中圖法是通過標(biāo)記符號(hào)代表各級(jí)類目和固定先后次序的分類體系,標(biāo)記符號(hào)不同,其表示的知識(shí)類目也不同,故不能把相近類目合并為一類;③按類目進(jìn)行匯總,求得各類目借閱冊(cè)數(shù)和所有類目的平均借閱冊(cè)數(shù),并刪除低于平均借閱冊(cè)數(shù)的類目,因?yàn)槠浔憩F(xiàn)的只是某個(gè)學(xué)生的個(gè)人愛好,不是大家共同學(xué)習(xí)的知識(shí),相當(dāng)于噪音數(shù)據(jù);④求出借過大于平均借閱冊(cè)數(shù)類目的所有讀者,這些讀者即是進(jìn)行知識(shí)約簡(jiǎn)的對(duì)象;⑤生成上述讀者對(duì)象和其借閱類目的二維表,并對(duì)表中數(shù)據(jù)進(jìn)行轉(zhuǎn)換處理,如果此讀者借過該類目書籍則為1,否則為0。類目列按類目總借閱冊(cè)數(shù)降序添加到表中。

  2.3 知識(shí)約簡(jiǎn)

  經(jīng)過上面的數(shù)據(jù)預(yù)處理后,得到了知識(shí)庫(kù)的關(guān)系簇S 和論域U,即不小于平均借閱冊(cè)數(shù)的類目和借閱這些類目的讀者。然而,即使經(jīng)過上述預(yù)處理后,其約簡(jiǎn)的類目數(shù)還有幾十種;如果直接利用知識(shí)依賴度(定義5)來約簡(jiǎn),其需要計(jì)算的次數(shù)為M*logM*2n(M是讀者數(shù),n是類目數(shù)),這是指數(shù)級(jí)時(shí)間復(fù)雜度,需要消耗大量計(jì)算時(shí)間。為了得到多項(xiàng)式時(shí)間算法,采用以類目借閱的冊(cè)數(shù)多少作為屬性重要度的啟發(fā)式策略,應(yīng)用知識(shí)依賴度來約簡(jiǎn)二維表,具體算法如下:

 。1)置K={},R={};// K表示約簡(jiǎn)后得到的知識(shí),R表示臨時(shí)約簡(jiǎn)知識(shí)

  //如果單個(gè)知識(shí)把論域全覆蓋則作為約簡(jiǎn)知識(shí)放入K中

  (2)For r0=1 to count(類目) do

  取出count(r0)類目I,計(jì)算其劃分。

  如果I全覆蓋論域U ,則把I并入K中;否則,退出循環(huán)。

 。3)把I并入R中。

  //計(jì)算剩下的類目依賴關(guān)系 (4)For r1=r0+1 to count(類目) do

  取出count(r1)類目Q,根據(jù)類目Q求其對(duì)論域U 的劃分。

  根據(jù)R中的知識(shí)求其對(duì)論域U 的劃分。

  利用知識(shí)依賴度公式,求Q對(duì)R的知識(shí)依賴度γ;如果γ小于0.5,則把Q并入R中,否則認(rèn)為知識(shí)Q歸屬于R而被約簡(jiǎn)掉。

  (5)K=K∪R,并退出。 //即K就是所求的約簡(jiǎn)集合

  2.4 結(jié)果分析

  因此,通過對(duì)相關(guān)數(shù)據(jù)的分析,給出如下建議:①給大一、大二學(xué)生適當(dāng)介紹本學(xué)科知識(shí)體系結(jié)構(gòu),使其開始就明確學(xué)習(xí)目標(biāo)、方向和內(nèi)容組成;②通過與教育學(xué)院教師交流發(fā)現(xiàn),學(xué)院已開設(shè)《學(xué)科導(dǎo)論》課程,但效果不夠理想。因此,對(duì)于開設(shè)《學(xué)科導(dǎo)論》課的院系,需要扎實(shí)推進(jìn)本導(dǎo)制,發(fā)揮其引導(dǎo)作用;③深入研究小說等文學(xué)類與教育技術(shù)學(xué)專業(yè)之間的內(nèi)在關(guān)系,將其納入學(xué)科體系結(jié)構(gòu)中,完善學(xué)科知識(shí)體系結(jié)構(gòu)建設(shè);④在低年級(jí)中適當(dāng)開設(shè)“TP393.092 網(wǎng)絡(luò)瀏覽器”課程,做好相關(guān)理論基礎(chǔ)知識(shí)鋪墊,使學(xué)科知識(shí)結(jié)構(gòu)布局更加合理。

  3 知識(shí)驗(yàn)證

  4 結(jié)語

  本文利用粗糙集理論中的知識(shí)依賴度約簡(jiǎn)方法對(duì)某專業(yè)讀者群借閱歷史數(shù)據(jù)進(jìn)行挖掘,獲得其學(xué)科體系結(jié)構(gòu)知識(shí),并通過比較,發(fā)現(xiàn)相應(yīng)學(xué)科體系結(jié)構(gòu)建設(shè)中的不足之處,促使學(xué)科結(jié)構(gòu)體系建設(shè)更加合理、完善。如果利用所得的知識(shí)進(jìn)行推送服務(wù),則能夠根據(jù)學(xué)生知識(shí)結(jié)構(gòu)的變化進(jìn)行預(yù)判,做到有的放矢,提高服務(wù)質(zhì)量。當(dāng)然,本文還有一些問題尚待解決,如表4類目順序變化的真正原因是什么,蘊(yùn)含了哪些知識(shí)?小說等文學(xué)類中哪些知識(shí)是教育技術(shù)學(xué)專業(yè)的本質(zhì)需要,如何合理設(shè)計(jì)它在學(xué)科體系結(jié)構(gòu)的布局等?相關(guān)問題有待進(jìn)行下一步更深入的研究。

  參考文獻(xiàn):

  [3]張紅燕. 關(guān)聯(lián)規(guī)則挖掘在高校圖書館借閱流通中的應(yīng)用[J]. 數(shù)字技術(shù)與應(yīng)用,2012(5):76,78.

  [4]薛琴榮,李響. 基于數(shù)據(jù)挖掘技術(shù)的圖書館個(gè)性化借閱服務(wù)研究[J]. 情報(bào)探索,2013(4):110113.

  [7]柳炳祥. 基于數(shù)據(jù)挖掘的圖書館個(gè)性化服務(wù)系統(tǒng)[J]. 現(xiàn)代情報(bào),2007(3):108109.

  [9]苗奪謙,李道國(guó). 粗糙集理論、算法與應(yīng)用[M]. 北京:清華大學(xué)出版社,2008.

  [14]中國(guó)圖書館分類法編輯委員會(huì). 中國(guó)圖書館分類法[M]. 第4版. 北京: 書目文獻(xiàn)出版社,1999.