識組織系統(tǒng)下文獻(xiàn)檢索體系建設(shè)與驗證論文
基于知識組織系統(tǒng)的文獻(xiàn)檢索操作,是當(dāng)前數(shù)字圖書館領(lǐng)域文獻(xiàn)檢索方式的研究熱點方向之一,也是圖書館文獻(xiàn)信息的需求者與提供者之間對文獻(xiàn)資源進(jìn)行的互操作行為。在文獻(xiàn)檢索過程中,如何更加合理地通過對知識組織系統(tǒng)的運(yùn)用,提高文獻(xiàn)檢索的全面性和準(zhǔn)確性,已成為當(dāng)前文獻(xiàn)信息檢索的關(guān)鍵問題。
當(dāng)前,基于知識組織系統(tǒng)的文獻(xiàn)檢索方式主要是從文獻(xiàn)關(guān)鍵詞的語義角度出發(fā),通過基于分類表和敘詞表及知識本體的文獻(xiàn)檢索、基于文獻(xiàn)關(guān)鍵詞的標(biāo)引和分詞檢索、基于關(guān)鍵詞的語義檢索以及敘詞表重構(gòu)式檢索等檢索方式,以自動化標(biāo)引為檢索手段,實現(xiàn)的文獻(xiàn)檢索服務(wù)。其中,借助敘詞表中的概念語義關(guān)系擴(kuò)展與精化的用戶檢索式,是各種網(wǎng)絡(luò)信息檢索工具提高其檢索性能的常用方法。
此類文獻(xiàn)檢索服務(wù)以查閱、概念檢索、詞匯歸納等文本內(nèi)容為核心,主要體現(xiàn)在文獻(xiàn)信息的關(guān)鍵詞語義擴(kuò)展檢索和文獻(xiàn)信息的大眾分類法的檢索兩種模式上;谖墨I(xiàn)信息的關(guān)鍵詞語義擴(kuò)展檢索模式,主要通過分析文獻(xiàn)信息的關(guān)鍵詞自身概念與語義概念間的關(guān)聯(lián)性,并對文獻(xiàn)信息關(guān)鍵詞自身的詞性進(jìn)行標(biāo)注,突出文獻(xiàn)信息關(guān)鍵詞的核心概念與語義,再借助關(guān)鍵詞自身概念與語義概念的關(guān)聯(lián),實現(xiàn)基于關(guān)鍵詞本體的文獻(xiàn)信息語義檢索。語義檢索能處理信息的語義內(nèi)容,實現(xiàn)基于語義的匹配和推理。該檢索方式突出了文獻(xiàn)信息中核心概念與文獻(xiàn)信息關(guān)鍵詞語義的串聯(lián),并將文獻(xiàn)信息的核心價值通過文獻(xiàn)的關(guān)鍵詞標(biāo)引進(jìn)行充分的體現(xiàn),使得檢索結(jié)果與文獻(xiàn)信息需求的關(guān)聯(lián)度大幅增加,減少了用戶需要篩選的檢索結(jié)果數(shù)量,提升了檢索的速率,提高了檢索結(jié)果的準(zhǔn)確度。而基于大眾分類法的文獻(xiàn)檢索與傳統(tǒng)分類法相比,更加注重檢索者的檢索習(xí)慣,通過依照知識組織分類法處理各項文獻(xiàn)和檢索用戶自定義的自由詞作為數(shù)字資源標(biāo)注整理,實現(xiàn)檢索與瀏覽的功能,使得檢索過程更加便捷有效。
現(xiàn)階段,對獨立創(chuàng)建的知識組織系統(tǒng)的映射和服務(wù)協(xié)議是實現(xiàn)知識組織系統(tǒng)互操作的主要方式。當(dāng)前,基于知識組織系統(tǒng)的文獻(xiàn)檢索研究主要是通過將關(guān)鍵詞語義和文獻(xiàn)分類法與文獻(xiàn)的關(guān)聯(lián)為基礎(chǔ),實現(xiàn)類似將分類主題詞表和元數(shù)據(jù)集成在一起構(gòu)造一個知識網(wǎng)絡(luò)并在其上實施知識瀏覽和概念檢索。這種檢索模式在一定程度上提高了文獻(xiàn)檢索的便捷性和全面性。
但在當(dāng)前文獻(xiàn)涵蓋面廣、涉及領(lǐng)域雜的文獻(xiàn)環(huán)境中,資源組織體系不規(guī)范,造成基于文獻(xiàn)關(guān)鍵詞語義和文獻(xiàn)分類法關(guān)聯(lián)的檢索模式缺乏科學(xué)的導(dǎo)航體系和完善的管理平臺進(jìn)行關(guān)聯(lián)性檢索操作,使得文獻(xiàn)信息需求者在文獻(xiàn)檢索過程中無法對文獻(xiàn)關(guān)鍵詞的擴(kuò)展和標(biāo)引進(jìn)行正確的控制;同時,跨語言互換過程中語料庫的無法實時更新,使得檢索結(jié)果的準(zhǔn)確性和全面性受到影響;以及搜索引擎績效評價較少,使得檢索的過程效率無法得以明確的體現(xiàn)。針對當(dāng)前所面對的問題,筆者提出了一種個性化的基于知識組織系統(tǒng)的文獻(xiàn)檢索體系構(gòu)造,旨在以概念格、本體、數(shù)據(jù)挖掘、語義標(biāo)注等理論與技術(shù)的互補(bǔ)融合為基礎(chǔ)理念,形成滿足檢索用戶需求為前提的檢索操作,并通過對體系個性化、關(guān)聯(lián)性、評定反饋及安全性 4 個方面的構(gòu)造,實現(xiàn)全面性和準(zhǔn)確性的個性化文獻(xiàn)檢索活動。
1 基于知識組織系統(tǒng)的文獻(xiàn)檢索體系模塊
基于知識組織系統(tǒng)的文獻(xiàn)檢索的運(yùn)作目的,在于使信息需求者能夠通過自身信息需求的提取和檢索,實現(xiàn)全面準(zhǔn)確的目的性檢索。同時,概念格、本體、數(shù)據(jù)挖掘、語義標(biāo)注等操作技術(shù)的運(yùn)用,實現(xiàn)了基于知識組織系統(tǒng)的文獻(xiàn)檢索體系的構(gòu)建。
而基于知識組織系統(tǒng)的文獻(xiàn)檢索模塊,主要由信息需求模塊、關(guān)聯(lián)運(yùn)行模塊、評價反饋模塊和安全保障模塊 4 個部分組成。
1。1 信息需求模塊
信息需求模塊在文獻(xiàn)檢索體系中的設(shè)立,主要是用來完善合理的文獻(xiàn)檢索用戶的檢索需求,使文獻(xiàn)檢索用戶在檢索過程中,能夠針對自身的檢索需求進(jìn)行文獻(xiàn)檢索活動,提高檢索的效率以及檢索結(jié)果的利用價值。圖 1 為信息需求模塊結(jié)構(gòu)圖。
文獻(xiàn)檢索用戶是個性化文獻(xiàn)檢索活動的主體。要明確文獻(xiàn)檢索用戶的核心需求,需要先明確用戶的需求主題和關(guān)鍵詞,并通過對文獻(xiàn)需求指標(biāo)的關(guān)聯(lián)和分析,明確用戶的直接需求和潛在需求,同時也明確自身需求信息存在的屬性與載體形式。
在個性化文獻(xiàn)檢索活動中,用戶的需求指標(biāo)是檢索的核心要素。而如何建立完善合理的個人信息指標(biāo)體系,明確用戶的各項信息需求在檢索指標(biāo)中的界定標(biāo)準(zhǔn),體現(xiàn)檢索指標(biāo)的各個環(huán)節(jié)、體現(xiàn)用戶自身的信息需求,就成為當(dāng)前確定用戶文獻(xiàn)檢索需求的關(guān)鍵點。通過信息需求模塊的設(shè)定可以看出,個人用戶在檢索需求指標(biāo)的選取上具有針對性和全面性。
1。2 關(guān)聯(lián)運(yùn)行模塊
關(guān)聯(lián)運(yùn)行模塊體系結(jié)構(gòu)一共有 4 個組成部分,分別為用戶的核心需求、需求主題的內(nèi)在關(guān)聯(lián)、需求關(guān)鍵詞的內(nèi)在關(guān)聯(lián)以及關(guān)聯(lián)中樞。圖 2 為關(guān)聯(lián)運(yùn)行模塊結(jié)構(gòu)圖。
檢索關(guān)聯(lián)運(yùn)行模塊的核心,在于通過對檢索用戶核心需求的提取和分析,標(biāo)注其需求主題和需求關(guān)鍵字,同時對檢索用戶需求主題中客戶的潛在需求和直接需求的判定,以及需求關(guān)鍵詞體現(xiàn)相關(guān)需求的屬性和載體分析,實現(xiàn)檢索用戶需求的整體體現(xiàn),并通過關(guān)聯(lián)中樞的關(guān)聯(lián)與整合,實現(xiàn)檢索用戶相應(yīng)需求之間的互操作運(yùn)行。在檢索關(guān)聯(lián)運(yùn)行過程中,知識組織系統(tǒng)針對用戶檢索的相應(yīng)所需,通過知識數(shù)據(jù)整合與互操作技術(shù)實現(xiàn)文獻(xiàn)數(shù)據(jù)間的'關(guān)聯(lián),并通過關(guān)聯(lián)因子得出需求信息的關(guān)聯(lián)數(shù)據(jù)。
1。3 評定反饋模塊
評價反饋模塊體系是對文獻(xiàn)檢索結(jié)果的綜合評定,具體由檢索結(jié)果的全面性、有效性、準(zhǔn)確性和利用率 4 部分組成。圖3為評定反饋模塊結(jié)構(gòu)圖。在評定反饋體系運(yùn)行中,將檢索到的結(jié)果分別在用戶檢索需求和用戶需求環(huán)境中進(jìn)行全面性、有效性、準(zhǔn)確性和利用率的評定,并通過等級的劃分實現(xiàn)信息檢索結(jié)果價值的體現(xiàn)。
檢索結(jié)果的等級指標(biāo)體系是檢索結(jié)果的核心價值體現(xiàn),因此,評價反饋模塊中各個具體評定指標(biāo)的確立和運(yùn)行,使得檢索結(jié)果的針對性得以充分的體現(xiàn)。
1。4 安全保障模塊
安全保障體系是通過將文獻(xiàn)檢索過程中各項信息安全環(huán)節(jié)融合并組成的安全保障體系,其具體可以體現(xiàn)在信息保護(hù)體系和安全保障體系兩個主要部分。
信息保護(hù)體系主要是對用戶在文獻(xiàn)檢索過程中的個人需求進(jìn)行安全保護(hù),具體是通過對用戶的信息需求提取操作過程中用戶需求關(guān)鍵字的挖掘整理來實現(xiàn);安全保障體系負(fù)責(zé)對體系的整體運(yùn)行進(jìn)行操作,主要是通過對檢索結(jié)果進(jìn)行安全策略的分析與實施,并在體系運(yùn)行過程中設(shè)定安全效果的反饋,用以保持和完善用戶安全保障模塊的運(yùn)行。圖 4 為安全保障模塊圖。
在基于知識組織系統(tǒng)的文獻(xiàn)檢索體系中,安全保障模塊運(yùn)行的核心在于通過將用戶的個人信息以及檢索到的各類需求信息,通過信息清理、分析以及安全加密管理,實現(xiàn)信息的安全保障。信息安全保障體系是信息檢索過程中用于保障用戶信息安全的重要環(huán)節(jié)。信息安全保障體系旨在為用戶的個人信息以及從外界通過信息檢索所搜集到的信息提供安全保障,避免泄密事件的發(fā)生。因此,檢驗信息安全保障體系是否具有可行性的關(guān)鍵,在于該體系能否解決各種客觀環(huán)境下日益加劇的信息安全漏洞,實現(xiàn)對用戶個人信息的安全保障。
2 基于知識組織系統(tǒng)的文獻(xiàn)檢索體系構(gòu)建與驗證
2。1 基于知識組織系統(tǒng)的文獻(xiàn)檢索體系構(gòu)建
基于知識組織系統(tǒng)的文獻(xiàn)檢索運(yùn)作機(jī)制的核心,在于信息需求者是否能夠通過模塊實現(xiàn)信息的全面性和準(zhǔn)確率。圖 5 為基于知識組織系統(tǒng)的文獻(xiàn)檢索體系圖。
在基于知識組織系統(tǒng)的文獻(xiàn)檢索體系中,信息需求者將自身的信息需求通過信息需求模塊進(jìn)行提取,并在安全保障模塊中對提取的信息各項需求進(jìn)行集成歸納,通過將集成的信息在關(guān)聯(lián)運(yùn)行模塊中進(jìn)行關(guān)聯(lián)和檢索,并將檢索的結(jié)果通過安全保障模塊進(jìn)行呈現(xiàn)的同時,利用評價反饋模塊在安全保障模塊下實行結(jié)果評價和反饋,完成信息需求者所需的信息獲取。
2。2 實驗驗證
。1)信息需求。以歷史為需求的大類目,篩選以下 5 條文獻(xiàn)需求信息:需求信息 1———史學(xué)類相關(guān)文獻(xiàn);需求信息 2———文學(xué)類文獻(xiàn);需求信息 3———中國現(xiàn)代研究文獻(xiàn);需求信息 4———史料記載研究類文獻(xiàn);需求信息 5———魯迅方面相關(guān)研究文獻(xiàn)。
將上述 5 條需求信息進(jìn)行關(guān)鍵詞提取,所提取的關(guān)鍵詞見表 1。
在信息需求模塊中,需求信息的關(guān)鍵詞分別提取為史學(xué)、文學(xué)、中國現(xiàn)代研究、史料記載和魯迅研究;再通過關(guān)鍵詞合并需求關(guān)鍵詞,集成出需求信息:中國現(xiàn)代文學(xué)史料研究之魯迅方面相關(guān)研究文獻(xiàn)。
(2)關(guān)聯(lián)運(yùn)行。通過信息需求的集成操作,可將信息需求者的需求信息歸納為:中國現(xiàn)代文學(xué)史料研究之魯迅方面相關(guān)研究文獻(xiàn)。再通過關(guān)聯(lián)運(yùn)行模塊,將需求信息提取為:中國現(xiàn)代文學(xué)史料研究、魯迅研究文獻(xiàn)兩個方面。在運(yùn)行過程中,關(guān)聯(lián)運(yùn)行模塊將中國現(xiàn)代文學(xué)史料研究導(dǎo)入文獻(xiàn)檢索系統(tǒng)過程中進(jìn)行檢索。表 2 為中國現(xiàn)代文學(xué)史料研究檢索結(jié)果呈現(xiàn)表。
再通過將“魯迅研究文獻(xiàn)”作為二次檢索條件放入已檢索的關(guān)聯(lián)結(jié)果中,可得檢索結(jié)果:中國現(xiàn)代文學(xué)史料研究舉隅:魯迅、郭沫若、高長虹及相關(guān)研究。
(3)評價反饋。將關(guān)聯(lián)運(yùn)行模塊的結(jié)果放入反饋評價模塊中,并將檢索的結(jié)果與 5 條文獻(xiàn)需求信息進(jìn)行比對評價反饋,確定結(jié)果的全面性、有效性、準(zhǔn)確性和利用率。表 3 為評價反饋評定表。
3 未來發(fā)展展望
當(dāng)前,文獻(xiàn)信息主要以網(wǎng)狀結(jié)構(gòu)分布于知識組織體系中。為了適用文獻(xiàn)信息的動態(tài)性調(diào)整,注重知識組織中文獻(xiàn)信息的挖掘獲取,基于知識組織系統(tǒng)的檢索已逐步形成一套概念性的個性化檢索體系,該體系建立在文獻(xiàn)信息多樣化的基礎(chǔ)上,通過減少信息的重復(fù)分析,提高檢索效率和檢索質(zhì)量。在基于知識組織系統(tǒng)的文獻(xiàn)檢索過程中,檢索需求者需要通過對信息點的實時更新,并根據(jù)自身的需求設(shè)定檢索方向,實現(xiàn)用戶在檢索操作過程中的完善便捷服務(wù)。
在知識組織系統(tǒng)工具與信息檢索功能結(jié)合起來所形成的基于知識組織系統(tǒng)的文獻(xiàn)檢索模式中,智能化的檢索、分析和處理體系的特點和優(yōu)勢,符合當(dāng)前檢索的發(fā)展需求,是未來檢索領(lǐng)域的研究熱點。而如何將基于知識組織系統(tǒng)的文獻(xiàn)檢索與當(dāng)前文獻(xiàn)檢索服務(wù)相結(jié)合,更好地體現(xiàn)其操作的便捷性和檢索結(jié)果的有效性,是接下來我們研究的主要方向。
參考文獻(xiàn)
[1] 薛春香。網(wǎng)絡(luò)環(huán)境中知識組織系統(tǒng)構(gòu)建與應(yīng)用研究[M]。南京:東南大學(xué)出版社,2009。
[2] 董慧,唐敏。語義檢索在 Web2。0 環(huán)境下的應(yīng)用探討[J]。中國圖書館學(xué)報,2011(3):115—119。
[3] 王軍,張麗。網(wǎng)絡(luò)知識組織系統(tǒng)的研究現(xiàn)狀和發(fā)展趨勢[J]。中國圖書館學(xué)報,2008(1):65—69。
[4] 王軍。基于分類法和主題詞表的數(shù)字圖書館知識組織[J]。中國圖書館學(xué)報,2004(3):70。
[5] 蔡箐。 學(xué)科信息門戶及其優(yōu)化途徑[J]。 中國圖書館學(xué)報,2008(4):114—118。
[6] 馬志杰。我國搜索引擎評價研究的現(xiàn)狀、問題及對策[J]。圖書館學(xué)研究,2013(4):11—17。
[7] 滕廣青,畢強(qiáng)。知識組織體系的演進(jìn)路徑及相關(guān)研究的發(fā)展趨勢探析[J]。中國圖書館學(xué)報,2010(9):49—53。
【識組織系統(tǒng)下文獻(xiàn)檢索體系建設(shè)與驗證論文】相關(guān)文章:
公共文化服務(wù)體系下的建設(shè)路徑論文10-05
高校德育體系建設(shè)論文12-02
課程體系的建設(shè)論文05-28
體系建設(shè)水利科技論文11-05
組織文化建設(shè)論文11-14
淺析體系建設(shè)水利科技論文11-05