CIDP14公共文化信息資源的組織.ppt
《CIDP14公共文化信息資源的組織.ppt》由會員分享,可在線閱讀,更多相關《CIDP14公共文化信息資源的組織.ppt(35頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第6講文化信息資源的組織,時間:1月11日14:00~16:00地點:A306,文化產(chǎn)業(yè)管理專業(yè)《文化信息資源開發(fā)規(guī)劃》課程,內容,信息資源組織原理信息資源的描述與揭示網(wǎng)絡信息資源的組織,1.信息資源組織原理,信息組織也稱信息整序,是利用一定的規(guī)則、方法和技術對信息的外部特征和內容特征進行揭示和描述,并按給定的參數(shù)和序列公式排列,使信息從無序集合轉換為有序集合的過程。,1.信息資源組織原理,信息的外部特征是指信息的物理載體直接反映的信息對象,構成信息的外在的、形式的特征,如信息載體的物理形態(tài)、題名、作者、出版或發(fā)表日期、流通或傳播的標記等方面的特征。信息的內容特征就是信息包含的內容,它可以由關鍵詞、主題詞或者其他知識單元表達。信息組織的基本對象就是信息的外部特征和內容特征。,1.信息資源組織原理,(1).信息選擇:從采集到的、處于無序狀態(tài)的信息流中甄別出有用的信息,剔除無用的信息,是信息組織過程的第一步。(2).信息分析:按照一定的邏輯關系從語法、語義和語用上對選擇過的信息內、外特征進行細化、挖掘、加工整理并歸類的信息活動。(3)信息描述與揭示:也稱為信息資源描述,根據(jù)信息組織和檢索的需要,對信息資源的主題內容、形式特征、物質形態(tài)等進行分析、選擇、記錄的活動。(4).信息存貯:將經(jīng)過加工整理序化后的信息按照一定的格式和順序存貯在特定的載體中的一種信息活動。,1.信息資源組織原理,信息組織的類型:(1)按信息表現(xiàn)形式劃分文字信息組織圖像信息組織聲音信息組織視頻信息組織(2)按信息的加工程度劃分一次信息組織二次信息組織三次信息組織,1.信息資源組織原理,(3)按信息的傳播載體劃分文獻信息源非文獻信息源在這里,非文獻信息源特指網(wǎng)絡環(huán)境下沒有以傳統(tǒng)文獻載體形式出現(xiàn)的信息源,如程序代碼、網(wǎng)頁、超文本等。為了學習的方便,我們統(tǒng)稱為網(wǎng)絡信息源。,1.信息資源組織原理,1.元數(shù)據(jù)的概念:元數(shù)據(jù)(metadata)是關于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata),是專門用來描述數(shù)據(jù)的特征和屬性,描述和組織信息資源,發(fā)現(xiàn)信息資源的語言和工具。2.元數(shù)據(jù)的描述對象:早期:元數(shù)據(jù)主要指網(wǎng)絡資源的描述數(shù)據(jù)后來:逐步擴大到各種以電子形式存在的信息資源的描述數(shù)據(jù)?,F(xiàn)在:元數(shù)據(jù)適用于各種類型信息資源的描述記錄。,1.信息資源組織原理,元數(shù)據(jù)的基本功能(1)識別。確認并對要進行組織的信息資源進行個別化描述,使用戶能識別被組織的資源對象。(2)定位。提供信息資源位置的信息,以便用戶訪問時使用。(3)檢索。通過在描述數(shù)據(jù)中提供檢索點,便于用戶對資源的檢索和利用。(4)選擇。通過記錄信息資源的特征,諸如主題、作者、類型、物理形式、層次和日期等,供用戶對信息資源的使用價值進行判斷,決定是否使用該資源。,2.信息資源的描述與揭示,1.文獻信息的著錄(1)著錄的基本概念:著錄:是指在編制文獻目錄時,對文獻內容和形式特征進行分析、選擇和記錄的過程??钅浚褐浀慕Y果是款目,它是反映文獻內容和形式特征的著錄項目的組合。目錄:將一批款目按照一定的次序編排而成的一種文獻報道和檢索工具。,2.信息資源的描述與揭示,(2)著錄的標準化:在國家或國際范圍內,對文獻著錄的原則、內容、格式等做出具有一定約束力的規(guī)范。國際:1971年,國際圖書館協(xié)會聯(lián)合會(IFLA),單行著作國際標準書目著錄ISBD(M);1976年,出版了國際標準數(shù)目著錄總則ISBD(G)。中國:1983年7月,正式發(fā)表了全國文獻著錄標準系列中的《文獻著錄總則》(GB3792.1-83),其后,先后出版了各個分則。,2.信息資源的描述與揭示,文獻信息的標引(1)標引的基本概念:信息標引:指分析信息的內容屬性(特征)及相關外表屬性,并用特定語言表達分析出的屬性或特征,從而賦予信息檢索標識的過程。標引語言:表達信息主題概念和檢索需求主題概念的簡明性、單義性和關聯(lián)性的概念標識系統(tǒng)。,2.信息資源的描述與揭示,信息標引包括主題分析和轉換標識兩個環(huán)節(jié)。主題分析:在了解和確定信息的內容屬性以及幫助揭示內容的某些外表屬性之后,將這些屬性概括為主題并用自然語言表述,同時分析主題概念之間或主題概念因素之間的結構關系。轉換標識:用專門的主題概念或概念因素,構成一定形式的檢索標識。,2.信息資源的描述與揭示,(2)標引的兩種主要類型:分類標引:采用分類語言的標引。分類語言用分類號表達主題概念,依據(jù)知識分類將主題概念組織、排列成類目體系,主要以類目體系的自身結構顯示概念之間的關系。主題標引:采用主題語言的標引。主題語言是一種由受控的自然語言語詞直接表達主題概念,按語詞字順排列主題,主要用參照顯示概念之間關系的標引語言。,2.信息資源的描述與揭示,20世紀80、90年代誕生的大量規(guī)范:《文本編碼倡議》(TextEncodedInitiative,簡稱TEI)《都柏林核心集》(DublinCore,簡稱DC)《政府信息定位服務》(GovernmentInformationLocatorService,簡稱GILS)《多媒體內容描述接口》(MultimediaContentDescriptionInterface,簡稱MPEG-7),2.信息資源的描述與揭示,1.MachineReadableCatalogue:MARC標準;起源:美國國會圖書館,1965年提出了“標準機器可讀目錄記錄款式的建議”,即MARCⅠ。1967年MARCⅡ誕生。特點:共有001~999個字段,其中999字段為用戶自定義字段;字段內容著錄詳盡,字段下又設子字段以及重復字段;字段作用強化,可檢索的字段多每條MARC記錄可分為頭標區(qū)、目次區(qū)和數(shù)據(jù)區(qū)。,2.信息資源的描述與揭示,(1)USMARC(美國國會圖書館機讀目錄通信格式)在1995年,美國NDLP啟動,對USMARC做了一些修改:增加了“電子資源地址與存取”字段即856字段。(2)UNIMARC(國際機讀目錄通信格式)(3)CNMARC(中國機讀目錄格式),2.信息資源的描述與揭示,2.DublinCore(都柏林核心集)(1)起源于1995年在美國俄亥俄州都柏林市召開的元數(shù)據(jù)講習班。目前,已得到廣泛的承認和應用,成為國際RFC2413和美國Z39.85標準。(http://dublincore.org)(2)作用:為描述網(wǎng)絡資源提供了一種規(guī)范。(3)15個核心元素DC元數(shù)據(jù)有15個核心內容元素(element)。這15個元素組成了都柏林核心元數(shù)據(jù)元素集(DublinCoreElementSet)。,2.信息資源的描述與揭示,元素名稱說明Title標題資源標題Subject主題資源內容的主題Description主題關于資源的簡要描述Type資源類別資源的內容類別Source來源產(chǎn)生該資源的其他資源Relation關聯(lián)關系與其他資源的關系Coverage覆蓋范圍資源地理、時間或管理的范圍,2.信息資源的描述與揭示,元素名稱說明Creator創(chuàng)作者資源內容的主要創(chuàng)作者Contributor其他貢獻者對資源做出其他貢獻的對象Publisher出版者資源的提供、發(fā)表、出版者Rights權限資源所屬或管理的權限信息Date日期資源生命周期中的特定日期Format資源格式資源的格式Language語言資源所使用的語言Identifier標識符對資源進行標識的識別信息,2.信息資源的描述與揭示,(4)DC的主要優(yōu)點:簡單易懂:15個元素通俗易懂運用靈活:它即可以用于規(guī)范的資源描述,也可以用于非專業(yè)領域國際通用:目前已有10多種不同語言的版本可擴展性:不僅有15個核心標記元素,子元素和擴展元素,還可以與其他元數(shù)據(jù)連接使用,3.網(wǎng)絡信息資源的組織,網(wǎng)絡信息的特點:組織的對象從各種類型的數(shù)據(jù)發(fā)展到更加豐富多彩的信息、信息鏈甚至知識;②組織的范圍從文獻內、外特征深入到信息單元、知識單元;③組織的結果從靜態(tài)的文本格式發(fā)展到動態(tài)的多模式的鏈接;④組織的形式從數(shù)據(jù)結構發(fā)展到知識表示。即要求信息組織的透明化、易用性;⑤組織的技術從手工單一發(fā)展到半自動化、自動化、智能化,即要求組織的標準化、兼容化。,3.網(wǎng)絡信息資源的組織,文件方式優(yōu)點:(1)簡單方便;(2)是存貯非結構化信息的天然單元。缺點:(1)難以平衡網(wǎng)絡負載與文件數(shù)量的關系;(2)不能充分地顯示結構化信息之間的結構關系;(3)文件本身可看做信息單元,需要作為對象來管理。,3.網(wǎng)絡信息資源的組織,數(shù)據(jù)庫方式數(shù)據(jù)庫組織方式:是將所有已獲得的網(wǎng)絡信息資源以固定的記錄格式存貯,用戶通過關鍵詞及其組配查詢,就可以找到所需要的信息線索(即相關站點鏈接),并通過信息線索直接鏈接到相應的網(wǎng)絡信息資源。,,,,檢索結果,,結構化查詢,,,檢索結果,輸入檢索式,客戶端,服務器,數(shù)據(jù)庫,3.網(wǎng)絡信息資源的組織,優(yōu)點:(1)利用數(shù)據(jù)模型對信息進行了規(guī)范化處理,優(yōu)化了數(shù)據(jù)的查詢,提供一整套數(shù)據(jù)控制和操作的方法,利用信息項之間的聯(lián)系進行信息的重組和查詢,提高數(shù)據(jù)操作的靈活性;(2)數(shù)據(jù)的管理與應用程序完全分離,大大降低了網(wǎng)絡傳輸?shù)呢撦d;(3)為多媒體信息、半結構化信息以及非結構化信息的組織提供良方。,3.網(wǎng)絡信息資源的組織,缺點:(1)不能提供數(shù)據(jù)信息之間的知識關聯(lián);數(shù)據(jù)庫組織方法是基于語用的組織,有嚴格的數(shù)據(jù)模型,單個數(shù)據(jù)項缺乏行為能力,所以難以顯示信息單元的知識內容之間的語義關聯(lián)。(2)對用戶和服務器端都提出了較高的要求。,3.網(wǎng)絡信息資源的組織,主題樹組織方式:將信息資源按照某種事先確定的概念體系結構,分門別類地逐層加以組織,用戶通過瀏覽的方式逐層加以選擇,層層遍歷,并通過信息線索直接找到相應的網(wǎng)絡信息資源。,3.網(wǎng)絡信息資源的組織,優(yōu)點:(1)簡單易用,屏蔽了網(wǎng)絡鏈接技術和資源獲取技術對用戶的復雜性,提供了一種基于樹型的瀏覽方式、簡單易用的信息檢索和利用界面;(2)信息檢索按照一定的范疇分類體系,逐次查看,對用戶而言,目的性強,查準率較高;(3)采用樹型目錄結構組織信息資源,具有良好的可擴充性和較嚴密的系統(tǒng)性。,3.網(wǎng)絡信息資源的組織,缺點:(1)必須事先建立一套完整的范疇體系,用戶對使用的范疇體系有一定的了解,增加用戶的智力負擔;(2)要保證主題樹的結構清晰性和資源可用性,主題范疇體系的結構就不能過于復雜,每一類目下的信息檢索條目不宜過多,這就降低了該方式所能容納的信息資源的數(shù)量。,3.網(wǎng)絡信息資源的組織,超媒體技術:是超文本技術與多媒體技術的結合,它將文字、圖像、聲音、視頻等多媒體信息以超文本的方式組織起來,用戶通過高度超級鏈接的網(wǎng)絡結構在各種信息庫中航行,從而找到所需要的信息。,線性文本,多媒體,超文本,超媒體,,加大表現(xiàn)力,加大表現(xiàn)力,,,,引入網(wǎng)絡結構,引入網(wǎng)絡結構,3.網(wǎng)絡信息資源的組織,優(yōu)點:(1)是網(wǎng)絡信息組織未來的發(fā)展方向,是符合人們跳躍性思維習慣的非線性組織方式,具有良好的包容性和可擴充性;(2)超越媒體類型對信息組織與檢索的限制,實現(xiàn)了鏈接瀏覽的搜尋方式;(3)避免了檢索語言的復雜性。,3.網(wǎng)絡信息資源的組織,缺點:(1)采用瀏覽的方式搜尋信息,當超媒體網(wǎng)絡過于龐大時,很難迅速而準確地的定位;(2)很難保存瀏覽過程中的所有記錄,難以避免“迷航”現(xiàn)象。,教學總結,,筆記整理,,Q&A,感謝您的關注!請您多多指導!,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- CIDP14 公共 文化 信息資源 組織
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.820124.com/p-11495036.html