Internet信息資源及其檢索.ppt
《Internet信息資源及其檢索.ppt》由會員分享,可在線閱讀,更多相關(guān)《Internet信息資源及其檢索.ppt(69頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第三章Internet信息資源及其檢索,,第一節(jié)Internet信息資源檢索,一、Internet信息資源信息源豐富信息內(nèi)容多樣性信息表現(xiàn)形式多樣化信息時效性信息交互性信息關(guān)聯(lián)性信息開放性免費信息資源豐富信息組織的局部有序性與整體無序性,二、Internet信息資源種類1、按信息來源劃分政府信息資源,公眾信息資源,商用信息資源2、按信息時效劃分電子郵件型信息資源,圖書館目錄資源,書目與索引資源,全文資料及電子出版物資源,數(shù)據(jù)庫信息資源,3、按所采用的網(wǎng)絡(luò)傳輸協(xié)議可分為:,WWW網(wǎng)絡(luò)資源:因特網(wǎng)信息資源的主流,它使用http協(xié)議,使用簡單,功能強大,能方便迅速的瀏覽和傳遞分布于網(wǎng)絡(luò)各處的文字、圖象、聲音和多媒體超文本信息。FTP信息資源:它使用ftp協(xié)議,該協(xié)議主要用于連網(wǎng)計算機之間傳輸文件。FTP相當(dāng)于在網(wǎng)絡(luò)上兩個主機之間復(fù)制文件。目前仍是發(fā)布、傳遞軟件和文件的主要方法。TELNET信息資源:telnet是遠(yuǎn)程登陸協(xié)議。telnet信息資源包括硬件資源和軟件資源。許多機構(gòu)都提供遠(yuǎn)程登錄的信息系統(tǒng),如圖書館的公共目錄系統(tǒng),信息服務(wù)機構(gòu)的綜合信息系統(tǒng)等。用戶服務(wù)組資源:包括新聞組,電子郵件組等。這些電子通信組形式所傳遞和交流的信息資源是網(wǎng)絡(luò)上最自由、最具有開放性的資源。news,第二節(jié)搜索引擎及其使用,搜索引擎(searchengines)是www環(huán)境下一種信息檢索的工具。它利用某種軟件(如網(wǎng)絡(luò)“蜘蛛”spiders)對互聯(lián)網(wǎng)上的信息進(jìn)行自動跟蹤和發(fā)掘,把收集到的所有網(wǎng)頁進(jìn)行分類存儲和標(biāo)引,并向用戶提供查詢?nèi)肟?。用戶通過這個查詢?nèi)肟谠诤迫鐭熀5男畔⒑Q笾姓业阶约核璧男畔ⅰ?搜索引擎主要任務(wù),?信息搜集?信息處理?信息查詢,搜索引擎分類,1、目錄式搜索引擎2、搜索式搜索引擎(1)綜合搜索引擎(2)專業(yè)搜索引擎3、元搜索引擎,目錄式,目錄式搜索引擎是指把因特網(wǎng)中的資源服務(wù)器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進(jìn)行分類,形成可供瀏覽的樹狀結(jié)構(gòu),類似圖書館的分類主題目錄,用戶可以不進(jìn)行關(guān)鍵詞查詢,通過層層點擊瀏覽也可以找到所需要的信息。目錄索引類搜索引擎以Yahoo雅虎為代表,國內(nèi)還有搜狐、新浪、網(wǎng)易等,國外有OpenDirectoryProject(DMOZ)、LookSmart、About等。其特點是由于加入了人的智能,所以信息準(zhǔn)確、查準(zhǔn)率高,但是搜索范圍較小,查全率低,在檢索學(xué)科專業(yè)屬性特征明顯的信息時利用這種方式極為方便,但搜索引擎信息歸類的質(zhì)量和用戶對信息類別了解程度將直接影響到查詢結(jié)果。,,搜索(網(wǎng)頁)型,搜索(網(wǎng)頁)型搜索引擎是最常見的。指能夠?qū)Ω骶W(wǎng)站的每個網(wǎng)頁中的每個詞進(jìn)行搜索的引擎,使用關(guān)鍵詞(Keywords)匹配方式檢索。用戶使用關(guān)鍵詞對網(wǎng)頁進(jìn)行搜索時,系統(tǒng)通過蜘蛛機器人自動在選定范圍內(nèi)進(jìn)行檢索,并將所檢索到的信息自動標(biāo)引導(dǎo)入索引數(shù)據(jù)庫中,匹配所檢索中的網(wǎng)頁,并輸出匹配結(jié)果。有代表性的如Google、百度、AltaVista、AllTheWeb等。,搜索引擎:水平門戶_綜合搜索引擎[中文],中文常用搜索引擎百度中文搜索引擎:,搜索引擎:水平門戶_綜合搜索引擎[英文],國外英文常用搜索引擎Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領(lǐng)軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風(fēng)頭直逼google。AltaVista—曾經(jīng)的搜索引擎巨人,目前仍被認(rèn)為是最好的搜索引擎之一。Overture—最著名的搜索引擎廣告商,競價排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網(wǎng)絡(luò)遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結(jié)果來自其他搜索引擎及目錄索引。,搜索引擎:垂直搜索引擎——專業(yè)搜索引擎,垂直搜索引擎:即專業(yè)或?qū)S盟阉饕妫鼘iT用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務(wù)深度是它的特點。垂直搜索引擎不但可保證此領(lǐng)域信息的收錄齊全與更新及時,而且檢索深度和分類細(xì)化遠(yuǎn)遠(yuǎn)優(yōu)于綜合搜索引擎。垂直搜索引擎的檢出結(jié)果雖可能較綜合搜索引擎少,但檢出結(jié)果重復(fù)率低、相關(guān)性強、查準(zhǔn)率高,適合于滿足較具體的、針對性強的檢索要求。目前已經(jīng)涉及到購物,旅游,汽車,工作,房產(chǎn),交友等行業(yè)。,垂直搜索引擎舉例:1,找工作的搜索引擎:google學(xué)術(shù)搜索:google圖書搜索:比價購物搜索引擎:博客與RSS搜索引擎:人脈搜索引擎:論壇搜索引擎:,垂直搜索引擎舉例:2,TheMusicFinderhttp://www.music-Singingfish(只能搜尋聲音和錄像)旅行TripAdvisor圖像搜索引擎:Business生意定向搜索引擎。DailyStocks可以了解被查詢公司存貨的信息已經(jīng)相關(guān)的新聞報導(dǎo),研究,引述和其他數(shù)據(jù)。FMLX英國定向的關(guān)于公司,存貨數(shù)據(jù),分析和研究的搜索引擎。eBizSearchhttp://www.ebizsearch.org關(guān)于電子商務(wù)的文章和報告。,RSS源[RSSfeed]搜索引擎,單個站點:新華網(wǎng):八方搜索引擎博客中國看天下看天下搜索引擎:RSSSearchEngine周博通RSS導(dǎo)航,綜合搜索引擎的專門化趨勢:,GOOGLE學(xué)術(shù)搜索:AllTheWeb[能專門對圖像、多媒體信息。]搜狗(Sogou)[人物、音樂、購物、圖片、地圖],FTP資源搜索引擎,天網(wǎng)星空搜索,郵件列表搜索引擎,萬維網(wǎng)聯(lián)盟郵件列表檢索服務(wù)http://www.w3.org/search/mail/publicCatalist,BT搜索引擎,BT特工,元搜索引擎(MetaSearchEngine),這類搜索引擎沒有自己的索引數(shù)據(jù),它將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。如萬緯搜索、Search、Dogpile等優(yōu)點:能同時搜索多個搜索引擎,能在一定程度上提高查詢的廣度。缺點:因為有時候并不能對一個搜索引擎全部查完,有時后也會漏掉一些重要信息。,早期的中文元搜索引擎1、metaFisher中文元搜索引擎2、萬緯搜索3、多元搜索1、一家搜2、bbmao是國內(nèi)唯一具有自動聚類功能的元搜索引擎,技術(shù)和功能上都比較強3、狠搜,更多元搜索引擎(英文),MetaCrawler()Profusion()Mamma()Dogpile()Vivisimo()Search(,,,,常用的一些搜索引擎網(wǎng)址(一),雅虎是中國最著名的目錄索引,是搜索引擎開山鼻祖之一。它收錄了全球資訊網(wǎng)上數(shù)以萬計的中文網(wǎng)站,不論你要找的網(wǎng)站是用國標(biāo)碼簡體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月,?檢索途徑通過分類目錄、關(guān)鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索(不支持“OR”)、可以使用引號,強調(diào)“+”、“-”、指定關(guān)鍵字出現(xiàn)的段落(加t:、加u:),?檢索結(jié)果根據(jù)關(guān)聯(lián)程度排序同時列出“相關(guān)。。。”?其它與Google合作,常用的一些搜索引擎網(wǎng)址(二),1998年創(chuàng)立,搜狐“分類與搜索”已收錄網(wǎng)站四十多萬,已形成龐大的中文網(wǎng)站數(shù)據(jù)庫。搜狐的目錄導(dǎo)航式搜索引擎完全是由人工加工而成,相比機器人加工的搜索引擎來講具有很高的精確性、系統(tǒng)性和科學(xué)性。,?檢索途徑通過分類目錄、關(guān)鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格,?檢索結(jié)果根據(jù)關(guān)聯(lián)程度排序返回五種分類結(jié)果?其它直通車搜狐黃頁,常用的一些搜索引擎網(wǎng)址(三),1997年,(簡體中文)提供有類目檢索和網(wǎng)站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領(lǐng)軍人物。,?檢索方法與技巧模塊分類、關(guān)鍵詞檢索支持布爾邏輯檢索(自動添加AND),“OR”,“-”,?檢索特色網(wǎng)頁快照、手氣不錯相似網(wǎng)頁、查詢電話號碼、查找PDF文件、股票報價、查找字典釋意、用Google查找地圖、工具條服務(wù)、網(wǎng)頁翻譯、單詞糾錯、繁簡轉(zhuǎn)換使用偏好,Google搜索高級語法,基本:Booleanoperator(AND、OR、NOT)高級:“…”define:site:filetype:inurl:intitle:fy罕用:info:link:related:cache:,Booleanoperator,AANDB:,Booleanoperator,AORB:,,,Booleanoperator,ANOTB:,語法“…”全文搜索,,,語法define:——定義,語法filetype:——查特定文件類型,.ppt.pdf.ps.doc.txt.xls,.swf.rtf.lwp.mw.wri.ans.wdb,,,語法site:(指定網(wǎng)域查找),.org,.aero.biz.coop.info.museum.name.pro,,,語法fy——中英文詞典翻譯,語法“l(fā)ink:”(友情鏈接),語法inurl:intitle:,網(wǎng)址中搜索網(wǎng)頁標(biāo)題中搜索,語法Info:(查詢與某鏈接相關(guān)信息),語法“cache:”——查緩存頁面,用來搜索google服務(wù)器上某頁面的緩存,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁,相當(dāng)于使用普通搜索結(jié)果頁面中的“網(wǎng)頁快照”功能。示例:查找google緩存的中文yahoo首頁搜索:“cache:”,?檢索方法與技巧模塊分類、關(guān)鍵詞檢索要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+)可以使用檢索語法,?檢索特色百度快照、自動糾錯、百度搜霸使用偏好,百度與google比較,搜索英文不必說用google,搜索中文呢?很多人并不了解它們更新的情況,google發(fā)展早,因而它貯存了大量舊的信息,百度發(fā)展遲,信息較新。更新速度:對中文google一般半月至一月一更新,而且僅搜索到三級鏈接,三級以下便不在搜索,那么我如何看到最新的google搜索的結(jié)果呢?這個站點:,百度和google語法的應(yīng)用,找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網(wǎng)友想找的重點,至于各是什么類型文件,請上網(wǎng)查一下便知道了,這里不多說了。尤其老板讓你做個powerpoint,找不到圖怎么辦?用google去搜索。,方法是利用語法filetype:后綴名。如找PDF文件,在正常關(guān)鍵詞后面加filetype:PDF即可,搜索結(jié)果全是PDF文件。找特定題目的網(wǎng)頁語法intitle:網(wǎng)站查找友情鏈接:"link:"(英文單字link后加冒號)用于搜索鏈接到某個URL地址的網(wǎng)頁。可以了解有哪些網(wǎng)頁把鏈接指向您的網(wǎng)頁。,基本搜索語法——查找文件,查找特定站點:site:www.*.com如釣魚島site:但不可加入http://或/這類,否則是錯的。查找美國教育網(wǎng)上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpgsite:edu”結(jié)果:搜索有關(guān)BIGBANGfiletype:jpgsite:edu的圖片,基本搜索語法——查找站點,Site可將搜索定位于某一個域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學(xué)內(nèi)有用的資源。site:tw,site:edu.tw,site:.......這是定位于國家或地區(qū),將搜索局限于某些國家或地區(qū),或加上edu,則是這些國家或地區(qū)的大學(xué),效果自然更好。如果site:則搜索國內(nèi)醫(yī)科大學(xué)內(nèi)的資源(會漏綜合性大學(xué)的資源的,要慎用)。,特殊語法:inurl,“inurl”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLERY”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個關(guān)鍵詞確定是否有某項具體資料。,INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。示例:查找MIDI曲“滄海一聲笑”。搜索:“inurl:midi滄海一聲笑”結(jié)果:已搜索有關(guān)inurl:midi滄海一聲笑的中文(簡體)網(wǎng)頁。,注意:“inurl:”后面不能有空格,GOOGLE也不對URL符號如“/”進(jìn)行搜索。例如,GOOGLE會把“cgi-bin/phf”中的“/”當(dāng)成空格處理。,google其它功能——查縮略詞的全稱,利用google查縮略詞的全稱,如果寫作時突然忘了某個縮略詞的全稱,當(dāng)時手頭若有金山詞霸等軟件則是易事,若無可考慮使用google,將其中文名與其縮略名作為關(guān)鍵詞搜索,效果很好,如:不知道血管活性腸肽(VIP)的全稱,可在google中輸入血管活性腸肽VIP,google其它功能——查英文單詞的中文名稱,google是最全的英中詞典,你找到一個英文詞,卻不知中文怎么辦?用google,寫出英文詞,然后大概了解一下這個詞屬于哪一個學(xué)科,再用加用一個中文關(guān)鍵詞搜索一下,效果很好。如urotensin不知道中文意思,但知道它是收縮血管的藥物,這時用urotensin血管收縮查一下,可能會出現(xiàn)一些文章或綜述內(nèi),其中便附有這個詞的中文了,google其它功能——搜索電話,如果想知道某個公司的電話,往往許多人喜歡這樣選關(guān)鍵詞:公司名稱tel,結(jié)果得到的根本不是你需要的。如果你知道這個公司的性質(zhì)或?qū)儆谑裁吹胤降?,則可以這樣搜索:區(qū)號公司名,這比上述關(guān)鍵詞要有效得多,這也涉及到搜索效率的問題。,搜索引擎的查詢技巧,?分析研究對象,選用搜索引擎?確定搜索途徑,使用不同方式?正確選用搜索引擎的搜索選項?正確選用搜索引擎的各項搜索功能,?根據(jù)反饋,修改檢索1、縮小搜索范圍:利用二次搜索(重新查詢、在結(jié)果中再查、在結(jié)果中去除)、使用檢索語法構(gòu)造恰當(dāng)?shù)臋z索表達(dá)式、選用正確的關(guān)鍵詞2、擴大搜索范圍:使用同義詞或近義詞、使用檢索語法or和截詞檢索、使用多個搜索引擎和元搜索引擎,如何提高查全率?,選擇上位詞和相關(guān)詞;如:查找關(guān)于孫中山的文獻(xiàn),先用孫中山查,再用孫文、國父查找。調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組面,如and(并且);進(jìn)行族性檢索(分類檢索或用or連接相關(guān)檢索詞);截詞檢索;com*代替computer增加檢索途徑。,如何提高查準(zhǔn)率?,提高專指度(用下位詞或換專指性強的自由詞)用邏輯乘“*”(and)或not相關(guān)檢索項;如查找克林頓,但不要關(guān)于萊溫斯基的信息。檢索式:克林頓not萊溫斯基用文獻(xiàn)外部特征限制輸出結(jié)果(在中文圖書中查找);用“二次檢索”、“條件檢索”排除誤檢;限制檢索字段,指定鄰接和優(yōu)先關(guān)系。,,,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- Internet 信息資源 及其 檢索
鏈接地址:http://www.820124.com/p-11496642.html