《計(jì)算機(jī)信息檢索》PPT課件.ppt
《《計(jì)算機(jī)信息檢索》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《計(jì)算機(jī)信息檢索》PPT課件.ppt(80頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
計(jì)算機(jī)信息檢索,第一節(jié)計(jì)算機(jī)檢索基礎(chǔ)知識,概述:20世紀(jì)90年代以來,隨著Internet的發(fā)展,Internet上出現(xiàn)了龐大的信息資源。各種信息庫、文獻(xiàn)數(shù)據(jù)庫、事實(shí)數(shù)據(jù)庫應(yīng)有盡有,滲入到各個(gè)領(lǐng)域。美國報(bào)道生活新方式的期刊POV將互聯(lián)網(wǎng)檢索專家作為未來十大熱門職業(yè)之一。,如何在茫茫的信息海洋中找到對你有用的信息?,?,一.脫機(jī)批處理檢索階段(1954~1964年)(off-lineretrieval)單機(jī)檢索,以批處理進(jìn)行的。二.聯(lián)機(jī)檢索階段(1965~1971)(on-lineretrieval)終端機(jī)從主機(jī)獲取信息,人機(jī)對話,檢索是以命令的形式進(jìn)行的。三.光盤檢索階段(1978-)在發(fā)達(dá)國家,光盤檢索是聯(lián)機(jī)檢索的支持和補(bǔ)充,但在通信技術(shù)不太發(fā)達(dá)的國家,由于它自身的優(yōu)點(diǎn),卻是用戶獲取信息的一個(gè)十分重要的手段四.網(wǎng)絡(luò)信息檢索階段(1990~)又叫混合型檢索,指Internet,具全球性的,知道網(wǎng)址就可以隨時(shí)隨地訪問。,發(fā)展概況p328,我發(fā)展的很快啊,1.光盤檢索:以菜單形式檢索.a.光盤單機(jī)檢索----(CD-ROM)只讀式光盤檢索.b.光盤聯(lián)機(jī)檢索----局域網(wǎng)內(nèi)的檢索.2.網(wǎng)絡(luò)檢索a.局域網(wǎng)檢索b.互聯(lián)網(wǎng)檢索,計(jì)算機(jī)檢索分類,計(jì)算機(jī)信息檢索原理,計(jì)算機(jī)信息檢索:以計(jì)算機(jī)為基礎(chǔ)的信息的存儲(chǔ)與檢索。計(jì)算機(jī)檢索系統(tǒng):計(jì)算機(jī)硬件(服務(wù)器、檢索中端)、軟件(系統(tǒng)軟件和應(yīng)用軟件)、通訊網(wǎng)絡(luò)和數(shù)據(jù)庫(文獻(xiàn)書目、事實(shí)型、數(shù)值型、全文、多媒體、超文檔)原理:,計(jì)算機(jī)檢索的實(shí)質(zhì):“匹配運(yùn)算”。檢索者以人機(jī)對話的形式把檢索提問變成機(jī)器能識別的檢索命令輸入計(jì)算機(jī)中,由計(jì)算機(jī)自動(dòng)對數(shù)據(jù)庫中的記錄進(jìn)行匹配后輸出檢索結(jié)果。邏輯提問式:用邏輯符號(與、或、非)將提問特征(主題詞、分類號、自由詞、作者等)連接起來的式子。,計(jì)算機(jī)檢索的過程(基本步驟),選擇檢索詞編寫檢索提問邏輯式;用戶提問邏輯式同數(shù)據(jù)庫匹配;輸出檢索結(jié)果;對檢索結(jié)果進(jìn)行評價(jià)。,計(jì)算機(jī)信息檢索方法,基本方法:1、分類目錄檢索2、關(guān)鍵詞檢索3、基于內(nèi)容的檢索搜索引擎的檢索功能(具體方法)1、布爾邏輯檢索2、截詞檢索3、詞位置檢索4、加權(quán)檢索5、限制檢索6、全文檢索,1.布爾邏輯檢索(復(fù)合檢索),布爾邏輯是表達(dá)不同概念之間關(guān)系的符號邏輯系統(tǒng)。常用的布爾邏輯運(yùn)算符有:與(AND、*)(邏輯乘).或(OR、+)(邏輯加).非(NOT、—)(邏輯減).AandB(A*B):表示提問要求命中文獻(xiàn)同時(shí)包含A、B兩個(gè)特征;AorB(A+B):表示提問要求命中文獻(xiàn)包含A、B兩個(gè)特征中的任何一個(gè)即可;AnotB(A–B):表示提問要求命中文獻(xiàn)包含特征A,但不能包含特征B。法定數(shù)檢索:(是布爾邏輯檢索的一種改進(jìn))A*B*C*D,截詞檢索就是在檢索詞中保留相同的部分(即詞干),用相反的截詞符(常用的有?、$、*)等代替可變化部分并代表許多相同詞干檢索用詞的一種檢索方法。截詞方式:左截?cái)唷⒂医財(cái)?、中截?cái)唷⒆笥医財(cái)嘤医卦~:前端一致.如:chemi*表示查找結(jié)果含有chemical,chemist,等左截詞:后端一致。如:*physics---physics,biophysics,chemophysics等中間截詞:wom*n---woman,women.左右截?cái)啵褐虚g一致*relation*可以查找relation,relations,或者interrelation,interrelationship等。,2.截詞檢索:提高查全率,nW關(guān)系:要求所連接的兩個(gè)檢索詞在結(jié)果中相互距離不超過n個(gè)詞或字,而且前后順序不能顛倒。nN關(guān)系:前后順序可以顛倒。例如:A(2W)B;A(2N)B,3.詞位置檢索P335,4.限制檢索,字段限定檢索:將檢索詞限定在特定的字段中用來縮小查找范圍的檢索方法。分為主題因素限定和非主題因素限定。范圍限制檢索:主要用于出版年、記錄號、專利號等數(shù)字型字段限定檢索。常用的比較關(guān)系GT(greaterThan)(大于)LT(lessthan)(小于)EQ(equal)(等于)NE(notequal)(不等于)GE(greaterthanorequal)(大于等于)LE(lessthanorequal)(小于等于),5.加權(quán)檢索:很少用,加權(quán)檢索:是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù)。運(yùn)用加權(quán)檢索可以命中核心概念文獻(xiàn),因此它是一種縮小檢索范圍提高查準(zhǔn)率的有效方法。,第二節(jié)Internet信息檢索,網(wǎng)絡(luò)信息檢索概念:對因特網(wǎng)信息資源進(jìn)行標(biāo)引和檢索的檢索系統(tǒng)機(jī)制,網(wǎng)絡(luò)信息檢索工具即因特網(wǎng)上提供網(wǎng)絡(luò)信息資源導(dǎo)航服務(wù)的一個(gè)網(wǎng)站。搜索引擎(SearchEngine),是采用因特網(wǎng)信息自動(dòng)跟蹤標(biāo)引等技術(shù)、建立在互聯(lián)網(wǎng)上專門提供網(wǎng)絡(luò)信息資源導(dǎo)航服務(wù)的一個(gè)網(wǎng)站。,網(wǎng)絡(luò)信息檢索工具的類型,按檢索機(jī)制劃分目錄型:圖書館目錄一樣的分類樹型結(jié)構(gòu),如yahoo.sina.sohu檢索型:關(guān)鍵詞、主題詞搜索引擎混合型:兼有檢索型和目錄型兩種檢索方式。、、多元型:集合型搜索引擎,檢索接口工具。同時(shí)對多個(gè)搜索引擎進(jìn)行并行或串行操作。按檢索的內(nèi)容劃分綜合型、專題型、專門信息檢索工具,1.www(環(huán)球信息網(wǎng))2.電子郵件(E-mail)3.遠(yuǎn)程登錄(Telnet):本地可登錄外地計(jì)算機(jī)4.文件傳輸協(xié)議(FTP):下載或者上傳5.電子公告版(BBS)發(fā)布公告或信息:遠(yuǎn)程登錄的討論;WWW方式下討論。6.其它:網(wǎng)絡(luò)新聞組等,,一.Inernet信息常用獲取方式,(1)概念www是worldwideweb(環(huán)球信息網(wǎng))的縮寫。中文名稱為萬維網(wǎng)。它是在Internet環(huán)境下實(shí)現(xiàn)分布式超文本檢索的體系。作用:WWW采用的是客戶/服務(wù)器結(jié)構(gòu),整理和儲(chǔ)存各種WWW資源,并響應(yīng)客戶端軟件的請求,把客戶所需的資源傳送到WindowsUNIX或Linux等平臺上。網(wǎng)頁、網(wǎng)站:網(wǎng)站(web服務(wù)器)是由網(wǎng)頁集合而成的,而大家通過瀏覽器所看到的畫面就是網(wǎng)頁,網(wǎng)頁說具體了是一個(gè)或多個(gè)html文件,瀏覽器是用來解讀這份文件的。,www(環(huán)球信息網(wǎng)),操作系統(tǒng),,(2)超鏈接與超文本用戶通過瀏覽器觀看一個(gè)網(wǎng)頁時(shí),會(huì)發(fā)現(xiàn)一些帶有下劃線的文字或圖形圖片等,當(dāng)鼠標(biāo)指針指向這一部分時(shí),鼠標(biāo)指針變成手形,稱之為超鏈接。當(dāng)鼠標(biāo)單擊超鏈接時(shí),瀏覽器就會(huì)顯示出與該超鏈接相關(guān)的內(nèi)容。具有超鏈接的文本就稱為超文本。,(3)統(tǒng)一資源定位符(URL):在www中用URL(uniformresourcelocator)定義資源所在地,URL的地址格式為:應(yīng)用協(xié)議類型://信息資源所在主機(jī)名(域名或IP地址)/路徑名/…/文件名例:,二.Internet信息獲取的常用輔助工具,1.文件下載工具:網(wǎng)絡(luò)螞蟻(NetAnts)網(wǎng)際快車Flashget(JetCar)迅雷下載等等2.文件壓縮與解壓工具:WinzipWinrar3.PDF文件及其閱讀軟件:下載安裝Adobe公司開發(fā)的AcrobatReader軟件(免費(fèi)),即可在不同平臺上閱讀PDF文件。,1.概念:搜索引擎(SearchEngines)指對WWW站點(diǎn)資源和其他網(wǎng)絡(luò)資源進(jìn)行標(biāo)引和檢索的一類檢索系統(tǒng)機(jī)制。一般包括數(shù)據(jù)采集標(biāo)引機(jī)制、數(shù)據(jù)組織機(jī)制和用戶檢索機(jī)制。,四.Internet搜索引擎,搜索引擎基本結(jié)構(gòu)圖,基于菜單驅(qū)動(dòng)的信息查詢工具,樹狀結(jié)構(gòu),如圖書館,搜索引擎按其工作方式主要可分為三種,分別是:全文搜索引擎(FullTextSearchEngine)目錄索引類搜索引擎(SearchIndex/Directory)元搜索引擎(MetaSearchEngine),2.搜索引擎分類,■全文搜索引擎是名副其實(shí)的搜索引擎.國外具代表性的有:Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等國內(nèi)著名的有百度(Baidu)。它們都是通過從互聯(lián)網(wǎng)上提取的各個(gè)網(wǎng)站的信息而建立的數(shù)據(jù)庫中,檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶,因此他們是真正的搜索引擎。,全文搜索引擎,■目錄索引:是按目錄分類的網(wǎng)站鏈接列表,在嚴(yán)格意義上算不上是真正的搜索引擎??糠诸惸夸浺部烧业叫枰男畔?。最具代表性:Yahoo雅虎。其他著名的還有OpenDirectoryProject(DMOZ)、LookSmart、About等。國內(nèi)的搜狐、新浪、網(wǎng)易搜索也都屬于這一類。,目錄索引,元搜索引擎(METASearchEngine),■亦稱“搜索引擎之母”。是對多個(gè)獨(dú)立搜索引擎的整合、調(diào)用、控制和優(yōu)化利用。搜索結(jié)果優(yōu)化處理后,以統(tǒng)一的格式在同一界面集中顯示元搜索引擎是用戶同時(shí)利用多引擎進(jìn)行網(wǎng)絡(luò)搜索的中介。可被利用的獨(dú)立搜索引擎稱為“源搜索引擎”(sourceEngine),或“搜索資源”(searcingresources)。,1、Vivisimo(調(diào)用多種搜索引擎,并對返回的結(jié)果自動(dòng)分類,界面友好,簡單易用。2.Infospace3.Dogpile4.InfoGrid(提供與主要搜索網(wǎng)站的直接連結(jié)和目錄檢索,具有強(qiáng)大的元搜索和新聞搜索功能。5.MetaCrawler()支持調(diào)用12個(gè)獨(dú)立搜索引擎,提供涵蓋近20個(gè)主題的目錄檢索服務(wù)。其檢索特性非常豐富,包括常規(guī)檢索、高級檢索、定制檢索、國家或地區(qū)的資源檢索等檢索服務(wù)模式。6.S(),常用外文元搜索引擎,國內(nèi)元搜索引擎,搜魅網(wǎng)(someta):集合了百度、google、搜狗、雅虎多家主流搜索引擎的結(jié)果,提供網(wǎng)頁、資訊、網(wǎng)址導(dǎo)航等聚合查詢。馬虎聚搜:集合了google和百度的搜索結(jié)果,提供一些有用的熱點(diǎn)排行。佐意綜合搜索(chinazss):佐意網(wǎng)提供的綜合搜索,結(jié)合了Google\Baidu\yahoo\等知名搜索引擎,更細(xì)分了不同的搜索類別,如軟件搜索,游戲搜索,視頻搜索,新聞搜索,網(wǎng)頁搜索,地圖搜索,音樂搜索,企業(yè)搜索等??此祈撁婧唵?,卻搜索功能卻很強(qiáng)大。佐意綜合搜索可以說是元搜索中的一個(gè)典范。該搜索引擎還可直接查詢手機(jī)號碼歸屬地,IP查詢等。比比貓(bbmao):綜合了百度,谷歌,搜狐,雅虎,搜狗等搜索引擎的搜索結(jié)果,并建立了自動(dòng)分類,是目前最好的一款產(chǎn)品。速度還可以。,3.搜索引擎使用技巧,責(zé)任不在搜索引擎,而是沒掌握搜索精度的技巧。如何提高信息檢索效率呢?,1、關(guān)鍵詞提煉和細(xì)化搜索條件選擇最具代表性和指示性關(guān)鍵詞--搜索技巧之母有時(shí)多輸入一兩個(gè)關(guān)鍵詞效果不同--基本技巧之一。使用雙引號:實(shí)現(xiàn)精確查詢,不包含演變形式2、用好搜索邏輯命令:使用布爾命令“AND”、“OR”、“NOT”、“near”及與之對應(yīng)的“*”、“+”、“-”等邏輯符號命令。使用空格:等同于AND;查詢兩個(gè)以上關(guān)鍵詞時(shí),用空格表示結(jié)果中必須同時(shí)出現(xiàn)這幾個(gè)關(guān)鍵詞。用圓括號:當(dāng)兩個(gè)關(guān)鍵詞用另外一種操作符連在一起,而你又想把它們列為一組時(shí)用,computeradventuregame最基本的搜索方式。computer(OR)adventure(OR)games=computer+adventure+game相當(dāng)于布爾邏輯檢索中的ANDcomputer(AND)adventure(AND)games=computer*adventure*gamecomputer(AND)game(NOT)adventure=computer+game-adventure,比較一下下面各搜索條件的含義,4、精確匹配搜索:縮小搜索結(jié)果范圍,甚至完成某些其他方式無法完成的任務(wù)。元詞檢索:使用通配符(*和?)區(qū)分大小寫:5、特殊搜索命令:除一般搜索功能外,還提供一些特殊搜索命令,以滿足高級用戶的特殊需求。比如查詢指向某網(wǎng)站的外部鏈接和某網(wǎng)站內(nèi)所有相關(guān)網(wǎng)頁的功能等等。6、附加搜索功能:搜索引擎都提供的一些方便用戶搜索的定制功能。常見的有相關(guān)關(guān)鍵詞搜索、限制地區(qū)搜索等。,元詞放關(guān)鍵詞前面,表明搜索的具體特征。例輸入“title:清華大學(xué)”,可以查到網(wǎng)頁標(biāo)題中帶有清華大學(xué)的網(wǎng)頁。關(guān)鍵詞后加上“domain:org”,可查到所有以org為后綴的網(wǎng)站。image:檢索圖片,link:檢索鏈接到某個(gè)選定網(wǎng)站的頁面,URL:檢索地址中帶有某個(gè)關(guān)鍵詞的網(wǎng)頁。,*表示匹配的數(shù)量不受限制;?表示匹配單個(gè)字符,主要用在英文搜索引擎中。例輸入“computer*”,就可以找到“computer、computers、computerised、computerized”等單詞,而輸入“comp?ter”,則只能找到“computer、compater、competer”等單詞。,著名搜索引擎簡介,1.國外英文目錄索引:Yahoo—最著名的目錄索引,搜索引擎開山鼻祖之一。DAskJeeves—著名的自然語言搜索引擎,2002年初收購Teoma全文搜索引擎。LookSmart—點(diǎn)擊付費(fèi)索引目錄,2002年收購WiseNut全文搜索引擎。A—有其自身特色的目錄索引。2.國外英文搜索引擎:(全文搜索引擎)Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領(lǐng)軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風(fēng)頭直逼google。AltaVista—曾經(jīng)的搜索引擎巨人,目前仍被認(rèn)為是最好的搜索引擎之一。,Overture—最著名的搜索引擎廣告商,競價(jià)排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網(wǎng)絡(luò)遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結(jié)果來自其他搜索引擎及目錄索引。3.國內(nèi)目錄索引:搜狐(Sohu)—國內(nèi)三大門戶之一,最早在國內(nèi)推出搜索引擎收費(fèi)登錄服務(wù)。新浪(Sina)—最大的中文門戶網(wǎng)站,同樣也推出了搜索引擎收費(fèi)索引項(xiàng)目。網(wǎng)易(Netease)—網(wǎng)易搜索是ODP的國內(nèi)翻版,其目錄由志愿管理員維護(hù),是google的網(wǎng)頁搜索用戶。4.國內(nèi)全文搜索引擎:百度(Baidu)—國內(nèi)唯一商業(yè)化的全文搜索引擎,提供搜狐、新浪、263、Tom等站點(diǎn)的網(wǎng)頁搜索服務(wù)。,計(jì)算機(jī)信息檢索策略,構(gòu)造步驟:(例如:廢水處理裝置與技術(shù))1.分析信息需求(檢索課題),明確檢索要求2.選擇檢索系統(tǒng)3.選擇檢索途徑和檢索方法,確定檢索詞或檢索式4.實(shí)施信息檢索5.檢索策略的反饋和調(diào)整6.獲取原始文獻(xiàn),檢索策略的反饋與調(diào)節(jié):,一.影響查全率和查準(zhǔn)率的主要因素1.主題分析是否準(zhǔn)確全面2.檢索詞選擇是否準(zhǔn)確3.檢索詞之間邏輯關(guān)系的配置是否合適,二.提高查全率和查準(zhǔn)率的方法,1.提高查全率的方法(1)降低檢索詞的專指度(2)增加同義詞近義詞或相關(guān)詞的邏輯或運(yùn)算(3)選用截詞檢索(4)增加和調(diào)整檢索途徑,要記住啊,2.提高查準(zhǔn)率的方法,(1)提高檢索詞的專指度,增加或換用下位詞和專指性較強(qiáng)的關(guān)鍵詞進(jìn)行檢索(2)用AND連接一些進(jìn)一步限定主題概念的相關(guān)檢索項(xiàng),增加相互的制約(3)用NOT來排除一些無關(guān)的檢索項(xiàng)(4)采用限定檢索,縮小檢索范圍,提高查準(zhǔn)率,百度搜索引擎,特點(diǎn)(1)功能完備,搜索精度高。除數(shù)據(jù)庫的規(guī)模及部分特殊搜索功能外,其他方面可與領(lǐng)軍人物Google相媲美,在中文搜索方面有些地方甚至超過了Google,是國內(nèi)技術(shù)水平最高的搜索引擎。(2)為搜狐、雅虎中國、T、21CN、廣州視窗等搜索引擎,以及中央電視臺、外經(jīng)貿(mào)部等提供后臺數(shù)據(jù)搜索支持。百度目前主要提供中文(簡/繁體)網(wǎng)頁搜索服務(wù)。如無限定,默認(rèn)以關(guān)鍵詞精確匹配方式搜索。支持“-”號、“.”號、“|”號及“l(fā)ink:”等特殊搜索命令。在搜索結(jié)果頁面,百度還設(shè)置了相關(guān)搜索功能,方便訪問者查詢與輸入關(guān)鍵詞有關(guān)的其他方面的信息。提供“百度快照”查詢。其他搜索功能包括新聞搜索、網(wǎng)站網(wǎng)址鏈接、MP3搜索、圖片搜索、Flash搜索等。,=OR,點(diǎn)更多,,,根據(jù)你的需要選擇,Mp3,,MP3,,,視頻,,具體搜索,,在結(jié)果中進(jìn)行二次搜索,相關(guān)搜索功能,,,,高級搜索,在一個(gè)網(wǎng)址前加“site:”,可以限制只搜索某個(gè)具體網(wǎng)站、網(wǎng)站頻道、或某域名內(nèi)的網(wǎng)頁。例如:[電話site:]表示在網(wǎng)站內(nèi)搜索和“電話”相關(guān)的資料[intelsite:]表示在域名以“”結(jié)尾的網(wǎng)站內(nèi)搜索和“intel”相關(guān)的資料;[門戶.cn]表示在域名以“cn”結(jié)尾的網(wǎng)站內(nèi)搜索和“門戶”相關(guān)的資料.,在指定網(wǎng)站內(nèi)搜索,,,,,,,搜狐搜索引擎,搜狐國內(nèi)最著名的門戶網(wǎng)站,也是國內(nèi)最早提供搜索服務(wù)的站點(diǎn)?;ヂ?lián)網(wǎng)概念在國內(nèi)的普及,搜狐功不可沒。在2001年年初由CNAZ(中文網(wǎng)站評估認(rèn)證網(wǎng))舉辦的搜索引擎網(wǎng)絡(luò)專項(xiàng)功能排名調(diào)查中,搜狐名列第一。搜狐設(shè)有獨(dú)立的目錄索引,并采用百度搜索引擎技術(shù),提供網(wǎng)站、網(wǎng)頁、類目、新聞、黃頁、中文網(wǎng)址、軟件等多項(xiàng)搜索選擇。搜狐搜索范圍以中文網(wǎng)站為主,支持中文域名。搜狐是網(wǎng)站最重要的訪問來源之一,因此是國內(nèi)搜索引擎登錄的首選。目前除學(xué)校、科研機(jī)構(gòu)、政府單位等性質(zhì)的網(wǎng)站仍實(shí)行免費(fèi)登錄外,其他網(wǎng)站登錄均須支付一定的費(fèi)用。,,,,,,高級檢索,,,搜狐檢索特色,1.搜狐搜索引擎對搜索結(jié)果是按“相關(guān)性”進(jìn)行排列的。相關(guān)性越高,排列位置越靠前。2.搜狐中文檢索系統(tǒng)目前支持的運(yùn)算符有:-、&、|、()、空格、not、and、or。這些運(yùn)算符既可以是英文,也可以是中文(全角或半角)。a.使用空格、&、and,來指定查詢串必須出現(xiàn)在結(jié)果中b.使用-或not,來限定-或not后的查詢串不出現(xiàn)在結(jié)果中c.使用|或or,來指定|或or兩邊的查詢串中有一個(gè)一定出現(xiàn)在結(jié)果中d.使用()或“”,來指定()或“”內(nèi)的表達(dá)式是一個(gè)整體單元.例如:輸入“體育-(足球籃球)”,會(huì)查詢到包含“體育”,且不包含“足球”與“籃球”的所有網(wǎng)站3.相關(guān)檢索:將輸入的關(guān)鍵字段擴(kuò)展,給出更多與之有關(guān)的搜索關(guān)鍵字4.信息的分類比較好,按照其分類表查找效果比用關(guān)鍵詞理想,新浪搜索引擎,新浪是全球范圍內(nèi)最大的華語門戶網(wǎng)站之一。新浪是國內(nèi)網(wǎng)民最常訪問的網(wǎng)站,是最常用的中文搜索引擎。新浪自建獨(dú)立的目錄索引。共設(shè)16大類目錄,10,000多個(gè)子目,收錄網(wǎng)站達(dá)20余萬,是規(guī)模最大的中文搜索引擎。新浪網(wǎng)推出中國第一家可對多個(gè)數(shù)據(jù)庫查詢的綜合搜索引擎。在關(guān)鍵詞的查詢結(jié)果中,在同一頁面上包含目錄、網(wǎng)站、新聞標(biāo)題、新聞全文、頻道內(nèi)容、網(wǎng)頁、商品信息、消費(fèi)場所、中文網(wǎng)址、滬深行情、軟件、游戲等各類信息的綜合搜索結(jié)果,這在國內(nèi)尚屬唯一。搜索規(guī)則:默認(rèn)綜合搜索,涉及網(wǎng)站、網(wǎng)頁、新聞等內(nèi)容。網(wǎng)站搜索僅限于自身目錄中的注冊網(wǎng)站。目前除學(xué)校、政府機(jī)構(gòu)、科研單位的網(wǎng)站外,其他類型網(wǎng)站都須支付一定的費(fèi)用。,,輸入關(guān)鍵詞查詢,,,雅虎搜索引擎,Yahoo!——搜索引擎之王,世界最大的門戶網(wǎng)站,最早的目錄索引之一,也是目前最重要的搜索服務(wù)網(wǎng)站。除主站(MotherYahoo)外,還設(shè)有美國都會(huì)城市分站(YahooCities,如芝加哥分站)、國別分站(如雅虎中國)和國際地區(qū)分站(如YahooAsia)。其數(shù)據(jù)庫中的注冊網(wǎng)站無論是在形式上還是內(nèi)容上質(zhì)量都非常高。Yahoo屬于目錄索引類搜索引擎,可以通過兩種方式在上面查找信息,一是通常的關(guān)鍵詞搜索,一是按分類目錄逐層查找。由于Yahoo靠人工操作甄選網(wǎng)站,且評判標(biāo)準(zhǔn)十分嚴(yán)格,因此是公認(rèn)最難登錄的搜索引擎。但它對我們網(wǎng)絡(luò)營銷的作用舉足輕重,尤其是對商業(yè)網(wǎng)站而言,因?yàn)閅ahoo不僅是全球范圍內(nèi)最著名的互聯(lián)網(wǎng)品牌,而且也是最具影響力的企業(yè)資料庫。,,,,輸入關(guān)鍵詞,,可以查找你要的內(nèi)容:網(wǎng)頁、圖片等,Google搜索引擎,Google于1998年美國上市,幾年間迅速發(fā)展成為目前規(guī)模最大的搜索引擎。目前每天需要處理2億次搜索請求,數(shù)據(jù)庫存有30億個(gè)WEB文件。Google提供常規(guī)及高級搜索功能。還提供特別主題搜索,如:AppleMacintosh,BSDUnix,Linux和大學(xué)院校搜索等。Google允許以多種語言進(jìn)行搜索,在操作界面中提供多達(dá)30余種語言選擇,同時(shí)還可以在多達(dá)40多個(gè)國別專屬引擎中進(jìn)行選擇。,,,,導(dǎo)航,高級搜索,,,,1、Google無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了。2、Google用減號“-”表示邏輯“非”操作。示例:搜索所有包含“專題講座”而不含“計(jì)算機(jī)”的中文網(wǎng)頁搜索式:專題講座-計(jì)算機(jī)3、Google用大寫的“OR”表示邏輯“或”操作注意:小寫的“or”,在查詢的時(shí)候?qū)⒈缓雎裕贿@樣上述的操作實(shí)際上變成了一次“與”查詢)。4、搜索某一類型文件,可用“filetype”來搜索。示例:搜索文獻(xiàn)綜述的PDF文件搜索式:文獻(xiàn)綜述filetype:pdf,檢索語法:+、-、OR、filetype,1、site:表示搜索結(jié)果局限于某個(gè)具體網(wǎng)站或者網(wǎng)站頻道(如site:),或者是某個(gè)域名(如site:com)。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”(如site:-com)。示例:搜索中文教育科研網(wǎng)站()上所有包含“文獻(xiàn)綜述”的頁面。搜索式:"文獻(xiàn)綜述site:"2、link:搜索所有鏈接到某個(gè)URL地址的網(wǎng)頁。示例:搜索所有含指向華軍軟件園“”鏈接的網(wǎng)頁。搜索式:"link:"注意:“l(fā)ink”不能與其他語法相混合操作,所以“l(fā)ink:”后面即使有空格,也將被Google忽略,高級搜索語法:site,link,inurl,allinurl,intitle,allintitle,3、inurl:返回的網(wǎng)頁鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。示例:查找MIDI曲“滄海一聲笑”。搜索式:"inurl:midi滄海一聲笑"注意:“inurl:”后面不能有空格,4、allinurl:返回的網(wǎng)頁鏈接中包含所有查詢關(guān)鍵字,這個(gè)查詢的對象只集中于網(wǎng)頁的鏈接字符串。5、allintitle、intitle:用法類似于上面的allinurl和inurl,只是后者對URL進(jìn)行查詢,而前者對網(wǎng)頁的標(biāo)題欄進(jìn)行查詢。網(wǎng)頁標(biāo)題,就是HTML標(biāo)記語言title中之間的部分。示例:蘇東坡作品集搜索式:"intitle:蘇東坡作品",謝謝!,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計(jì)算機(jī)信息檢索 計(jì)算機(jī)信息 檢索 PPT 課件
鏈接地址:http://www.820124.com/p-11494843.html