《計(jì)算機(jī)信息檢索》PPT課件.ppt
《《計(jì)算機(jī)信息檢索》PPT課件.ppt》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《《計(jì)算機(jī)信息檢索》PPT課件.ppt(80頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
計(jì)算機(jī)信息檢索,第一節(jié)計(jì)算機(jī)檢索基礎(chǔ)知識(shí),概述:20世紀(jì)90年代以來(lái),隨著Internet的發(fā)展,Internet上出現(xiàn)了龐大的信息資源。各種信息庫(kù)、文獻(xiàn)數(shù)據(jù)庫(kù)、事實(shí)數(shù)據(jù)庫(kù)應(yīng)有盡有,滲入到各個(gè)領(lǐng)域。美國(guó)報(bào)道生活新方式的期刊POV將互聯(lián)網(wǎng)檢索專(zhuān)家作為未來(lái)十大熱門(mén)職業(yè)之一。,如何在茫茫的信息海洋中找到對(duì)你有用的信息?,?,一.脫機(jī)批處理檢索階段(1954~1964年)(off-lineretrieval)單機(jī)檢索,以批處理進(jìn)行的。二.聯(lián)機(jī)檢索階段(1965~1971)(on-lineretrieval)終端機(jī)從主機(jī)獲取信息,人機(jī)對(duì)話(huà),檢索是以命令的形式進(jìn)行的。三.光盤(pán)檢索階段(1978-)在發(fā)達(dá)國(guó)家,光盤(pán)檢索是聯(lián)機(jī)檢索的支持和補(bǔ)充,但在通信技術(shù)不太發(fā)達(dá)的國(guó)家,由于它自身的優(yōu)點(diǎn),卻是用戶(hù)獲取信息的一個(gè)十分重要的手段四.網(wǎng)絡(luò)信息檢索階段(1990~)又叫混合型檢索,指Internet,具全球性的,知道網(wǎng)址就可以隨時(shí)隨地訪問(wèn)。,發(fā)展概況p328,我發(fā)展的很快啊,1.光盤(pán)檢索:以菜單形式檢索.a.光盤(pán)單機(jī)檢索----(CD-ROM)只讀式光盤(pán)檢索.b.光盤(pán)聯(lián)機(jī)檢索----局域網(wǎng)內(nèi)的檢索.2.網(wǎng)絡(luò)檢索a.局域網(wǎng)檢索b.互聯(lián)網(wǎng)檢索,計(jì)算機(jī)檢索分類(lèi),計(jì)算機(jī)信息檢索原理,計(jì)算機(jī)信息檢索:以計(jì)算機(jī)為基礎(chǔ)的信息的存儲(chǔ)與檢索。計(jì)算機(jī)檢索系統(tǒng):計(jì)算機(jī)硬件(服務(wù)器、檢索中端)、軟件(系統(tǒng)軟件和應(yīng)用軟件)、通訊網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)(文獻(xiàn)書(shū)目、事實(shí)型、數(shù)值型、全文、多媒體、超文檔)原理:,計(jì)算機(jī)檢索的實(shí)質(zhì):“匹配運(yùn)算”。檢索者以人機(jī)對(duì)話(huà)的形式把檢索提問(wèn)變成機(jī)器能識(shí)別的檢索命令輸入計(jì)算機(jī)中,由計(jì)算機(jī)自動(dòng)對(duì)數(shù)據(jù)庫(kù)中的記錄進(jìn)行匹配后輸出檢索結(jié)果。邏輯提問(wèn)式:用邏輯符號(hào)(與、或、非)將提問(wèn)特征(主題詞、分類(lèi)號(hào)、自由詞、作者等)連接起來(lái)的式子。,計(jì)算機(jī)檢索的過(guò)程(基本步驟),選擇檢索詞編寫(xiě)檢索提問(wèn)邏輯式;用戶(hù)提問(wèn)邏輯式同數(shù)據(jù)庫(kù)匹配;輸出檢索結(jié)果;對(duì)檢索結(jié)果進(jìn)行評(píng)價(jià)。,計(jì)算機(jī)信息檢索方法,基本方法:1、分類(lèi)目錄檢索2、關(guān)鍵詞檢索3、基于內(nèi)容的檢索搜索引擎的檢索功能(具體方法)1、布爾邏輯檢索2、截詞檢索3、詞位置檢索4、加權(quán)檢索5、限制檢索6、全文檢索,1.布爾邏輯檢索(復(fù)合檢索),布爾邏輯是表達(dá)不同概念之間關(guān)系的符號(hào)邏輯系統(tǒng)。常用的布爾邏輯運(yùn)算符有:與(AND、*)(邏輯乘).或(OR、+)(邏輯加).非(NOT、—)(邏輯減).AandB(A*B):表示提問(wèn)要求命中文獻(xiàn)同時(shí)包含A、B兩個(gè)特征;AorB(A+B):表示提問(wèn)要求命中文獻(xiàn)包含A、B兩個(gè)特征中的任何一個(gè)即可;AnotB(A–B):表示提問(wèn)要求命中文獻(xiàn)包含特征A,但不能包含特征B。法定數(shù)檢索:(是布爾邏輯檢索的一種改進(jìn))A*B*C*D,截詞檢索就是在檢索詞中保留相同的部分(即詞干),用相反的截詞符(常用的有?、$、*)等代替可變化部分并代表許多相同詞干檢索用詞的一種檢索方法。截詞方式:左截?cái)?、右截?cái)?、中截?cái)唷⒆笥医財(cái)嘤医卦~:前端一致.如:chemi*表示查找結(jié)果含有chemical,chemist,等左截詞:后端一致。如:*physics---physics,biophysics,chemophysics等中間截詞:wom*n---woman,women.左右截?cái)啵褐虚g一致*relation*可以查找relation,relations,或者interrelation,interrelationship等。,2.截詞檢索:提高查全率,nW關(guān)系:要求所連接的兩個(gè)檢索詞在結(jié)果中相互距離不超過(guò)n個(gè)詞或字,而且前后順序不能顛倒。nN關(guān)系:前后順序可以顛倒。例如:A(2W)B;A(2N)B,3.詞位置檢索P335,4.限制檢索,字段限定檢索:將檢索詞限定在特定的字段中用來(lái)縮小查找范圍的檢索方法。分為主題因素限定和非主題因素限定。范圍限制檢索:主要用于出版年、記錄號(hào)、專(zhuān)利號(hào)等數(shù)字型字段限定檢索。常用的比較關(guān)系GT(greaterThan)(大于)LT(lessthan)(小于)EQ(equal)(等于)NE(notequal)(不等于)GE(greaterthanorequal)(大于等于)LE(lessthanorequal)(小于等于),5.加權(quán)檢索:很少用,加權(quán)檢索:是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù)。運(yùn)用加權(quán)檢索可以命中核心概念文獻(xiàn),因此它是一種縮小檢索范圍提高查準(zhǔn)率的有效方法。,第二節(jié)Internet信息檢索,網(wǎng)絡(luò)信息檢索概念:對(duì)因特網(wǎng)信息資源進(jìn)行標(biāo)引和檢索的檢索系統(tǒng)機(jī)制,網(wǎng)絡(luò)信息檢索工具即因特網(wǎng)上提供網(wǎng)絡(luò)信息資源導(dǎo)航服務(wù)的一個(gè)網(wǎng)站。搜索引擎(SearchEngine),是采用因特網(wǎng)信息自動(dòng)跟蹤標(biāo)引等技術(shù)、建立在互聯(lián)網(wǎng)上專(zhuān)門(mén)提供網(wǎng)絡(luò)信息資源導(dǎo)航服務(wù)的一個(gè)網(wǎng)站。,網(wǎng)絡(luò)信息檢索工具的類(lèi)型,按檢索機(jī)制劃分目錄型:圖書(shū)館目錄一樣的分類(lèi)樹(shù)型結(jié)構(gòu),如yahoo.sina.sohu檢索型:關(guān)鍵詞、主題詞搜索引擎混合型:兼有檢索型和目錄型兩種檢索方式。、、多元型:集合型搜索引擎,檢索接口工具。同時(shí)對(duì)多個(gè)搜索引擎進(jìn)行并行或串行操作。按檢索的內(nèi)容劃分綜合型、專(zhuān)題型、專(zhuān)門(mén)信息檢索工具,1.www(環(huán)球信息網(wǎng))2.電子郵件(E-mail)3.遠(yuǎn)程登錄(Telnet):本地可登錄外地計(jì)算機(jī)4.文件傳輸協(xié)議(FTP):下載或者上傳5.電子公告版(BBS)發(fā)布公告或信息:遠(yuǎn)程登錄的討論;WWW方式下討論。6.其它:網(wǎng)絡(luò)新聞組等,,一.Inernet信息常用獲取方式,(1)概念www是worldwideweb(環(huán)球信息網(wǎng))的縮寫(xiě)。中文名稱(chēng)為萬(wàn)維網(wǎng)。它是在Internet環(huán)境下實(shí)現(xiàn)分布式超文本檢索的體系。作用:WWW采用的是客戶(hù)/服務(wù)器結(jié)構(gòu),整理和儲(chǔ)存各種WWW資源,并響應(yīng)客戶(hù)端軟件的請(qǐng)求,把客戶(hù)所需的資源傳送到WindowsUNIX或Linux等平臺(tái)上。網(wǎng)頁(yè)、網(wǎng)站:網(wǎng)站(web服務(wù)器)是由網(wǎng)頁(yè)集合而成的,而大家通過(guò)瀏覽器所看到的畫(huà)面就是網(wǎng)頁(yè),網(wǎng)頁(yè)說(shuō)具體了是一個(gè)或多個(gè)html文件,瀏覽器是用來(lái)解讀這份文件的。,www(環(huán)球信息網(wǎng)),操作系統(tǒng),,(2)超鏈接與超文本用戶(hù)通過(guò)瀏覽器觀看一個(gè)網(wǎng)頁(yè)時(shí),會(huì)發(fā)現(xiàn)一些帶有下劃線(xiàn)的文字或圖形圖片等,當(dāng)鼠標(biāo)指針指向這一部分時(shí),鼠標(biāo)指針變成手形,稱(chēng)之為超鏈接。當(dāng)鼠標(biāo)單擊超鏈接時(shí),瀏覽器就會(huì)顯示出與該超鏈接相關(guān)的內(nèi)容。具有超鏈接的文本就稱(chēng)為超文本。,(3)統(tǒng)一資源定位符(URL):在www中用URL(uniformresourcelocator)定義資源所在地,URL的地址格式為:應(yīng)用協(xié)議類(lèi)型://信息資源所在主機(jī)名(域名或IP地址)/路徑名/…/文件名例:,二.Internet信息獲取的常用輔助工具,1.文件下載工具:網(wǎng)絡(luò)螞蟻(NetAnts)網(wǎng)際快車(chē)Flashget(JetCar)迅雷下載等等2.文件壓縮與解壓工具:WinzipWinrar3.PDF文件及其閱讀軟件:下載安裝Adobe公司開(kāi)發(fā)的AcrobatReader軟件(免費(fèi)),即可在不同平臺(tái)上閱讀PDF文件。,1.概念:搜索引擎(SearchEngines)指對(duì)WWW站點(diǎn)資源和其他網(wǎng)絡(luò)資源進(jìn)行標(biāo)引和檢索的一類(lèi)檢索系統(tǒng)機(jī)制。一般包括數(shù)據(jù)采集標(biāo)引機(jī)制、數(shù)據(jù)組織機(jī)制和用戶(hù)檢索機(jī)制。,四.Internet搜索引擎,搜索引擎基本結(jié)構(gòu)圖,基于菜單驅(qū)動(dòng)的信息查詢(xún)工具,樹(shù)狀結(jié)構(gòu),如圖書(shū)館,搜索引擎按其工作方式主要可分為三種,分別是:全文搜索引擎(FullTextSearchEngine)目錄索引類(lèi)搜索引擎(SearchIndex/Directory)元搜索引擎(MetaSearchEngine),2.搜索引擎分類(lèi),■全文搜索引擎是名副其實(shí)的搜索引擎.國(guó)外具代表性的有:Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等國(guó)內(nèi)著名的有百度(Baidu)。它們都是通過(guò)從互聯(lián)網(wǎng)上提取的各個(gè)網(wǎng)站的信息而建立的數(shù)據(jù)庫(kù)中,檢索與用戶(hù)查詢(xún)條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶(hù),因此他們是真正的搜索引擎。,全文搜索引擎,■目錄索引:是按目錄分類(lèi)的網(wǎng)站鏈接列表,在嚴(yán)格意義上算不上是真正的搜索引擎。靠分類(lèi)目錄也可找到需要的信息。最具代表性:Yahoo雅虎。其他著名的還有OpenDirectoryProject(DMOZ)、LookSmart、About等。國(guó)內(nèi)的搜狐、新浪、網(wǎng)易搜索也都屬于這一類(lèi)。,目錄索引,元搜索引擎(METASearchEngine),■亦稱(chēng)“搜索引擎之母”。是對(duì)多個(gè)獨(dú)立搜索引擎的整合、調(diào)用、控制和優(yōu)化利用。搜索結(jié)果優(yōu)化處理后,以統(tǒng)一的格式在同一界面集中顯示元搜索引擎是用戶(hù)同時(shí)利用多引擎進(jìn)行網(wǎng)絡(luò)搜索的中介??杀焕玫莫?dú)立搜索引擎稱(chēng)為“源搜索引擎”(sourceEngine),或“搜索資源”(searcingresources)。,1、Vivisimo(調(diào)用多種搜索引擎,并對(duì)返回的結(jié)果自動(dòng)分類(lèi),界面友好,簡(jiǎn)單易用。2.Infospace3.Dogpile4.InfoGrid(提供與主要搜索網(wǎng)站的直接連結(jié)和目錄檢索,具有強(qiáng)大的元搜索和新聞搜索功能。5.MetaCrawler()支持調(diào)用12個(gè)獨(dú)立搜索引擎,提供涵蓋近20個(gè)主題的目錄檢索服務(wù)。其檢索特性非常豐富,包括常規(guī)檢索、高級(jí)檢索、定制檢索、國(guó)家或地區(qū)的資源檢索等檢索服務(wù)模式。6.S(),常用外文元搜索引擎,國(guó)內(nèi)元搜索引擎,搜魅網(wǎng)(someta):集合了百度、google、搜狗、雅虎多家主流搜索引擎的結(jié)果,提供網(wǎng)頁(yè)、資訊、網(wǎng)址導(dǎo)航等聚合查詢(xún)。馬虎聚搜:集合了google和百度的搜索結(jié)果,提供一些有用的熱點(diǎn)排行。佐意綜合搜索(chinazss):佐意網(wǎng)提供的綜合搜索,結(jié)合了Google\Baidu\yahoo\等知名搜索引擎,更細(xì)分了不同的搜索類(lèi)別,如軟件搜索,游戲搜索,視頻搜索,新聞搜索,網(wǎng)頁(yè)搜索,地圖搜索,音樂(lè)搜索,企業(yè)搜索等??此祈?yè)面簡(jiǎn)單,卻搜索功能卻很強(qiáng)大。佐意綜合搜索可以說(shuō)是元搜索中的一個(gè)典范。該搜索引擎還可直接查詢(xún)手機(jī)號(hào)碼歸屬地,IP查詢(xún)等。比比貓(bbmao):綜合了百度,谷歌,搜狐,雅虎,搜狗等搜索引擎的搜索結(jié)果,并建立了自動(dòng)分類(lèi),是目前最好的一款產(chǎn)品。速度還可以。,3.搜索引擎使用技巧,責(zé)任不在搜索引擎,而是沒(méi)掌握搜索精度的技巧。如何提高信息檢索效率呢?,1、關(guān)鍵詞提煉和細(xì)化搜索條件選擇最具代表性和指示性關(guān)鍵詞--搜索技巧之母有時(shí)多輸入一兩個(gè)關(guān)鍵詞效果不同--基本技巧之一。使用雙引號(hào):實(shí)現(xiàn)精確查詢(xún),不包含演變形式2、用好搜索邏輯命令:使用布爾命令“AND”、“OR”、“NOT”、“near”及與之對(duì)應(yīng)的“*”、“+”、“-”等邏輯符號(hào)命令。使用空格:等同于AND;查詢(xún)兩個(gè)以上關(guān)鍵詞時(shí),用空格表示結(jié)果中必須同時(shí)出現(xiàn)這幾個(gè)關(guān)鍵詞。用圓括號(hào):當(dāng)兩個(gè)關(guān)鍵詞用另外一種操作符連在一起,而你又想把它們列為一組時(shí)用,computeradventuregame最基本的搜索方式。computer(OR)adventure(OR)games=computer+adventure+game相當(dāng)于布爾邏輯檢索中的ANDcomputer(AND)adventure(AND)games=computer*adventure*gamecomputer(AND)game(NOT)adventure=computer+game-adventure,比較一下下面各搜索條件的含義,4、精確匹配搜索:縮小搜索結(jié)果范圍,甚至完成某些其他方式無(wú)法完成的任務(wù)。元詞檢索:使用通配符(*和?)區(qū)分大小寫(xiě):5、特殊搜索命令:除一般搜索功能外,還提供一些特殊搜索命令,以滿(mǎn)足高級(jí)用戶(hù)的特殊需求。比如查詢(xún)指向某網(wǎng)站的外部鏈接和某網(wǎng)站內(nèi)所有相關(guān)網(wǎng)頁(yè)的功能等等。6、附加搜索功能:搜索引擎都提供的一些方便用戶(hù)搜索的定制功能。常見(jiàn)的有相關(guān)關(guān)鍵詞搜索、限制地區(qū)搜索等。,元詞放關(guān)鍵詞前面,表明搜索的具體特征。例輸入“title:清華大學(xué)”,可以查到網(wǎng)頁(yè)標(biāo)題中帶有清華大學(xué)的網(wǎng)頁(yè)。關(guān)鍵詞后加上“domain:org”,可查到所有以org為后綴的網(wǎng)站。image:檢索圖片,link:檢索鏈接到某個(gè)選定網(wǎng)站的頁(yè)面,URL:檢索地址中帶有某個(gè)關(guān)鍵詞的網(wǎng)頁(yè)。,*表示匹配的數(shù)量不受限制;?表示匹配單個(gè)字符,主要用在英文搜索引擎中。例輸入“computer*”,就可以找到“computer、computers、computerised、computerized”等單詞,而輸入“comp?ter”,則只能找到“computer、compater、competer”等單詞。,著名搜索引擎簡(jiǎn)介,1.國(guó)外英文目錄索引:Yahoo—最著名的目錄索引,搜索引擎開(kāi)山鼻祖之一。DAskJeeves—著名的自然語(yǔ)言搜索引擎,2002年初收購(gòu)Teoma全文搜索引擎。LookSmart—點(diǎn)擊付費(fèi)索引目錄,2002年收購(gòu)WiseNut全文搜索引擎。A—有其自身特色的目錄索引。2.國(guó)外英文搜索引擎:(全文搜索引擎)Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領(lǐng)軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風(fēng)頭直逼google。AltaVista—曾經(jīng)的搜索引擎巨人,目前仍被認(rèn)為是最好的搜索引擎之一。,Overture—最著名的搜索引擎廣告商,競(jìng)價(jià)排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網(wǎng)絡(luò)遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結(jié)果來(lái)自其他搜索引擎及目錄索引。3.國(guó)內(nèi)目錄索引:搜狐(Sohu)—國(guó)內(nèi)三大門(mén)戶(hù)之一,最早在國(guó)內(nèi)推出搜索引擎收費(fèi)登錄服務(wù)。新浪(Sina)—最大的中文門(mén)戶(hù)網(wǎng)站,同樣也推出了搜索引擎收費(fèi)索引項(xiàng)目。網(wǎng)易(Netease)—網(wǎng)易搜索是ODP的國(guó)內(nèi)翻版,其目錄由志愿管理員維護(hù),是google的網(wǎng)頁(yè)搜索用戶(hù)。4.國(guó)內(nèi)全文搜索引擎:百度(Baidu)—國(guó)內(nèi)唯一商業(yè)化的全文搜索引擎,提供搜狐、新浪、263、Tom等站點(diǎn)的網(wǎng)頁(yè)搜索服務(wù)。,計(jì)算機(jī)信息檢索策略,構(gòu)造步驟:(例如:廢水處理裝置與技術(shù))1.分析信息需求(檢索課題),明確檢索要求2.選擇檢索系統(tǒng)3.選擇檢索途徑和檢索方法,確定檢索詞或檢索式4.實(shí)施信息檢索5.檢索策略的反饋和調(diào)整6.獲取原始文獻(xiàn),檢索策略的反饋與調(diào)節(jié):,一.影響查全率和查準(zhǔn)率的主要因素1.主題分析是否準(zhǔn)確全面2.檢索詞選擇是否準(zhǔn)確3.檢索詞之間邏輯關(guān)系的配置是否合適,二.提高查全率和查準(zhǔn)率的方法,1.提高查全率的方法(1)降低檢索詞的專(zhuān)指度(2)增加同義詞近義詞或相關(guān)詞的邏輯或運(yùn)算(3)選用截詞檢索(4)增加和調(diào)整檢索途徑,要記住啊,2.提高查準(zhǔn)率的方法,(1)提高檢索詞的專(zhuān)指度,增加或換用下位詞和專(zhuān)指性較強(qiáng)的關(guān)鍵詞進(jìn)行檢索(2)用AND連接一些進(jìn)一步限定主題概念的相關(guān)檢索項(xiàng),增加相互的制約(3)用NOT來(lái)排除一些無(wú)關(guān)的檢索項(xiàng)(4)采用限定檢索,縮小檢索范圍,提高查準(zhǔn)率,百度搜索引擎,特點(diǎn)(1)功能完備,搜索精度高。除數(shù)據(jù)庫(kù)的規(guī)模及部分特殊搜索功能外,其他方面可與領(lǐng)軍人物Google相媲美,在中文搜索方面有些地方甚至超過(guò)了Google,是國(guó)內(nèi)技術(shù)水平最高的搜索引擎。(2)為搜狐、雅虎中國(guó)、T、21CN、廣州視窗等搜索引擎,以及中央電視臺(tái)、外經(jīng)貿(mào)部等提供后臺(tái)數(shù)據(jù)搜索支持。百度目前主要提供中文(簡(jiǎn)/繁體)網(wǎng)頁(yè)搜索服務(wù)。如無(wú)限定,默認(rèn)以關(guān)鍵詞精確匹配方式搜索。支持“-”號(hào)、“.”號(hào)、“|”號(hào)及“l(fā)ink:”等特殊搜索命令。在搜索結(jié)果頁(yè)面,百度還設(shè)置了相關(guān)搜索功能,方便訪問(wèn)者查詢(xún)與輸入關(guān)鍵詞有關(guān)的其他方面的信息。提供“百度快照”查詢(xún)。其他搜索功能包括新聞搜索、網(wǎng)站網(wǎng)址鏈接、MP3搜索、圖片搜索、Flash搜索等。,=OR,點(diǎn)更多,,,根據(jù)你的需要選擇,Mp3,,MP3,,,視頻,,具體搜索,,在結(jié)果中進(jìn)行二次搜索,相關(guān)搜索功能,,,,高級(jí)搜索,在一個(gè)網(wǎng)址前加“site:”,可以限制只搜索某個(gè)具體網(wǎng)站、網(wǎng)站頻道、或某域名內(nèi)的網(wǎng)頁(yè)。例如:[電話(huà)site:]表示在網(wǎng)站內(nèi)搜索和“電話(huà)”相關(guān)的資料[intelsite:]表示在域名以“”結(jié)尾的網(wǎng)站內(nèi)搜索和“intel”相關(guān)的資料;[門(mén)戶(hù).cn]表示在域名以“cn”結(jié)尾的網(wǎng)站內(nèi)搜索和“門(mén)戶(hù)”相關(guān)的資料.,在指定網(wǎng)站內(nèi)搜索,,,,,,,搜狐搜索引擎,搜狐國(guó)內(nèi)最著名的門(mén)戶(hù)網(wǎng)站,也是國(guó)內(nèi)最早提供搜索服務(wù)的站點(diǎn)。互聯(lián)網(wǎng)概念在國(guó)內(nèi)的普及,搜狐功不可沒(méi)。在2001年年初由CNAZ(中文網(wǎng)站評(píng)估認(rèn)證網(wǎng))舉辦的搜索引擎網(wǎng)絡(luò)專(zhuān)項(xiàng)功能排名調(diào)查中,搜狐名列第一。搜狐設(shè)有獨(dú)立的目錄索引,并采用百度搜索引擎技術(shù),提供網(wǎng)站、網(wǎng)頁(yè)、類(lèi)目、新聞、黃頁(yè)、中文網(wǎng)址、軟件等多項(xiàng)搜索選擇。搜狐搜索范圍以中文網(wǎng)站為主,支持中文域名。搜狐是網(wǎng)站最重要的訪問(wèn)來(lái)源之一,因此是國(guó)內(nèi)搜索引擎登錄的首選。目前除學(xué)校、科研機(jī)構(gòu)、政府單位等性質(zhì)的網(wǎng)站仍實(shí)行免費(fèi)登錄外,其他網(wǎng)站登錄均須支付一定的費(fèi)用。,,,,,,高級(jí)檢索,,,搜狐檢索特色,1.搜狐搜索引擎對(duì)搜索結(jié)果是按“相關(guān)性”進(jìn)行排列的。相關(guān)性越高,排列位置越靠前。2.搜狐中文檢索系統(tǒng)目前支持的運(yùn)算符有:-、&、|、()、空格、not、and、or。這些運(yùn)算符既可以是英文,也可以是中文(全角或半角)。a.使用空格、&、and,來(lái)指定查詢(xún)串必須出現(xiàn)在結(jié)果中b.使用-或not,來(lái)限定-或not后的查詢(xún)串不出現(xiàn)在結(jié)果中c.使用|或or,來(lái)指定|或or兩邊的查詢(xún)串中有一個(gè)一定出現(xiàn)在結(jié)果中d.使用()或“”,來(lái)指定()或“”內(nèi)的表達(dá)式是一個(gè)整體單元.例如:輸入“體育-(足球籃球)”,會(huì)查詢(xún)到包含“體育”,且不包含“足球”與“籃球”的所有網(wǎng)站3.相關(guān)檢索:將輸入的關(guān)鍵字段擴(kuò)展,給出更多與之有關(guān)的搜索關(guān)鍵字4.信息的分類(lèi)比較好,按照其分類(lèi)表查找效果比用關(guān)鍵詞理想,新浪搜索引擎,新浪是全球范圍內(nèi)最大的華語(yǔ)門(mén)戶(hù)網(wǎng)站之一。新浪是國(guó)內(nèi)網(wǎng)民最常訪問(wèn)的網(wǎng)站,是最常用的中文搜索引擎。新浪自建獨(dú)立的目錄索引。共設(shè)16大類(lèi)目錄,10,000多個(gè)子目,收錄網(wǎng)站達(dá)20余萬(wàn),是規(guī)模最大的中文搜索引擎。新浪網(wǎng)推出中國(guó)第一家可對(duì)多個(gè)數(shù)據(jù)庫(kù)查詢(xún)的綜合搜索引擎。在關(guān)鍵詞的查詢(xún)結(jié)果中,在同一頁(yè)面上包含目錄、網(wǎng)站、新聞標(biāo)題、新聞全文、頻道內(nèi)容、網(wǎng)頁(yè)、商品信息、消費(fèi)場(chǎng)所、中文網(wǎng)址、滬深行情、軟件、游戲等各類(lèi)信息的綜合搜索結(jié)果,這在國(guó)內(nèi)尚屬唯一。搜索規(guī)則:默認(rèn)綜合搜索,涉及網(wǎng)站、網(wǎng)頁(yè)、新聞等內(nèi)容。網(wǎng)站搜索僅限于自身目錄中的注冊(cè)網(wǎng)站。目前除學(xué)校、政府機(jī)構(gòu)、科研單位的網(wǎng)站外,其他類(lèi)型網(wǎng)站都須支付一定的費(fèi)用。,,輸入關(guān)鍵詞查詢(xún),,,雅虎搜索引擎,Yahoo!——搜索引擎之王,世界最大的門(mén)戶(hù)網(wǎng)站,最早的目錄索引之一,也是目前最重要的搜索服務(wù)網(wǎng)站。除主站(MotherYahoo)外,還設(shè)有美國(guó)都會(huì)城市分站(YahooCities,如芝加哥分站)、國(guó)別分站(如雅虎中國(guó))和國(guó)際地區(qū)分站(如YahooAsia)。其數(shù)據(jù)庫(kù)中的注冊(cè)網(wǎng)站無(wú)論是在形式上還是內(nèi)容上質(zhì)量都非常高。Yahoo屬于目錄索引類(lèi)搜索引擎,可以通過(guò)兩種方式在上面查找信息,一是通常的關(guān)鍵詞搜索,一是按分類(lèi)目錄逐層查找。由于Yahoo靠人工操作甄選網(wǎng)站,且評(píng)判標(biāo)準(zhǔn)十分嚴(yán)格,因此是公認(rèn)最難登錄的搜索引擎。但它對(duì)我們網(wǎng)絡(luò)營(yíng)銷(xiāo)的作用舉足輕重,尤其是對(duì)商業(yè)網(wǎng)站而言,因?yàn)閅ahoo不僅是全球范圍內(nèi)最著名的互聯(lián)網(wǎng)品牌,而且也是最具影響力的企業(yè)資料庫(kù)。,,,,輸入關(guān)鍵詞,,可以查找你要的內(nèi)容:網(wǎng)頁(yè)、圖片等,Google搜索引擎,Google于1998年美國(guó)上市,幾年間迅速發(fā)展成為目前規(guī)模最大的搜索引擎。目前每天需要處理2億次搜索請(qǐng)求,數(shù)據(jù)庫(kù)存有30億個(gè)WEB文件。Google提供常規(guī)及高級(jí)搜索功能。還提供特別主題搜索,如:AppleMacintosh,BSDUnix,Linux和大學(xué)院校搜索等。Google允許以多種語(yǔ)言進(jìn)行搜索,在操作界面中提供多達(dá)30余種語(yǔ)言選擇,同時(shí)還可以在多達(dá)40多個(gè)國(guó)別專(zhuān)屬引擎中進(jìn)行選擇。,,,,導(dǎo)航,高級(jí)搜索,,,,1、Google無(wú)需用明文的“+”來(lái)表示邏輯“與”操作,只要空格就可以了。2、Google用減號(hào)“-”表示邏輯“非”操作。示例:搜索所有包含“專(zhuān)題講座”而不含“計(jì)算機(jī)”的中文網(wǎng)頁(yè)搜索式:專(zhuān)題講座-計(jì)算機(jī)3、Google用大寫(xiě)的“OR”表示邏輯“或”操作注意:小寫(xiě)的“or”,在查詢(xún)的時(shí)候?qū)⒈缓雎?;這樣上述的操作實(shí)際上變成了一次“與”查詢(xún))。4、搜索某一類(lèi)型文件,可用“filetype”來(lái)搜索。示例:搜索文獻(xiàn)綜述的PDF文件搜索式:文獻(xiàn)綜述filetype:pdf,檢索語(yǔ)法:+、-、OR、filetype,1、site:表示搜索結(jié)果局限于某個(gè)具體網(wǎng)站或者網(wǎng)站頻道(如site:),或者是某個(gè)域名(如site:com)。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁(yè)面,只需用“-網(wǎng)站/域名”(如site:-com)。示例:搜索中文教育科研網(wǎng)站()上所有包含“文獻(xiàn)綜述”的頁(yè)面。搜索式:"文獻(xiàn)綜述site:"2、link:搜索所有鏈接到某個(gè)URL地址的網(wǎng)頁(yè)。示例:搜索所有含指向華軍軟件園“”鏈接的網(wǎng)頁(yè)。搜索式:"link:"注意:“l(fā)ink”不能與其他語(yǔ)法相混合操作,所以“l(fā)ink:”后面即使有空格,也將被Google忽略,高級(jí)搜索語(yǔ)法:site,link,inurl,allinurl,intitle,allintitle,3、inurl:返回的網(wǎng)頁(yè)鏈接中包含第一個(gè)關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁(yè)文檔中。有很多網(wǎng)站把某一類(lèi)具有相同屬性的資源名稱(chēng)顯示在目錄名稱(chēng)或者網(wǎng)頁(yè)名稱(chēng)中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語(yǔ)法找到這些相關(guān)資源鏈接,然后,用第二個(gè)關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語(yǔ)法和基本搜索語(yǔ)法的最大區(qū)別在于,前者通常能提供非常精確的專(zhuān)題資料。示例:查找MIDI曲“滄海一聲笑”。搜索式:"inurl:midi滄海一聲笑"注意:“inurl:”后面不能有空格,4、allinurl:返回的網(wǎng)頁(yè)鏈接中包含所有查詢(xún)關(guān)鍵字,這個(gè)查詢(xún)的對(duì)象只集中于網(wǎng)頁(yè)的鏈接字符串。5、allintitle、intitle:用法類(lèi)似于上面的allinurl和inurl,只是后者對(duì)URL進(jìn)行查詢(xún),而前者對(duì)網(wǎng)頁(yè)的標(biāo)題欄進(jìn)行查詢(xún)。網(wǎng)頁(yè)標(biāo)題,就是HTML標(biāo)記語(yǔ)言title中之間的部分。示例:蘇東坡作品集搜索式:"intitle:蘇東坡作品",謝謝!,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 計(jì)算機(jī)信息檢索 計(jì)算機(jī)信息 檢索 PPT 課件
鏈接地址:http://www.820124.com/p-11494843.html