第二課時(shí) 信息檢索工具的工作原理
教學(xué)目標(biāo):
了解因特網(wǎng)信息檢索工具的工作原理,進(jìn)一步提高搜索技能,熟練地使用檢索工具獲取所需信息。
教學(xué)內(nèi)容:
1.介紹全文搜索和目錄搜索引擎的工作原理
2.資源搜索的定律及策略
教學(xué)重點(diǎn)、難點(diǎn):
介紹全文搜索和目錄搜索引擎的工作原理
課時(shí)數(shù):1課時(shí)
例:一位女士住在北京市,她想買一種交通工具上班,她的情況如下:
⑴每個(gè)月的工資均是1500元。 ⑵她喜歡的顏色是紫紅 ⑶家離公司的距離約500米
問:你建議她應(yīng)買什么樣的交通工具?(從價(jià)格、顏色等方面考慮)
一、全文搜索引擎的工作原理
1.搜索引擎的組成
?、潘阉髌鳎憾ㄆ谧詣?dòng)到各個(gè)網(wǎng)站上抓取網(wǎng)頁。
?、扑饕鳎悍治鲎ト〉木W(wǎng)頁,索引,存入服務(wù)器的數(shù)據(jù)庫中。
?、菣z索器:接收用戶提交的關(guān)鍵詞不達(dá)意,從索引數(shù)據(jù)庫中提取相關(guān)資源,呈現(xiàn)結(jié)果給用戶。
2.搜索引擎的工作流程圖
例:在“百度”搜索引擎中輸入“屯昌概況”。
二、目錄搜索引擎的基本工作原理
?、湃斯げ杉?、存儲(chǔ)網(wǎng)絡(luò)信息,手工為每個(gè)風(fēng)站確定一個(gè)標(biāo)題,給出大概的描述,建立關(guān)鍵字索引,將其放入相應(yīng)的類目體系中。
⑵網(wǎng)絡(luò)目錄
按主題性質(zhì)分類,依據(jù):某種分類依據(jù)
信息鏈呈樹狀結(jié)構(gòu):總目錄—專題目錄—鏈接—網(wǎng)站
?、侨乃阉饕媾c目錄搜索引擎的區(qū)別
全文搜索引擎 | 目錄搜索引擎 |
需要關(guān)鍵詞查詢 | 瀏覽主題,了解某一主題的相關(guān)資源。 |
搜索器在因特網(wǎng)中抓取網(wǎng)頁,索引器按關(guān)鍵詞不達(dá)意建立數(shù)據(jù)庫。 | 人工采集并存儲(chǔ)網(wǎng)絡(luò)信息。 |
信息資源多、復(fù)雜,不易了解主題內(nèi)容 | 網(wǎng)頁內(nèi)容豐富、學(xué)術(shù)性較強(qiáng) |
只需要搜索器定期“抓”網(wǎng)頁 | 維護(hù)費(fèi)用大、更新速度慢 |
三、資源檢索的三個(gè)定律
?、畔嚓P(guān)性定律
相關(guān)性基于詞頻統(tǒng)計(jì)
早期的搜索結(jié)果排序基于此定律,如:Infoseek、Excite、Lycos
?、迫藲赓|(zhì)量定律
科學(xué)引文索引的機(jī)制(論文被引用次數(shù)越多趙權(quán)威)
超鏈分析的方法:1998年
⑶自信心定律
它是解決搜索引擎公司的生存和發(fā)展問題的定律。
GoTo.com(Overture)是自信心定律的最早實(shí)踐者。
此定律與相關(guān)性排序、詞頻統(tǒng)計(jì)、超鏈分析和競價(jià)拍賣有關(guān)系。
GoTo市值13億美金,收入高達(dá)雅虎總收入的35%。
傳統(tǒng)的搜索引擎靠CPM來收費(fèi),GoTo的搜索引擎靠競價(jià)排名,點(diǎn)擊收費(fèi),開創(chuàng)了真正屬于互聯(lián)網(wǎng)的收費(fèi)模式。
四、資源檢索的策略
搜索內(nèi)容 | 搜索引擎 |
一般的信息資源 | 綜合性的(百度、google) |
圖片、視頻 | 特色的 |
專業(yè)性較強(qiáng) | 專業(yè)搜索引擎 |
全面了解網(wǎng)上信息資源 | 元搜索引擎 |
安排任務(wù)
以課件形式展示
任務(wù)1:登錄搜狐,搜尋黎族同胞的文化。
任務(wù)2:登錄3個(gè)目錄搜索引擎,搜索本周電視節(jié)目單,并畫出各自找到“電視節(jié)目單”所選擇的目錄路徑。
采用搜索引擎: 網(wǎng)址:
搜索內(nèi)容: 關(guān)鍵字:
目錄路徑:
任務(wù)3:搜索“上網(wǎng)太多會(huì)對身體健康產(chǎn)生什么樣的影響”,以文字、數(shù)據(jù)和圖片說明。
任務(wù)4:回顧人類載人航天的歷史。(包括重要?dú)v史的時(shí)間、事件、人物以及相應(yīng)的圖片資料)
任務(wù)5:搜索中國解放后的戰(zhàn)爭電影作品。