免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
SEO之搜索引擎爬蟲
SEO之搜索引擎爬蟲時間:2009-08-31 來源:優(yōu)友網(wǎng) 作者:佚名 影響:43人 網(wǎng)絡(luò)營銷論壇 我要投稿
一、什么是搜索引擎爬蟲程序
網(wǎng)絡(luò)爬蟲(又被稱為網(wǎng)頁蜘蛛,網(wǎng)絡(luò)機器人,更經(jīng)常的稱為網(wǎng)頁追逐者),是一種按照一定的規(guī)則,自動的抓取萬維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻,自動索引,模擬程序或者蠕蟲。
這些處理被稱為網(wǎng)絡(luò)抓取或者蜘蛛爬行。很多站點,尤其是搜索引擎,都使用爬蟲提供最新的數(shù)據(jù),它主要用于提供它訪問過頁面的一個副本,然后,搜索引 擎就可以對得到的頁面進(jìn)行索引,以提供快速的訪問。蜘蛛也可以在web上用來自動執(zhí)行一些任務(wù),例如檢查鏈接,確認(rèn)html代碼; 也可以用來抓取網(wǎng)頁上某 種特定類型信息,例如抓取電子郵件地址(通常用于垃圾郵件)。
一個網(wǎng)絡(luò)蜘蛛就是一種機器人,或者軟件代理。大體上,它從一組要訪問的URL鏈接開始,可以稱這些URL為種子。爬蟲訪問這些鏈接,它辨認(rèn)出這些頁面的所有超鏈接,然后添加到這個URL列表,可以稱作檢索前沿。這些URL按照一定的策略反復(fù)訪問。
二、爬蟲程序的種類以及分辨
搜索引擎派出他們的爬蟲程序去訪問、索引網(wǎng)站內(nèi)容,但是由于搜索引擎派爬蟲程序來訪會在一定程度上影響網(wǎng)站性能。在你的服務(wù)器日志文件中,可見每次 訪問的路徑和相應(yīng)的 IP 地址,如果是爬蟲程序來訪, 則user-agent 會顯示 Googlebot 或MSNBot 等搜索引擎爬蟲程序名稱,每個搜索引擎都有自己的user-agent。
三、國內(nèi)主要的爬蟲程序
百度 baidu.com--Baiduspider
谷歌 google.com--Googlebot
雅虎 yahoo.com--Yahoo
有道 yodao.com--YodaoBot
搜搜 soso.com--Sosospider/Sosoimagespider
搜狗 sogou.com--sogou
微軟 msn.com--msnbot

優(yōu)友網(wǎng)網(wǎng)絡(luò)營銷精讀.原文鏈接:http://www.uusem.com/seo/js/200908/314355.html
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
百度搜索引擎工作原理,讓你了解百度排名規(guī)則
網(wǎng)站SEO常用的專業(yè)術(shù)語
站長分析:搜索引擎的工作原理
怎么加快頁面收錄蜘蛛池購買
常州SEO姜東:搜索引擎的工作原理抓取、索引和排名-搜索引擎如何工作
二十個你必須知道的SEO概念_SEO
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服