聲明:以下均來自百度官方及相關(guān)人員的解答。
1.為什么蜘蛛天天來,而快照不更新呢?
官方解答:蜘蛛天天來,你需要看蜘蛛是否只爬不抓,如果只爬不抓說明內(nèi)容還是存在問題的,要加大原創(chuàng)力度,或者說蜘蛛是否很難抓取,另外蜘蛛來了也抓取了也不會很快就更新,這之間是有一個過程的,蜘蛛需要對抓取的內(nèi)容進(jìn)行判斷,并且快照也有一個緩存時間。一般情況下我們需要注意:
1、網(wǎng)站是否被降權(quán),要是網(wǎng)站被降權(quán)了,要是網(wǎng)站被降權(quán)了,在搜索引擎那里屬于審核期,網(wǎng)站快照更新慢或不更新是很正常的。
2、網(wǎng)站是否被掛黑鏈,被掛大量黑鏈的網(wǎng)站也經(jīng)常會快照不更新,需要定期查看網(wǎng)站是否被掛黑鏈。
3、網(wǎng)站速度問題,網(wǎng)站的加載速度會影響蜘蛛的正常抓取,一般情況下網(wǎng)站都是從上往下的加載,而有的時候由于速度因素導(dǎo)致網(wǎng)站只加載了頭部,后面部分而沒有及時顯示出來,也可能導(dǎo)致蜘蛛只抓取了頭部部分內(nèi)容,而由于一般網(wǎng)站的頭部都是相同的,也就容易出現(xiàn)了抓取返回沒更新的狀態(tài)碼。
4、網(wǎng)站內(nèi)容問題
網(wǎng)站內(nèi)容長期采集或是偽原創(chuàng)也能導(dǎo)致蜘蛛返回304狀態(tài)碼,因?yàn)榫W(wǎng)站內(nèi)容采集或偽原創(chuàng)的確會降低網(wǎng)站質(zhì)量,導(dǎo)致百度不收錄等情況,搜索蜘蛛也會認(rèn)為網(wǎng)站內(nèi)容不具備收錄的意義,那么也就不會抓取新的內(nèi)容而返回沒有更新的狀態(tài)。
5、長時間不更新,頁面長時間沒有更新也會導(dǎo)致快照不更新的情況,你不是高權(quán)重網(wǎng)站,也沒有大量其他外部來源,如果又長時間不更新,那么很可能就不更新快照。
6、蜘蛛問題,蜘蛛天天來,那來的到底是些什么蜘蛛呢?不是所有的蜘蛛來網(wǎng)站都會更新的,降權(quán)也說不定,所以我們需要分析網(wǎng)站日志,了解搜索引擎蜘蛛。
7、網(wǎng)頁上有時間戳,然后時間戳代碼長期沒更新產(chǎn)生了快照異常。
8、百度問題,有的時候百度在更新之后會出現(xiàn)一些問題,導(dǎo)致失誤,所以可以到百度快照投訴進(jìn)行申訴。
9、百度會篩選一個最合適的快照進(jìn)行展現(xiàn),如果你的最新的索引快照不如之前的好,那么還是會展現(xiàn)之前的快照。
后來經(jīng)過分析,發(fā)現(xiàn)是因?yàn)榫W(wǎng)頁上的時間戳問題,經(jīng)過修改和更新后恢復(fù)正常。
2.新網(wǎng)站、老域名如何才能讓百度快速收錄?
官方解答:首先了解該域名之前的內(nèi)容,排除老域名因內(nèi)容原因被百度懲罰。然后觀察Baiduspider來訪軌跡,確定是否有蜘蛛進(jìn)行抓取。再看一下網(wǎng)頁狀態(tài)碼返回是否符合預(yù)期。如果都沒有問題,可以嘗試通過url提交工具h(yuǎn)ttp://zhanzhang.baidu.com/sitesubmit/index申請百度抓取。
3.網(wǎng)站不做偽靜態(tài)對收錄有沒有影響?
官方解答:對于不復(fù)雜的動態(tài)url,百度都可以搞定。
4.偽原創(chuàng)內(nèi)容對網(wǎng)站是否有壞處?
官方解答:視內(nèi)容對用戶的價值,無價值的純粹的偽原創(chuàng)是會被打擊的。
5.我們的原創(chuàng)內(nèi)容被XX網(wǎng)站采集,他們是新聞源,但我們不是,這種情況該怎么辦?
官方解答:百度傾向于收錄原創(chuàng)的新聞內(nèi)容。
如果確實(shí)有此情況,可以向站長平臺的投訴反饋中心提交反饋。前提是你的網(wǎng)站不是因?yàn)楸缓?、軟文等低質(zhì)內(nèi)容被懲罰。
6.網(wǎng)站title關(guān)鍵詞順序,是否影響排名?
官方解答:不影響。
7.純文本鏈接和錨文本鏈接,效果方面有啥區(qū)別?
官方解答:純文本還是錨文本并不重要,重要的是是否出現(xiàn)在有相關(guān)度的頁面上,百度現(xiàn)在對外鏈的依賴上已經(jīng)很少了,研究這個意義不大。
8. 如果收錄都被建入低層庫的話,怎么辦?如何提升上來呢?
官方解答:主要 問題在于內(nèi)容質(zhì)量。
好網(wǎng)頁:無論從網(wǎng)站結(jié)構(gòu)、怎么利于爬蟲抓取,還是從用戶體驗(yàn),用戶需求方面回答的始終有非常多信息來說明??梢詺w結(jié)為爬蟲與用戶。
眾所周知,搜索引擎的索引庫是分層級的,優(yōu)質(zhì)的網(wǎng)頁會被分配到重要索引庫,普通網(wǎng)頁會待在普通庫,再差一些的網(wǎng)頁會被分配到低級庫去當(dāng)補(bǔ)充材料。目前60%的檢索需求只調(diào)用重要索引庫即可滿足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。
那么,哪些網(wǎng)頁可以進(jìn)入優(yōu)質(zhì)索引庫呢。其實(shí)總的原則就是一個:對用戶的價值。包括卻不僅于:
1,有時效性且有價值的頁面:在這里,時效性和價值是并列關(guān)系,缺一不可。有些站點(diǎn)為了產(chǎn)生時效性內(nèi)容頁面做了大量采集工作,產(chǎn)生了一堆無價值面頁,也是百度不愿看到的.
2,內(nèi)容優(yōu)質(zhì)的專題頁面:專題頁面的內(nèi)容不一定完全是原創(chuàng)的,即可以很好地把各方內(nèi)容整合在一起,或者增加一些新鮮的內(nèi)容,比如觀點(diǎn)和評論,給用戶更豐富全面的內(nèi)容。
3,高價值原創(chuàng)內(nèi)容頁面:百度把原創(chuàng)定義為花費(fèi)一定成本、大量經(jīng)驗(yàn)積累提取后形成的文章。千萬不要再問我們偽原創(chuàng)是不是原創(chuàng)。
4,重要個人頁面:這里僅舉一個例子,科比在新浪微博開戶了,即使他不經(jīng)常更新,但對于百度來說,它仍然是一個極重要的頁面。
9.網(wǎng)站標(biāo)題是完全一致怎么優(yōu)化?
官方解答:最簡單的方式是每個頁面使用文章標(biāo)題作為標(biāo)題,并加上網(wǎng)站名稱。
10.百度現(xiàn)在對URL中出現(xiàn)中文字符仍然不友好嗎?
官方解答:現(xiàn)在中文目錄或者url已經(jīng)基本完美解決了,百度發(fā)表過聲明的,收錄時候會自動解析中文為編碼收錄的。
使用百度平臺閉站工具后仍有抓取?
官方解答:通過反饋中心來反饋
----------------------------------------------------
本文由營銷小能手整理
作者:任曉亮 QQ:541098712
營銷小能手公眾微信號:yx-xns 長按復(fù)制