作者:張智勇
都時興WEB2.0了,我還打算談SEO,確實有一點落伍。事情是這樣的,我最近要寫一個無聊的方案書,提綱已經(jīng)擬了一個月了,就是懶得寫正文。所以我決定把內容拆開了寫,獨立成章,這樣可以發(fā)揮我離題萬里的特性。如果萬幸,我能寫完這一系列文章,那每篇刪去50%,就可以組合成那個預想中的方案書。這個方式如果多人合作來做的話,似乎就有那么點WEB2.0的意思了。好象說遠了。
HAO123的性質我以為應該是非常的明顯,但后來發(fā)現(xiàn)即使是很多IT人士,甚至是高手都得出了錯誤的結論。當然這更大的可能是說明我錯了,但我是那種死不認錯的人,你們拿我沒辦法。
最開始看的一篇文章,是說HAO123充分照顧了初學者的需求,用簡單的頁面羅列最常去的站點LINK,對網(wǎng)友十分友好、方便,所以很多人都把它當主頁。我當時簡直要噴飯,稍微有點常識也不會如此吧?我很刻薄,在評論里說作者即使只去個人站長圈子的論壇里看兩天,也不會發(fā)出如此無知的言論。
但最近我發(fā)現(xiàn)幾位大腕級別的IT人士,竟然對HAO123也有類似的看法。一人是說中國網(wǎng)民水平低,但他相信如果有更好的站點出現(xiàn),大家是會接受的,不會只用HAO123。另一人更直接,說他的網(wǎng)站目標就是HAO123,是讓那些連后退鍵都不會使用的網(wǎng)民也能上的網(wǎng)站。
HAO123到底是什么?是低水平網(wǎng)民愛用的,但IT高手看起來傻的站點么?雖然我沒見過,但我不排除有人會喜歡HAO123,并主動把它作為起始頁。不過,我覺得把它定位為低水平者愛用的站點,主要是滿足大家了大家當高手的心理:我還是比很多低水平的人強啊。有多少人(比例)會主動使用HAO123?每一個人都說低水平的人喜歡,可低水平的人在哪里呢?
HAO123是隨著搜索引擎成長起來的站點。搜索引擎已經(jīng)鑄造了一代人的上網(wǎng)習慣。想一想我們自己,突然想起什么事,或是遇到一個不懂的詞,都會立刻用GOOGLE或者百度來搜索一下。在搜索過程中,我們經(jīng)常“誤入”類似HAO123的站點:你要去下載軟件,搜到的是一個有一堆該軟件LINK的頁面。當然這也對我們有用,但搜索引擎直接搜索到最終頁面,不是更好么?為什么需要這么一個中間的頁面呢?用術語來說這叫“橋頁”。
橋頁是SEO常用的手段。所謂SEO是Search Engine Optimization的縮寫,搜索引擎優(yōu)化的意思。就是說用的手段可以使用戶搜索東西的時候,讓你的網(wǎng)站排列在靠前的位置。搜索引擎既然成為了大家的上網(wǎng)習慣,那排列在搜索結果前面的站點自然會得到更多的流量。HAO123類的站點不僅僅是讓自己站點在一兩個關鍵詞搜索中排在前面,它首先要讓基本所有熱門搜索詞的結果中都會出現(xiàn)它的結果,而即使這個條目列到很靠后的位置,因為搜索引擎的使用者驚人,還是會帶來些許的PV。而當你被收錄的和熱門搜索詞符合的頁面非常多的時候,你的站點流量就會很快上去了。
要是一個一般網(wǎng)站要做到這個,需要非常大的人力。比如你是軟件下載站點,那要跟蹤很多流行軟件的更新,發(fā)現(xiàn)最新開發(fā)的軟件,并且要有安裝、使用等一系列常識。而且沒有人可以在各個方面都做到優(yōu)秀。一個做軟件下載好的站點,不見得做得好MP3,即使也能做MP3,總不能鈴聲圖片也能做?游戲網(wǎng)址 ,寬帶電影,軟件下載,愛情交友……
HAO123能做到。因為他們根本不關心最終結果,即使有錯誤也不影響。它要做的就是預先分析最可能的搜索詞,然后搜集做這些的網(wǎng)站網(wǎng)址,來一個大匯總。這樣搜索什么關鍵詞,它都有一個頁面等著你,這雖然也要花精力,但比維護一個“正常”站點要省力多了。而這些頁面即使不正確,對用戶沒幫助,對HAO123也是沒損失的。
這樣的頁面為什么會在搜索結果中排列的還比較靠前呢?首先要說搜索引擎的收錄機制。你的網(wǎng)頁做的再好,搜索引擎不知道也是白搭。搜索引擎會派出它的“爬蟲”,一個自動收集網(wǎng)頁的程序,在網(wǎng)上順著連接,把遇到的每一個頁面帶回去放到搜索引擎的數(shù)據(jù)庫中。當它遇到HAO123時,它會發(fā)現(xiàn)找到了一個“富礦”。
搜索引擎的爬蟲不象人那樣聰明,它只能按照固定的規(guī)則來收取頁面。這樣它就會比較偏好簡單的、好分析的頁面。如果一個連接是動態(tài)的,后面有太多的參數(shù),比如
http://www.tianyaclub.com/New/PublicForum/Content.asp?flag=0&idWriter=0&... 爬蟲處理起來就會很累,有的爬蟲索性不收錄這樣的頁面,因為這樣的動態(tài)頁面可能都是從數(shù)據(jù)庫中讀取的,理論上可以隨著你的參數(shù)不同,變出無數(shù)的頁面。也許會構成一個爬蟲永遠走不出的迷宮?,F(xiàn)在搜索引擎都能對付一些動態(tài)頁面,但它們都更喜歡簡潔的固定頁面,比如
http://www.hao123.com/music.htm爬蟲喜歡更有效率的工作,收集完一個頁面會沿著頁面上的LINK再收集下級的頁面。這樣我們就能判斷出它偏好的頁面樣子:簡單,沒什么多余的看不懂的結構、程序,最好上面有很多的LINK,可以讓自己繼續(xù)收集。如果這LINK通往的下級頁面也是這樣,我們可以想象爬蟲會高興的說:可找到你了。我太擬人化了。其實這些是編寫爬蟲程序的工程師們的想法,他們把這寫進了爬蟲的工作規(guī)則。HAO123類的橋頁就符合這樣規(guī)則。
爬蟲有多厲害呢,我曾經(jīng)做過的網(wǎng)站,有一個類似這樣的橋頁系統(tǒng)。平常的訪問很低,40000左右,但有時會突然暴漲到8萬。不用說,我知道,昨天百度的爬蟲來訪問過了。如果你做的對它的胃口,它會老來,每天吃掉你給它提供的頁面。這對搜索引擎來說是可以理解的,它也希望收集更多的頁面來提供給用戶。(當然我做的不是垃圾站點,這后面還要說)
解決了收錄這一步,剩下的要由搜索引擎分析,什么樣的站點會排到前面。首先同樣它喜歡簡單的頁面,因為它自己智力有限。其次它喜歡符合規(guī)則的頁面,有規(guī)則它才能判斷。橋頁因為簡單,這兩點都會做的很好。然后因為搜索引擎沒法用自己使用這些頁面憑感覺來判斷好壞,所以它重要的參考就是如果別處有更多的這個站點連接,那么說明這個站點更重要。這道理成立,但是橋頁很容易做到了這點,因為它是專門做連接的。它添加了一個站點,要求對方也做它的友情連接是很正常的互換。不過它是專門做這個的,它可以得到的友情連接要比“正常”網(wǎng)頁要多的多。而且這是相互影響的,當它在搜索引擎地位提高了,它要求別的站點做友情連接時就更可能得到回應,于是形成正循環(huán)。
這還是比較“臺面”上的技巧。具體到HAO123來說,它還有一系列同類型的站點。它們之間互相做連接,搜索引擎也會因此提高所有這些站點的等級,互相促進。據(jù)說ALEXA前列的站點中,HAO123的所有者還有至少10幾個同類型的站點。
若這些還算只欺騙搜索引擎的話,剩下的行為就更讓那些要學習HAO123的IT大腕考驗自己的良心了。HAO123早期是靠病毒修改用戶主頁的。不僅僅它這么做,它的一系列站點也都這么做,據(jù)說它還用過QQ病毒傳播。這些現(xiàn)在已經(jīng)找不到痕跡,它已經(jīng)成功洗白了自己。但有一點還存在,就是網(wǎng)頁總會跳出來提示,讓你把HAO123設為主頁。即使現(xiàn)在HAO123本身不這么做了,它的子站點依然還有這么做的痕跡。你可能訪問一個看起來無關的站點,而把HAO123設成了主頁。HAO123就是靠它SEO的一系列站點,成功的讓很多計算機把它設成了主頁。
這也是某些觀察家們所說的,低水平用戶歡迎,甚至喜歡到會把它設成主頁的地步。我們去網(wǎng)吧看看,也確實能發(fā)現(xiàn)很多機器這樣,因為大家對網(wǎng)吧的機器更不在乎,讓我按“確定”我就按唄。網(wǎng)吧確實是中國特色,但我不認為HAO123是某些IT人士理解的中國特色。順便說一句,要了解一般網(wǎng)民習慣的IT人士請抽出時間,定期去網(wǎng)吧。先觀察大家在干什么、比例,然后再著重看某一個瀏覽頁面的人,看他上網(wǎng)具體的點擊習慣,和遇到的困惑。最后找臺機器,把歷史記錄考下來,發(fā)到自己郵箱里,回去做網(wǎng)站訪問分析。多做點基本功,別老暢想。
又說遠了。
SEO手段還有很多,很細致具體。我只重點說了橋頁。一方面我不可能詳細介紹,這可以寫專著了。另一方面很多技巧我也不知道。但大家只要想一下,很多站長靠這個就可以吃飯了,就明白這是一個很復雜的系統(tǒng)。
所以說HAO123類站點在某種程度上是寄生在搜索引擎上的,而不是為了滿足低水平用戶需求。某種意義上我們說“純潔”的GOOGLE其實也助長了垃圾站點的產(chǎn)生。我要是GOOGLE,早把此類站點手動清除了。但GOOGLE 的原則是相信程序,不會人工干預。另外它們雖然反對(并準備懲罰)橋頁類的SEO,但可能對中國類型的橋頁應用還不是很重視吧,做起來確實沒看到什么成效。百度就更奇怪了。HAO123已經(jīng)靠流量賣廣告實現(xiàn)了贏利,被收購也不奇怪。但誰收購它也不應該是百度收購,因為SEO站點的技巧,搜索引擎最清楚。誰需要SEO的站點,也不該是百度需要。那些說百度需要一個靜態(tài)目錄站點來幫助完善的人,完全混淆了dmoz.org類的INDEX服務和HAO123類站點的區(qū)別。但這些外人可能混淆,做搜索引擎的人不會混淆。那么為什么收購HAO123呢?
我不喜歡簡單嘲弄收購傻,能花幾千萬的人都不會太傻。回憶一下,那些我們曾經(jīng)見過的最傻的網(wǎng)站燒錢行為。嘲笑他們傻?但誰傻了呢?每個過手的人都可能賺的腦滿腸肥。誰傻?是他們還是我們這些沒賺到錢的看客?呵呵,看出來了吧,我開始往惡意度人的道路上引導大家。
最會SEO的是誰?當然是掌握全部搜索引擎規(guī)則的人。誰掌握全部規(guī)則?要是這個人后來又收購了該SEO站點,他傻?呵呵,我本能的反射是:洗錢。當然了,我沒有說我這感覺是對的。反射嘛,不走腦子,也不負責任。只不過暴露一下我的陰暗心理。
第N次說遠了。
SEO是不是一無是處?不是。搜索引擎已經(jīng)成為用戶習慣,適應用戶習慣本來就是我們應該做的。搜索引擎是告戒大家不要去適應引擎,只要適應用戶,自然會在引擎上體現(xiàn)。理想情況當然是這樣。但我可以舉例。某個很有名的BLOG,當別人問為什么搜索到該BLOG文章時,列出的不同文章標題都是一樣的?答:因為工程師圖省事,是用一段JS程序來改寫某個頁面的TITLE。
TITLE就是我們打開瀏覽器顯示在左上角的東西,這個如果顯示的是具體內容的標題,當然比千篇一律的顯示該站點的名稱要符合用戶習慣。但用JS來實現(xiàn)該功能,開發(fā)上更省事,對用戶來說也沒什么大區(qū)別。按照搜索引擎的只要適應用戶原則,應該對該做法一視同仁。但搜索引擎不是人,它很笨。它不會看JS顯示的結果,它對JS的態(tài)度是直接跳過,只去讀它讀的懂的簡單東西。
而很不幸,一般來說TITLE是搜索引擎判斷頁面是否符合搜索詞的重要因素。所以用這個很方便的對用戶也很友好的方式,對網(wǎng)站訪問卻很吃虧。如果你想改進,就一定不能只考慮用戶,而要專門考慮搜索引擎,也就是SEO。
所以,我前面說的要學習HAO123的大腕其實他的網(wǎng)站是很適合SEO的網(wǎng)站,只要他不認為HAO123確實方便用戶,他去采用SEO技巧其實是很對路的----只要你做的本身對網(wǎng)民有用,而不僅僅是垃圾,那么期望通過搜索引擎帶來更多的網(wǎng)民訪問就無可非議。
又比如橋頁,我說的我曾經(jīng)做的類似橋頁,其實是一個排行列表。它是有一個無數(shù)LINK的,假靜態(tài)頁。但這個頁對用戶來說是有價值的,從這個頁面找所需要的東西就是很方便。雖然我做了專門對搜索引擎的優(yōu)化,但不能說我的SEO是不對的。這個頁成為搜索引擎收錄這個站點的入口。因為每個LINK后面對網(wǎng)民都有價值,所以希望他們從搜索引擎找到這些頁,就不是垃圾SEO。
其實所謂WEB2.0(我非常討厭這個詞)的一些東西恰恰無形中適應了SEO要求。比如RSS,這樣規(guī)范的XML語言對搜索引擎非常友好。所以BLOG類的站點在GOOGLE相關結果上都會排的比較高(當然了GOOGLE的規(guī)則本身也對這類站點有利,這個從其他地方能看出來,就不深說了)。還有WEB2.0站點代碼都很規(guī)范、簡潔,不為SEO考慮,這本來也是我們應該做的。早期國內門戶繁雜的頁面,混亂的代碼,影響了大家的審美是小事,代碼混亂對開發(fā)、再組織,都會是很頭疼的事。所以某種意義上,我們的大站、門戶,還不如HAO123做的好。
我們看FLICKR,沒有人會說它試圖SEO吧?但你看,它分給每個人地址就是
http://www.flickr.com/photos/xba/ 這樣簡單。僅僅這個很多站點還能做到,但它里面所有的連接,都是這樣
http://www.flickr.com/photos/xba/sets/608668/ 假靜態(tài)的地址形式,這就很考驗工程師的水平和耐心了。難道它不知道
http://www2.tianyablog.com/blogger/post_show.asp?BlogID=18398&PostID=180370... 這樣的連接,開發(fā)起來要簡單的多么?對于FLICKR的細致我們不能只佩服,要去學到它每一點小地方的用意。
所以SEO雖然產(chǎn)生了很多垃圾站點,但一個優(yōu)秀的站點,它也應該去學習SEO技術,幫助搜索引擎,也同時幫助網(wǎng)民,最重要的是這會幫助它自己。