《電子商務世界》雜志 本刊記者 胡坤 對搜索引擎企業(yè)來說,7年的時間也許并不長,并不足以讓他們完成從第二代到第三代的蛻變,但對互聯(lián)網(wǎng)用戶來說,7年太漫長了。 麥克·莫里茲只投資過兩個公司,但就是這兩個公司為他帶來了巨大的財富和聲譽,使他成為史上最偉大的投資者之一,因為這兩個公司是雅虎和Google——兩代互聯(lián)網(wǎng)的神話,也是兩代搜索引擎的代表。當投資雅虎成功后,他曾說:“互聯(lián)網(wǎng)是一個年輕的產(chǎn)業(yè),這里面有無數(shù)的機會,我在等待下一個雅虎!”。一年前,當他投資的Google上市后,他依然說:“互聯(lián)網(wǎng)還是一個年輕的產(chǎn)業(yè),這里面還有無數(shù)的機會,我在等待下一個Google!” 麥克·莫里茲在等待,等待下一個將會給他帶來滾滾財源的搖錢樹;記者也在等待,等待見證下一個互聯(lián)網(wǎng)神話;無數(shù)的網(wǎng)民也在等待,他們等待的是一種能夠真正滿足他們需要的、新的搜索引擎,我們將它稱為第三代搜索引擎。 7年之癢 作為互聯(lián)網(wǎng)門戶的開山鼻祖,雅虎一直被許多人頂禮膜拜,它至今仍是全球最有影響力的互聯(lián)網(wǎng)公司之一。但10年前,當楊致遠和他的同伴首次把雅虎帶到世人面前時,它還只是一個簡單、甚至有些笨拙的搜索引擎,但這沒有影響當時的人們把它奉為至寶,并把它當作第一代搜索引擎的象征。在中國,搜狐也是靠做目錄分類搜索起家,也同樣獲得了萬眾的睹目。 當1998年Google粉墨登場的時候,所有人都眼前一亮。如果說雅虎的出現(xiàn)在搜索的歷史上具有開創(chuàng)性意義的話,那么Google的出現(xiàn)則具有革命性的意義。它用機器人程序自動抓取資料取代了以往的人工分類方式,使查詢更加快捷 ;用戶獲得的不再是一個個網(wǎng)站地址,而是海量的網(wǎng)頁信息。 2002年10月9日,雅虎放棄了自己的網(wǎng)站目錄搜索,改為默認Google的搜索結果,這標志著第二代搜索引擎正式取代了第一代搜索引擎(2004年,雅虎結束了同Google的合作,推出了自己新的第二代搜索引擎,重新進入搜索市場)。在中國市場上,橫空出世的百度同樣在搜索市場上取代了新浪、搜狐,成為中國第二代搜索引擎的代表。 從1998年到現(xiàn)在,7年過去了。在這7年里,Google從小到大到上市到現(xiàn)在成為互聯(lián)網(wǎng)行業(yè)的領頭羊。7年里,全球互聯(lián)網(wǎng)用戶已經(jīng)從1億增加到了10億。7年里,互聯(lián)網(wǎng)企業(yè)經(jīng)歷了“燒錢”時代的“輝煌”、泡沫破滅時候的“落寞”以及現(xiàn)在的浴火重生。7年里,這個世界天翻地覆,但搜索引擎卻沒有根本性地進化,始終停留在第二代的窠臼里。 當然,這7年里,搜索引擎也有很多變化,比如不再是單一的網(wǎng)頁搜索,還出現(xiàn)了新聞搜索、圖片搜索、MP3搜索、本地搜索、地圖搜索等等,另外搜索的速度更快,抓取的網(wǎng)頁更多等等。但在技術上,目前的搜索引擎并沒有根本性的突破,用戶的搜索體驗并沒有根本性的改變。 7年前,我們在一個搜索引擎的輸入框里輸入一個關鍵詞,點擊搜索,我們得到了成千上萬的搜索結果,我們欣喜雀舞;今天,我們同樣在一個搜索引擎的輸入框里輸入一個關鍵詞,點擊搜索,我們更快地得到了更多的搜索結果,但我們卻愁眉不展,因為我們終于認識到:搜索結果的多少并不重要。不管我們搜索的結果有1千萬條還是1億條,很多時候我們所需要的只是其中一條。問題是,我們不知道這一條在哪里,我們無法在這千萬條中找到我們所需要的那一條。7年前如此,如今依然如此。 對搜索引擎企業(yè)來說,7年的時間也許并不長,并不足以讓他們完成從第二代到第三代的蛻變,但對互聯(lián)網(wǎng)用戶來說,7年太漫長了,我們早就已經(jīng)迫不及待地等待著第三代搜索引擎的來臨了。 第三代搜索引擎的“模樣” 第一代和第二代搜索引擎都有自己的核心技術,第一代是人工分目錄檢索,第二代是機器程序抓取網(wǎng)頁和計算機算法,由此類推,第三代搜索引擎也必然會有自己的核心技術?!暗谌阉饕婕夹g是什么?”記者以為這對搜索領域里的專家而言是一個非常簡單的問題,事實證明記者錯得很厲害。 “互聯(lián)網(wǎng)的搜索技術正在演變之中。”剛剛上任的一搜總經(jīng)理李銳對記者說。在他看來,目前的搜索引擎正處在從第二代向第三代“漸變”的過程之中,是一個“量”的積累。在目前的這個階段,很多公司都在進行一些嘗試,很難分清哪些技術是第二代的,哪些是第三代的。新浪副總經(jīng)理程炳皓同意這一點,但他同時還指出:“我們是先承認雅虎和Google的王者地位,然后才承認它們所代表的第一代和第二代搜索引擎技術的。”言下之意:只要新的王者誕生,它所代表的互聯(lián)網(wǎng)搜索技術就會自然被奉為第三代搜索引擎技術。中國搜索總裁陳沛對此有不同的看法:“互聯(lián)網(wǎng)的搜索技術從根本上只有兩種,那就是分目錄搜索和關鍵詞網(wǎng)頁搜索,未來的第三代搜索引擎只能是這兩種的融合。”然而,陳沛的這一觀點受到了許多人的抨擊,被認為過于草率?!叭绻f搜索技術只有這兩種,第三代就是這兩者的融合,那第四代呢?是不是說第三代就已經(jīng)是搜索技術的盡頭了?”一位專家這樣質疑道。 專家們在“第三代搜索引擎技術是什么?”上各執(zhí)一詞,也使得記者一頭霧水(也許現(xiàn)在談這個問題真的為時過早),但也并非一無所獲,至少在他們對第三代搜索引擎的一些描述中都有一些共性的特征。通過這些特征,我們也許能對未來的第三代搜索引擎了解一二,就像我們無法了解一位初識者的性格、為人,但我們起碼可以描述出他(她)看起來的模樣。我們認為,第三代搜索引擎應該具有以下三個“模樣”特征:智能化、個性化和社區(qū)化。 智能化:目前的搜索引擎能夠給人們提供海量的搜索結果,一次搜索往往會有成百上千頁的結果,實踐表明,很少有人會看10頁以后的搜索結果。未來的搜索引擎必須要引入人工智能技術,嘗試去理解用戶的查詢意圖,并優(yōu)先顯示用戶需要的結果。目前比較可行的智能化技術除了智能糾錯外,還有分類和聯(lián)想等。 個性化:每個人的搜索習慣和需求都不一樣,但目前的搜索引擎卻無法考慮到這一點。對于同一個關鍵詞,一個搜索引擎給予所有用戶的搜索結果都是一模一樣的。未來的搜索引擎必須要考慮到用戶的個性化需求,不僅要給出符合不同用戶需求的不同結果,連搜索結果的界面都應該有所區(qū)別。 社區(qū)化:未來搜索引擎本身就是一個社交網(wǎng)絡,通過用戶的互動交流,我們可以更快、更方便地獲取信息。另外,每個人的搜索結果都可以存儲并能和其他人分享。 誰是第三代搜索引擎 2004年8月,搜狐正式推出新的專業(yè)搜索網(wǎng)站“搜狗”(www.sogou.com),并聲稱這是“全球首個第三代中文互動式搜索引擎”。整整一年的時間過去了,如今可以肯定的只有一件事,那就是搜狐是第一個“敢”稱自己的搜索引擎是第三代的廠商,至于“搜狗”本身,恐怕沒有多少人還相信它是名副其實的第三代搜索引擎。 其實,“搜狗”的所謂“互動式搜索提示”是一種典型的搜索結果細分技術,的確具有一些第三代搜索引擎的智能化特征。例如:用戶輸入“綠茶”一詞,搜索引擎會快速將綠茶可能出現(xiàn)的主題進行分類,給出例如茶文化、健康知識、電影介紹、化妝品等等主題提示,用戶點擊自己所需的類別就可以輕松找到答案。但僅僅根據(jù)這一點就得出“搜狗”是第三代搜索引擎的結論,恐怕有些牽強。另外,“搜狗”并不是第一個應用互動式搜索技術的搜索引擎。早在2003年8月,當時還是“慧聰搜索”的中國搜索就已經(jīng)具有了類似智能化分類搜索(智能導航)的功能。在接受記者采訪時,陳沛明確表示:中搜的“網(wǎng)絡豬”才是真正的“第三代搜索引擎”。 事實上,在記者看來,“網(wǎng)絡豬”的確比“搜狗”具有更多的第三代搜索引擎特征,比如個性化的個人主頁和基于RSS技術的定制功能。但在競爭對手們看來,“網(wǎng)絡豬”是一大堆應用的大雜燴,就搜索引擎而言,是一個邊緣化的產(chǎn)品??陀^而言,“網(wǎng)絡豬”的確同現(xiàn)有的主流搜索引擎格格不入。但從另外一種角度來說,也許正是因為它不同于第二代主流搜索引擎,所以它更具有成為第三代搜索引擎的潛質。陳沛預計,與“網(wǎng)絡豬”類似的產(chǎn)品將會陸續(xù)出現(xiàn)并逐漸成為市場的主流。他還毫不客氣地表示,“網(wǎng)絡豬”們將會成為各搜索門戶乃至傳統(tǒng)互聯(lián)網(wǎng)門戶的終結殺手。 與陳沛的“咄咄逼人”相比,程炳皓就顯得極為內(nèi)斂和謙虛。他說:“我們從來沒有說過自己是第三代搜索引擎?!?是的,記者的確沒有從新浪方面聽到類似的話。但是,新浪在各種公開的資料中無數(shù)次地提到:新浪愛問突破了由Google、百度為代表的“關鍵字密度搜索算法”模式。而所謂的“關鍵字密度搜索算法”實際上就是機器抓取,算法排序的模式,這是第二代搜索引擎的關鍵技術。記者不知道突破了第二代搜索引擎技術的搜索引擎不是第三代是什么! 實際上,新浪不必過于謙遜。新浪的知識搜索的確具有典型的第三代搜索引擎的“社區(qū)化”特征,幾乎所有人也都認為新浪愛問正在做一個非常有意義的嘗試,也必將成為未來的趨勢,這一點從百度亦步亦趨地推出類似的“百度知道”就可看出。 在中國市場上,百度靠打敗雅虎和Google這兩個“神話”而創(chuàng)造了自己的“神話”,但百度的成功一向都建立在模仿別人的基礎之上。百度是中國搜索市場當之無愧的領導者,但在技術創(chuàng)新上,它甚至還不如中搜這樣的公司,真正的搜索技術領導者還是Google和雅虎。Google正在建立自己的用戶系統(tǒng),目的就是收集、了解用戶的使用習慣和需求,以為用戶推出個性化的搜索服務。雅虎實驗室也在研究第三代搜索引擎方面的技術。當然,要把這些技術引入中國,還需要一個本地化的過程。 仔細數(shù)來,中國已經(jīng)有不少的搜索引擎具有了第三代的某些特征,第三代搜索引擎其實離我們并不遙遠。也許有一天,代表第三代搜索引擎的王者將會在中國誕生。和記者有同樣觀點的相信還有摩根士丹利董事總經(jīng)理瑪麗·米克爾。在于今年的3月底來華密訪了兩家國內(nèi)搜索公司后,她說:“我們正在尋找下一個Google,而我堅持認為它會出現(xiàn)在中國。” 只是,希望我們不要等待得太久! 小測驗:誰更像第三代搜索引擎 本刊記者 胡坤 同學們,請安靜!現(xiàn)在開始上課。 搜狗同學,請不要東張西望!什么?你在找網(wǎng)絡豬?他今天不會來了,由他的哥哥中搜同學替他來上課。再說了,你一條狗老同一頭豬在一起算怎么回事? Google同學,怎么剛上課你就開始打瞌睡了?不要看別人,說得就是你!什么?I couldn’t catch you? 你是說你聽不懂我的話吧?Google同學啊!一定要加強本土化呀!你看人家雅虎……對了,雅虎同學,請幫忙做一下翻譯。什么?你是一搜?不好意思,又搞混了,你家兄弟也太多了!By the way! Google同學,你能不能取一個中文名字?每次我叫你的時候都覺得怪怪的。 好了,言歸正傳!今天我們要進行一場課堂測試。安靜,請安靜!今天的測試成績不會計入年終總成績,不會寫入個人檔案,不會通報家長。各位同學現(xiàn)在可以放心了吧! 今天這個測試的目的是想看看在座的哪一位更接近第三代搜索引擎。各位同學都知道,第三代搜索引擎的主要特征是智能化、個性化和社區(qū)化。但由于各位的水平有限,在個性化上幾乎沒有任何建樹,所以這一項完全取消。智能化是我們測試的重點,有三項,分別是關鍵詞糾錯、關鍵詞聯(lián)想和分類導航。在社區(qū)化方面,我們考核的是社區(qū)的互動情況。另外,我們還有一項基本的準確性測試,共5項,每項2分,總分10分。 這次只測試網(wǎng)頁和社區(qū)相關的搜索功能,不涉及圖片搜索、MP3搜索等等。愛問同學,你有什么問題嗎?是的,這次測試的重點是各位同學在智能化和社區(qū)化方面的能力,并不測試綜合實力,因此不會計算所搜索的網(wǎng)頁數(shù)量,愛問同學你就不用擔心了。 第一項測試:準確性 規(guī)則: 輸入關鍵詞“電子商務世界”,在搜索結果中,如第一項是和本 雜志相關,加2分,如排列最前的正確結果為第2~10項,加 1.5分,為11~20項的加1分,為21~30項的加0.5分。 結果: Google:第一條搜索結果即《電子商務世界》雜志網(wǎng)站,得2分。 百度:同樣是第一條,得2分。 一搜:同樣的結果排在了第二條,得1.5分。 中搜:同樣的結果排在了第三條,不過還是得1.5分。 愛問:這一結果排在第一條,得2分。 搜狗:《電子商務世界》相關得結果出現(xiàn)在第7條,得1.5分。 第二項測試:關鍵詞糾錯 規(guī)則: 輸入關鍵詞“司法考釋”,如果能正確給出糾錯提示 “司法考試”的加2分,反之0分。 結果: Google:沒有糾錯提示,0分。 百度:有糾錯提示,2分。 一搜:有糾錯提示,2分。 中搜:有糾錯提示,2分。 愛問:有糾錯提示,2分。 搜狗:沒有糾錯提示,0分。 第三項測試:關鍵詞聯(lián)想 規(guī)則: 輸入關鍵詞“電子商務世界”,在給出的相關搜索關鍵詞中,和 電子商務相關的詞匯有9條以上的加2分,6~8條加1.5分, 3~5條加1分,1~2條加0.5分,沒有為0分。 結果: Google:很遺憾,沒有給出相關的搜索關鍵詞,0分。 百度:相關的關鍵詞有3條,加1分。 一搜:令人興奮,電子商務相關的關鍵詞竟達9條之多,加2分。 中搜:難以置信,所有的10條關鍵詞都和電子商務相關。 愛問:只有3條相關關鍵詞,加1分。 搜狗:令人抓狂的結果,給出的10個相關關鍵詞中居然無一同 電子商務相關,更令人難以忍受的是,竟然還出現(xiàn)了“世 界頂 級色情”這樣的詞匯,0分。 第四項測試:分類導航 規(guī)則: 輸入關鍵詞“愛國者”,如果有相關分類導航加1分,反之0 分;如果根據(jù)導航能迅速查到“愛國者”MP3的相關信 息,再加1分。 結果: Google:沒有分類導航,0分。 百度:沒有分類導航,0分。 一搜:沒有分類導航,0分。 中搜:有分類導航,能迅速找到相關信息,加2分。 愛問:沒有分類導航,0分。 搜狗:有分類導航,可以得到相應結果,2分。 第五項測試:社區(qū)互動 規(guī)則:輸入關鍵詞“怎樣養(yǎng)花”或者“養(yǎng)花”(如果只承認“養(yǎng) 花”而不承認“怎樣養(yǎng)花”,則扣0.5分),點擊相關 的搜索,在結果中有相關的信息則得1分,信息量很 全得再0.5分,在第一頁顯示的還加0.5分。 結果: Google:在“論壇”里有很多搜索結果,但無法在 第一頁找到準確的信息,只能加1分。 百度: 在“貼吧”里輸入“怎樣養(yǎng)花”沒有結果,但 輸入“養(yǎng)花”能得到大量實用信息,加1.5分。 一搜: 在“部落”里輸入“怎樣養(yǎng)花”沒有結果,輸 入“養(yǎng)花”也只得到一條相關信息,加0.5分。 中搜: 在“論壇”里輸入“怎樣養(yǎng)花”沒有結果,輸 入“養(yǎng)花”后得到了眾多結果,但在10條以 后才找到了一條相關的信息,加1分。 愛問 : 點擊“知識”,輸入“怎樣養(yǎng)花”,立刻得到海 量的相關信息,2分。 搜狗:在“說吧”里沒有任何結果,0分。 成績匯總 準確性 關鍵詞糾錯 關鍵詞聯(lián)想 分類導航 社區(qū)互動 總分 名次 Google 2 0 0 0 1 3 6 百度 2 2 1 0 1.5 6.5 3 一搜 1.5 2 2 0 0.5 6 4 中搜 1.5 2 2 2 1 8.5 1 愛問 2 2 1 0 2 7 2 搜狗 1.5 0 0 2 0 3.5 5 好了,激動人心的時刻到了!大家請看最后的成績匯總(見上圖)! 現(xiàn)在我宣布,此次測試的第一名是中搜同學。??!中搜同學,你竟然激動得哭了!什么?搜狗同學咬了你一口?搜狗同學,這就是你的不對了,我要批評你。你的行為太粗魯、太不禮貌了,其實也大可不必嘛!目前大家都才剛剛沖出起跑線,相互間的差距并不大嘛!只要多動腦筋,刻苦學習,完全是可以后來居上的嘛!至于其他測試成績比較好的同學,你們也不要驕傲。這次的成績只能說明你們比較像第三代搜索引擎而已,要想成為真正的第三代搜索引擎,你們還有很長的一段路要走。 希望大家好好學習,天天向上! 好了,今天到此為止。下課!■ |
![]() 《電子商務世界》雜志 《電子商務世界》雜志 E-Business World 財富新知 網(wǎng)上淘金 第一本講述如何利用電子商務來獲取收益的全新財富經(jīng)濟類媒體。 定位于期望和已經(jīng)應用電子商務手段來創(chuàng)造財富和善于接受新生事物并敢于嘗試的企業(yè)經(jīng)營者、中高層管理者和思想活躍勇于創(chuàng)新的新知者。 由電腦報與機械工業(yè)信息研究院聯(lián)合主辦,中國電子商務協(xié)會唯一指定會刊,機械工業(yè)出版社出品發(fā)行。 雜志內(nèi)容全面關注與人們生活工作密不可分的電子商務應用,欄目包括:資訊、評論、封面故事、對話、淘金路(故事、創(chuàng)業(yè)、營銷)、誠信、支付、企業(yè)、安全、硬件、人才、消費、生活等。生動的故事、詳實深入的報道,讓人們感受到電子商務帶來的變革,帶領人們走入電子商務時代,幫助人們利用電子商務來挖掘獲取商機。 |