8月13日國際報道 Google和其它搜索引擎面臨的并非Wikia這一個新的競爭對手,而是數(shù)以百計、數(shù)以千計的競爭對手。
Wikia CEO吉爾表示,Wikia項目研究成果將進入開放源代碼領域,降低人們開發(fā)搜索引擎的成本。新搜索公司無須投入數(shù)百萬美元索引Web,開發(fā)建立搜索網頁需要的軟件,過濾空網頁和垃圾網頁,開發(fā)計算排名的算法,它們能夠在互聯(lián)網上免費發(fā)現(xiàn)這些產品。
吉爾在接受采訪時說,
要建立一個搜索站點仍然需要投入500-1000萬美元,我們希望將搜索站點的開發(fā)成本降低到500美元。我們沒有將Google看成是競爭對手,我們的競爭對手是成本。
該項目包含4個部分:
Web的索引、開發(fā)搜索引擎軟件;利用算法和人幫助過濾站點;對結果進行排名。搜索引擎中
最昂貴的部分之一是對Web的索引。企業(yè)需要購買服務器和軟件,對Web進行遍歷。
吉爾說,新創(chuàng)建的搜索公司用
在購買服務器上的成本將高達100萬美元。這不是一個好主意的原因有二個:每家搜索公司都必須投入數(shù)百萬美元重復做相同的工作,使這些數(shù)據(jù)能夠開放地被所有公司使用應該是一個好主意。我們的目標是建立供公開使用的Web遍歷數(shù)據(jù)。
對Web進行索引是成立一家新搜索公司的主要障礙之一,通過不斷的對Web進行索引,現(xiàn)有搜索引擎在不斷的提高這一門檻。搜索引擎通常每周,甚至每天都對Web進行索引。現(xiàn)在,這一時間已經縮短到了1小時,甚至更短的時間。
對Web進行索引的高成本已經成為了一種競爭壁壘。
數(shù)據(jù)挖掘研究院(HAMMER_SHI) Wikia認為它對Web進行索引的成本幾近于零,因為它要求互聯(lián)網用戶通過從Grub下載Web索引軟件幫助完成索引工作,他們將利用計算機的空閑時間對Web進行索引,并將搜索結果返回給Wikia。目前,已經有1000名用戶下載了該軟件,吉爾希望將這一數(shù)字提高到10萬以上。
Wikia正在考慮利用開放源代碼Lucene搜索引擎軟件。Wikia計劃在Lucene項目中投入更多資金,確保它能夠更好地運行,或開發(fā)自己的軟件。
搜索技術的另一個關鍵部分是決定搜索排名,確保用戶發(fā)現(xiàn)所需要內容的算法。這種算法是搜索公司的秘密,由于擔心被黑客和其他人利用而絕不會公開。Wikia決定開發(fā)一個算法,并放在互聯(lián)網上供用戶免費下載。用戶也可以對算法進行修改。
Wikia還計劃讓互聯(lián)網用戶對網頁進行過濾,并希望這能夠提供更好的搜索結果。
在完成后,Wikia搜索引擎可能會帶來收入,但這不是該項目的著眼點。
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報。