據(jù)國外媒體報道稱,在經(jīng)過近二年的開發(fā)后,Powerset終于將揭開其“自然語言”技術(shù)的面紗,這一技術(shù)能夠使與搜索引擎的溝通更輕松。不同與Google、雅虎、微軟等搜索引擎使用的“關(guān)鍵字”系統(tǒng),Powerset的算法能夠理解用普通英語詞匯提交的搜索請求。這一差別從理論上意味著,通過以簡單問題的形式━━例如“What did Steve Jobs say about Apple?”,而不是不符合語法的“亂七八糟的關(guān)鍵字“Apple Steve Jobs said”,用戶可以獲得更精確的搜索結(jié)果。
Powerset的合伙創(chuàng)始人、首席執(zhí)行官巴尼將利用關(guān)鍵字搜索比作是與一個2歲的孩子說話。他說,從某種意義上來說,你會為能夠與他說法感到高興,但你希望他長大,能夠與他進(jìn)行真正的對話。
這并非第一個試圖理解簡單英語的搜索引擎,但Powerset引起了更多的關(guān)注,因?yàn)樗S可了帕洛阿爾托研究中心(PARC)的自然語言技術(shù)。PARC的頂級自然語言專家卡普蘭目前擔(dān)任了Powerset的首席技術(shù)和科學(xué)官員。巴尼在上周接受采訪時說,我們擁有有史以來最棒的自然語言搜索技術(shù)。
周一上午,Powerset在TechCrunch舉辦的會議上展示了其第一個公開預(yù)覽版本。Powerset已經(jīng)將測試人員數(shù)量擴(kuò)大到了16000人,在目前的測試階段,它將只索引Wikipedia上的內(nèi)容。
Powerset相信它的技術(shù)優(yōu)于Google,在搜索相同的問題時,Powerlabs也會返回與競爭對手相同的答案。Powerset要求用戶在輸入另一次搜索請求前選擇哪個搜索引擎能夠提供更好的搜索結(jié)果。巴尼表示,Google是搜索之王,它的系統(tǒng)能夠完成令人難以置信的任務(wù),但我們認(rèn)為它已經(jīng)遭遇了平臺效應(yīng)。
規(guī)模大得多的依靠關(guān)鍵字搜索技術(shù)的廠商沒有能夠?qū)oogle掀下馬來。盡管雅虎、微軟在搜索業(yè)務(wù)上投入了巨資,在過去的三年中英特爾的市場份額一直在穩(wěn)步提高,現(xiàn)在在互聯(lián)網(wǎng)搜索市場上的份額超過了50%。
但是,即使Google的官員也承認(rèn),目前的搜索技術(shù)在預(yù)測人們的搜索請求方面還不夠好。這也是自2005年年底以來Google招聘了數(shù)千名員工,在研發(fā)上投入近22億美元的原因。
在1990年代,Ask Jeeves開始開發(fā)自然語言搜索技術(shù),但它向用戶提供了大量絲毫不相干的搜索結(jié)果;最近,紐約的Hakia一直在開發(fā)自然語言搜索技術(shù),但沒有在市場上造成什么影響。
Forrester Research的分析師沙琳對Powerset的前景表示懷疑。她懷疑Powerset能夠理解人們用來搜索相同信息的問題的所有不同表達(dá)形式,因?yàn)橛嬎銠C(jī)在識別語言中的同義詞和其它微妙差別方面還有困難。她說,沒有人的參與,計算機(jī)理解許多詞匯是很困難的