CNET 科技資訊網(wǎng) 8月16日國際報道 加州大學(xué)伯克利分校正在創(chuàng)建一座跨學(xué)科的研究中心,用于研究高級搜索技術(shù),并在勸說包括Google在內(nèi)的搜索巨頭參加該計劃。
很多美國大學(xué)都有類似計劃,他們的目的是解決互聯(lián)網(wǎng)搜索的爆炸性增長,以及該領(lǐng)域出現(xiàn)的其它復(fù)雜問題。
伯克利分校曾培養(yǎng)出了搜索方面的先驅(qū)人物Inktomi ,而且Google的CEO Eric Schmidt也是在這里獲得計算機科學(xué)博士學(xué)位。
據(jù)研究中心主任Robert Wilensky 介紹,現(xiàn)在他們已經(jīng)集結(jié)了大約20名各學(xué)科的教師,共同研究搜索技術(shù)。研究主要集中在這樣幾個方面:個人隱私,欺詐行為,多媒體搜索和個性化。
Wilensky是伯克利的計算機科學(xué)和信息管理系的教授,他說:" 我們要解決的問題正是搜索取得成功之后所產(chǎn)生的。" 盡管研究中心的大樓還在圖紙上,但是Wilensky說幾個月內(nèi)就會完成建筑設(shè)計,明年初中心就會開放。他還跟Google等搜索公司談了合作事宜。
他說:" 如果有20名對搜索感興趣的研究人員,那么讓他們一起工作,交流想法,取得的成就會遠(yuǎn)大于每個人單獨成就之和。這就像引發(fā)核反應(yīng)。" Google拒絕對此發(fā)表評論。
搜索廣告每年的業(yè)務(wù)額高達(dá)50億美元,引起了各方面對網(wǎng)絡(luò)研究和開發(fā)的興趣。這項業(yè)務(wù)不光為雅虎和Google這樣的巨頭每年帶來數(shù)十億美元的收入,還吸引了數(shù)以百計的網(wǎng)絡(luò)新貴投身搜索領(lǐng)域。
要尋找下一代技術(shù)?最好去大學(xué)里看看,眼下最成功的搜索公司就是從大學(xué)發(fā)跡的。
風(fēng)險資本家Geoff Yang說:" 大學(xué)是新思想的一個主要來源"。在斯坦福大學(xué),有兩對研究生相隔六年,幾乎是在同一間宿舍里,分別創(chuàng)建了雅虎和Google。
Lycos 也曾是搜索技術(shù)的領(lǐng)導(dǎo)者,它脫胎于卡內(nèi)基梅隆大學(xué)(CMU)。該學(xué)校的Raul Valdes - Perez 教授還研究出了一種集群搜索工具——Vivisimo。
今天的搜索問題跟五年前已是大不相同?,F(xiàn)在網(wǎng)絡(luò)上不光有書籍、論文,還有數(shù)字化的電視節(jié)目,這就要求搜索技術(shù)比以前更加優(yōu)秀。人們希望找到可以信賴的信息,希望搜索工具可以對更加復(fù)雜的問題進(jìn)行搜索。
CMU 的語言技術(shù)學(xué)會主席Jaime Carbonell 說,他的研究小組正在研究一種個性化搜索技術(shù),這將有助于解決一些隱私問題,比如大規(guī)模搜集姓名和查詢歷史等敏感數(shù)據(jù)。
CMU 的項目跟雅虎及Google已經(jīng)測試的軟件有相同的功能,不過后兩者利用各自的網(wǎng)絡(luò)搜集和存儲搜索歷史,而CMU 開發(fā)了一種插件程序,人們可以下載到PC中使用。用戶可以維護(hù)和修改個性化的信息,比如查詢歷史、偏好和喜愛的網(wǎng)站等,并記錄到一個文件中。
經(jīng)過專門設(shè)計的搜索引擎會查詢這個文件,并結(jié)合用戶的檢索項,對每次的搜索結(jié)果做出取舍,這樣個人信息就保留在用戶的電腦中,不會流失到網(wǎng)上。
Carbonell 透露,這種技術(shù)一年內(nèi)就會問世,CMU 可能會把它作為開源軟件免費發(fā)行,也可能向公司授權(quán)使用。
CMU 還在進(jìn)行一項由政府資助的長期項目,它的代號為" 標(biāo)槍" ,旨在研究問答式搜索技術(shù)。對于詞語定義或者“洛杉磯的人口是多少” 之類的百科知識,Google、MSN 、Ask Jeeves等公司已經(jīng)可以作出快捷的回答。
但是對于更復(fù)雜的查詢,比如“從舊金山到倫敦最便宜的航班是哪個?”或者“哪個大學(xué)的計算機科學(xué)系最大?”目前還很難搜索到有效的答案。
Carbonell 說:" 這是個動態(tài)的信息,你必須分析問題,在多個地方找到答案,然后進(jìn)行比較。這需要許多步驟。我們研究如何把它化為一步,并且把中間過程提交給用戶。" 他認(rèn)為,要想達(dá)到政府以及網(wǎng)絡(luò)用戶期望的功能和效率,可能還需要四五年的時間。
得克薩斯大學(xué)和賓夕法尼亞大學(xué)也在研究類似的問題。
斯坦福繼續(xù)扮演著搜索技術(shù)孵化基地的角色。自從2003年以來,Google已經(jīng)從斯坦福購買了至少兩項研究成果——其中一個是個性化搜索工具Kaltix,另一項成果則出自斯坦福計算機科學(xué)系的合作研究機構(gòu)。
斯坦福的副教授Andrew Ng 致力于人工智能技術(shù)的研究,他希望從檢索索引中提取出信息。
還有一些人憑借研究項目創(chuàng)辦了新公司。searchfox 就是這樣的網(wǎng)絡(luò)公司,它由斯坦福教授James Gibbons 和前任工程學(xué)院院長共同創(chuàng)建。這家私人持股的公司發(fā)明了一種聯(lián)合搜索引擎,可以讓用戶分享喜歡的鏈接,創(chuàng)建個性化的搜索索引。
斯坦福大學(xué)、麻省理工學(xué)院和其他的許多大學(xué)都在著手解決未來的圖書館面臨的問題——大規(guī)模的數(shù)字化。篩選和組織數(shù)以億計的數(shù)字化文件,需要新的搜索技術(shù)支持。
麻省理工學(xué)院已經(jīng)跟萬維網(wǎng)協(xié)會合作開展一項代號為Simile的計劃,研究使用" 語義" 網(wǎng)絡(luò)的下一代搜索技術(shù)。
一名參與該計劃的MIT 研究生開發(fā)了一款叫做Piggybank 的工具軟件,可以嵌入到Firefox 瀏覽器中。利用Piggybank ,人們在瀏覽網(wǎng)頁的時候可以用關(guān)鍵字進(jìn)行標(biāo)記,創(chuàng)建一個經(jīng)過注釋的本地收藏夾,并發(fā)表到一個叫做"the bank"的網(wǎng)站。
這樣,它就變成了一個" 語義瀏覽器" ,用戶可以更好的理解網(wǎng)頁上的信息。
在一次演示中,Piggybank 整合了從電影站點Boston.com和Google maps 獲得的資料,得出了飯店和電影院附近的咖啡店分布圖。用戶還可以把這些信息保存到一個數(shù)據(jù)庫檔案中(不僅僅是書簽),以后就可以根據(jù)它的屬性或者指定關(guān)鍵字進(jìn)行搜索。
麻省理工學(xué)院準(zhǔn)備向師生們推廣這些先進(jìn)的技術(shù)。
在伯克利的研究中心,Wilensky開展了一項雄心勃勃的計劃——他要解決" 大" 搜索面臨的問題。大搜索指的是分析和組織各種形式的信息(包括圖像、視頻和電子商務(wù)信息),幫助人們合成這些信息并從中提取情報。
一個主要的應(yīng)用領(lǐng)域?qū)⑹强尚哦群碗[私。比如,你從Google上搜索的內(nèi)容由多大的可信度?如何判斷一名eBay賣家是否值得信賴?
Wilensky說他的團(tuán)隊研究證明,eBay賣家的信用評價受報復(fù)性評價的影響,從而發(fā)生偏移。有不良記錄的用戶會換一個名字再次出現(xiàn),變成沒有任何紀(jì)錄。
Wilensky說,因此他的團(tuán)隊開發(fā)了一種叫做"EM trust"的算法,它采用了一種評估在線賣家誠實度的統(tǒng)計模式。這項成果有可能用于網(wǎng)站。
伯克利無線技術(shù)研究中心也準(zhǔn)備開展相關(guān)研究,而且它還有大型的移動公司作為后盾。它將吸納伯克利電機系的教授Jitendra Malik,以及計算機科學(xué)系的教授David Forsyth ,這兩者都從事計算機視覺研究。美大學(xué)掀起搜索研究熱 誰會是下個Google?
CNET 科技資訊網(wǎng) 8月16日國際報道 加州大學(xué)伯克利分校正在創(chuàng)建一座跨學(xué)科的研究中心,用于研究高級搜索技術(shù),并在勸說包括Google在內(nèi)的搜索巨頭參加該計劃。
很多美國大學(xué)都有類似計劃,他們的目的是解決互聯(lián)網(wǎng)搜索的爆炸性增長,以及該領(lǐng)域出現(xiàn)的其它復(fù)雜問題。
伯克利分校曾培養(yǎng)出了搜索方面的先驅(qū)人物Inktomi ,而且Google的CEO Eric Schmidt也是在這里獲得計算機科學(xué)博士學(xué)位。
據(jù)研究中心主任Robert Wilensky 介紹,現(xiàn)在他們已經(jīng)集結(jié)了大約20名各學(xué)科的教師,共同研究搜索技術(shù)。研究主要集中在這樣幾個方面:個人隱私,欺詐行為,多媒體搜索和個性化。
Wilensky是伯克利的計算機科學(xué)和信息管理系的教授,他說:" 我們要解決的問題正是搜索取得成功之后所產(chǎn)生的。" 盡管研究中心的大樓還在圖紙上,但是Wilensky說幾個月內(nèi)就會完成建筑設(shè)計,明年初中心就會開放。他還跟Google等搜索公司談了合作事宜。
他說:" 如果有20名對搜索感興趣的研究人員,那么讓他們一起工作,交流想法,取得的成就會遠(yuǎn)大于每個人單獨成就之和。這就像引發(fā)核反應(yīng)。" Google拒絕對此發(fā)表評論。
搜索廣告每年的業(yè)務(wù)額高達(dá)50億美元,引起了各方面對網(wǎng)絡(luò)研究和開發(fā)的興趣。這項業(yè)務(wù)不光為雅虎和Google這樣的巨頭每年帶來數(shù)十億美元的收入,還吸引了數(shù)以百計的網(wǎng)絡(luò)新貴投身搜索領(lǐng)域。
要尋找下一代技術(shù)?最好去大學(xué)里看看,眼下最成功的搜索公司就是從大學(xué)發(fā)跡的。
風(fēng)險資本家Geoff Yang說:" 大學(xué)是新思想的一個主要來源"。在斯坦福大學(xué),有兩對研究生相隔六年,幾乎是在同一間宿舍里,分別創(chuàng)建了雅虎和Google。
Lycos 也曾是搜索技術(shù)的領(lǐng)導(dǎo)者,它脫胎于卡內(nèi)基梅隆大學(xué)(CMU)。該學(xué)校的Raul Valdes - Perez 教授還研究出了一種集群搜索工具——Vivisimo。
今天的搜索問題跟五年前已是大不相同。現(xiàn)在網(wǎng)絡(luò)上不光有書籍、論文,還有數(shù)字化的電視節(jié)目,這就要求搜索技術(shù)比以前更加優(yōu)秀。人們希望找到可以信賴的信息,希望搜索工具可以對更加復(fù)雜的問題進(jìn)行搜索。
CMU 的語言技術(shù)學(xué)會主席Jaime Carbonell 說,他的研究小組正在研究一種個性化搜索技術(shù),這將有助于解決一些隱私問題,比如大規(guī)模搜集姓名和查詢歷史等敏感數(shù)據(jù)。
CMU 的項目跟雅虎及Google已經(jīng)測試的軟件有相同的功能,不過后兩者利用各自的網(wǎng)絡(luò)搜集和存儲搜索歷史,而CMU 開發(fā)了一種插件程序,人們可以下載到PC中使用。用戶可以維護(hù)和修改個性化的信息,比如查詢歷史、偏好和喜愛的網(wǎng)站等,并記錄到一個文件中。
經(jīng)過專門設(shè)計的搜索引擎會查詢這個文件,并結(jié)合用戶的檢索項,對每次的搜索結(jié)果做出取舍,這樣個人信息就保留在用戶的電腦中,不會流失到網(wǎng)上。
Carbonell 透露,這種技術(shù)一年內(nèi)就會問世,CMU 可能會把它作為開源軟件免費發(fā)行,也可能向公司授權(quán)使用。
CMU 還在進(jìn)行一項由政府資助的長期項目,它的代號為" 標(biāo)槍" ,旨在研究問答式搜索技術(shù)。對于詞語定義或者“洛杉磯的人口是多少” 之類的百科知識,Google、MSN 、Ask Jeeves等公司已經(jīng)可以作出快捷的回答。
但是對于更復(fù)雜的查詢,比如“從舊金山到倫敦最便宜的航班是哪個?”或者“哪個大學(xué)的計算機科學(xué)系最大?”目前還很難搜索到有效的答案。
Carbonell 說:" 這是個動態(tài)的信息,你必須分析問題,在多個地方找到答案,然后進(jìn)行比較。這需要許多步驟。我們研究如何把它化為一步,并且把中間過程提交給用戶。" 他認(rèn)為,要想達(dá)到政府以及網(wǎng)絡(luò)用戶期望的功能和效率,可能還需要四五年的時間。
得克薩斯大學(xué)和賓夕法尼亞大學(xué)也在研究類似的問題。
斯坦福繼續(xù)扮演著搜索技術(shù)孵化基地的角色。自從2003年以來,Google已經(jīng)從斯坦福購買了至少兩項研究成果——其中一個是個性化搜索工具Kaltix,另一項成果則出自斯坦福計算機科學(xué)系的合作研究機構(gòu)。
斯坦福的副教授Andrew Ng 致力于人工智能技術(shù)的研究,他希望從檢索索引中提取出信息。
還有一些人憑借研究項目創(chuàng)辦了新公司。searchfox 就是這樣的網(wǎng)絡(luò)公司,它由斯坦福教授James Gibbons 和前任工程學(xué)院院長共同創(chuàng)建。這家私人持股的公司發(fā)明了一種聯(lián)合搜索引擎,可以讓用戶分享喜歡的鏈接,創(chuàng)建個性化的搜索索引。
斯坦福大學(xué)、麻省理工學(xué)院和其他的許多大學(xué)都在著手解決未來的圖書館面臨的問題——大規(guī)模的數(shù)字化。篩選和組織數(shù)以億計的數(shù)字化文件,需要新的搜索技術(shù)支持。
麻省理工學(xué)院已經(jīng)跟萬維網(wǎng)協(xié)會合作開展一項代號為Simile的計劃,研究使用" 語義" 網(wǎng)絡(luò)的下一代搜索技術(shù)。
一名參與該計劃的MIT 研究生開發(fā)了一款叫做Piggybank 的工具軟件,可以嵌入到Firefox 瀏覽器中。利用Piggybank ,人們在瀏覽網(wǎng)頁的時候可以用關(guān)鍵字進(jìn)行標(biāo)記,創(chuàng)建一個經(jīng)過注釋的本地收藏夾,并發(fā)表到一個叫做"the bank"的網(wǎng)站。
這樣,它就變成了一個" 語義瀏覽器" ,用戶可以更好的理解網(wǎng)頁上的信息。
在一次演示中,Piggybank 整合了從電影站點Boston.com和Google maps 獲得的資料,得出了飯店和電影院附近的咖啡店分布圖。用戶還可以把這些信息保存到一個數(shù)據(jù)庫檔案中(不僅僅是書簽),以后就可以根據(jù)它的屬性或者指定關(guān)鍵字進(jìn)行搜索。
麻省理工學(xué)院準(zhǔn)備向師生們推廣這些先進(jìn)的技術(shù)。
在伯克利的研究中心,Wilensky開展了一項雄心勃勃的計劃——他要解決" 大" 搜索面臨的問題。大搜索指的是分析和組織各種形式的信息(包括圖像、視頻和電子商務(wù)信息),幫助人們合成這些信息并從中提取情報。
一個主要的應(yīng)用領(lǐng)域?qū)⑹强尚哦群碗[私。比如,你從Google上搜索的內(nèi)容由多大的可信度?如何判斷一名eBay賣家是否值得信賴?
Wilensky說他的團(tuán)隊研究證明,eBay賣家的信用評價受報復(fù)性評價的影響,從而發(fā)生偏移。有不良記錄的用戶會換一個名字再次出現(xiàn),變成沒有任何紀(jì)錄。
Wilensky說,因此他的團(tuán)隊開發(fā)了一種叫做"EM trust"的算法,它采用了一種評估在線賣家誠實度的統(tǒng)計模式。這項成果有可能用于網(wǎng)站。
伯克利無線技術(shù)研究中心也準(zhǔn)備開展相關(guān)研究,而且它還有大型的移動公司作為后盾。它將吸納伯克利電機系的教授Jitendra Malik,以及計算機科學(xué)系的教授David Forsyth ,這兩者都從事計算機視覺研究。