Nutch
Nutch 是一個剛剛誕生開放源代碼(open-source)的web搜索引擎。在它的主頁有中文詳細的說明。
http://nutch.sourceforge.net/docs/zh/about.html
Lucene
Apache Lucene是一個開放源程序的搜尋器引擎,利用它可以輕易地為Java軟件加入全文搜尋功能。Lucene的最主要工作是替文件的每一個字作索引,索引讓搜尋的效率比傳統(tǒng)的逐字比較大大提高,Lucen提供一組解讀,過濾,分析文件,編排和使用索引的API,它的強大之處除了高效和簡單外,是最重要的是使使用者可以隨時應自已需要自訂其功能。 |
http://jakarta.apache.org/lucene/docs/index.html
Egothor Egothor是一個用Java編寫的開源而高效的全文本搜索引擎。借助Java的跨平臺特性,Egothor能應用于任何環(huán)境的應用,既可配置為單獨的搜索引擎,又能用于你的應用作為全文檢索之用。 | http://www.egothor.org/
Oxyus BDDBot BDDBot是一個簡單的易于理解和使用的搜索引擎。它目前在一個文本文件(urls.txt)列出的URL中爬行,將結(jié)果保存在一個數(shù)據(jù)庫中。它也支持一個簡單的Web服務器,這個服務器接受來自瀏覽器的查詢并返回響應結(jié)果。它可以方便地集成到你的Web站點中。 | http://www.twmacinta.com/bddbot/
Zilverline Zilverline是一個搜索引擎,它通過web方式搜索本地硬盤或intranet上的內(nèi)容。Zilverline可以從PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM,zip, rar等文檔中抓取它們的內(nèi)容來建立摘要和索引。從本地硬盤或intranet中查找到的結(jié)果可重新再進行檢索。Zilverline支持多種語言其中包括中文。 | http://www.zilverline.org/zilverlineweb/space/home | XQEngine XQEngine用于XML文檔的全文本搜索引擎.利用XQuery做為它的前端查詢語言.它能夠讓你查詢XML文檔集合通過使用關(guān)鍵字的邏輯組合.有點類似于Google與其它搜索引擎搜索HTML文檔一樣.XQEngine只是一個用Java開發(fā)的很緊湊的可嵌入的組件. | http://xqengine.sourceforge.net/ | | | |