最近在對博客園的搜索程序進(jìn)行改進(jìn)。博客園的搜索功能用的是Lucene.net搜索引擎,當(dāng)時博客園增加搜索功能時,Lucene.net還不支持中文分詞, 后來得到http://www.cnblogs.com/yuhen/的幫助才解決這個問題。(最近博客園的搜索程序出了問題, 暫時改用google)。
現(xiàn)在,Lucene.net中支持分詞功能, 我下載了語言處理包(Lucene.Net NLS Pack),用其中的Lucene.Net.Analysis.Cn.ChineseAnalyzer建立索引,可是每次建立索引就出現(xiàn)死鎖現(xiàn)象。看了sf.net上的這篇文章CJK Analysis maybe cause dead lock,我想到可能是Lucene.Net.Analysis.Cn中代碼有Bug,查看了Lucene.Net.Analysis.Cn中的代碼,果然有問題,在ChineseTokenizer的第148行,將dataLen == -1改為dataLen == 0, 死鎖的問題就解決了。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報。