在電腦未發(fā)明前,查資料不是一件容易的事,想要從一本書中找到某個(gè)關(guān)鍵詞要花不少時(shí)間,更別說(shuō)從圖書館里找了。數(shù)字化時(shí)代的到來(lái),讓資料查找上升了一個(gè)“維度”。
怎么形容這上升的一個(gè)維度呢?《三體Ⅲ》中做了精彩的比喻,說(shuō)從四維看三維,三維完全暴露在四維之下,能看到無(wú)限的細(xì)節(jié),從四維干預(yù)三維,可以完全無(wú)傷地把一個(gè)人的腦子取出來(lái)。
信息的數(shù)字化也是如此。 實(shí)物檔案的數(shù)字化是一次劃時(shí)代的變革,它讓我們很輕易就能從海量信息中找到所需信息。不管是工作還是學(xué)習(xí)中,使用電子版的閱讀材料和筆記記錄,我們都能方便地進(jìn)行知識(shí)管理和查找。
本文的主要內(nèi)容正是為本地搜索引擎的建立提供一些思路。
01
文件搜索引擎
本地搜索引擎的建立可以參考谷歌、百度搜索引擎的做法,大致步驟是:
1、爬蟲收集信息(我們自己制作/下載的電子文檔)
2、建立索引數(shù)據(jù)庫(kù)(軟件自動(dòng)生成)
3、用戶使用搜索引擎(我們使用搜索軟件)
文件搜索的使用頻率最高,通常只要做好“命名和分類”就能進(jìn)行高效搜索,這一點(diǎn)在《文件管理》一文中已有介紹,適用于絕大多數(shù)情況。
使用的搜索軟件包括:Listary + Everything。
1、一般的文件:
按 Ctrl + Q 喚出 Listary 工具欄進(jìn)行搜索
2、稍復(fù)雜的文件:
在 Listary 中設(shè)置關(guān)鍵字'e' 來(lái)調(diào)用 Everything 進(jìn)行搜索。
3、當(dāng)前目錄的文件:
在 Listary 中設(shè)置關(guān)鍵字'ee' 來(lái)調(diào)用 Everything 進(jìn)行搜索。
注意:不是調(diào)出 Listary 工具條搜索,而是直接在當(dāng)前目錄輸入'ee',然后輸入要搜索的內(nèi)容。
02
圖片搜索引擎
圖片搜索和文件搜索的不同在于,很多時(shí)候搜索到的圖片文件需要查看才能知道是不是要找的文件,所以搜索軟件得要有預(yù)覽功能。在新版的 Everything 中就加入了圖片預(yù)覽功能。
1、通常的搜索方法:
在 Everyting 中使用通配符“pic:”就能進(jìn)行圖片過濾。
2、快捷的搜索方法:
省去每次搜索都要輸入通配符“pic:”的煩惱,我們可以使用 Listary 來(lái)調(diào)用 Everything 搜索,同時(shí)加入搜索參數(shù)。
3、文檔搜索預(yù)覽:
Everything 也支持常見文檔格式的搜索預(yù)覽,包括 Word、PPT、Excel、PDF等。
03
全文搜索引擎
和圖片搜索一樣,我們也需要查看一些文檔里面的內(nèi)容,而不僅僅是文檔名稱。特別是你只模糊記得一些詞語(yǔ),而要找的文件名稱叫什么都不知道的時(shí)候,全文搜索就派上大用處了。
換句話說(shuō),我們可以借助全文搜索功能來(lái)打造個(gè)人的電子圖書館。
FileLocator Pro 正是一款為此而生的搜索軟件,也可能是目前 Windows 下最好用的全文搜索軟件。除了支持絕大多數(shù)文檔文件外,也支持壓縮文件的內(nèi)容搜索,也支持通配符表達(dá)式。
1、普通的全文搜索:
在 Listary 中設(shè)置關(guān)鍵字'f' 來(lái)調(diào)用 FileLocator Pro 進(jìn)行搜索。
這個(gè)方法主要是用于快速調(diào)用 FileLocator Pro,搜索范圍和內(nèi)容都在需要稍后進(jìn)行。
2、當(dāng)前目錄的全文搜索:
在 Listary 中設(shè)置關(guān)鍵字'ff' 來(lái)調(diào)用 FileLocator Pro 進(jìn)行搜索。
這是使用最多的情況,我們通常只需要對(duì)當(dāng)前目錄進(jìn)行全文搜索,如果全盤搜索的話,花費(fèi)的時(shí)間實(shí)在太久了。
3、建立索引數(shù)據(jù)庫(kù)
FileLocator Pro 也支持文件的 Unicode 十六進(jìn)制編碼內(nèi)容搜索,但用得上的情況很少。我們甚至要排除掉這個(gè)功能,因?yàn)椴榭匆粋€(gè)較大文件的 Unicode 十六進(jìn)制編碼時(shí),會(huì)因?yàn)?strong>讀取內(nèi)容過多而導(dǎo)致軟件崩潰。
此外,我還可以手動(dòng)創(chuàng)造常用文件夾的索引數(shù)據(jù)庫(kù)來(lái)加快全文搜索的速度。
結(jié)尾
聯(lián)系客服