自古以來,歷代學(xué)者對古典文獻(xiàn)整理與研究一直沿襲手工操作的方式,然而自上世紀(jì)80年代后,計算機(jī)技術(shù)開始涉入到古典文獻(xiàn)研究中,對傳統(tǒng)的古典文獻(xiàn)整理與研究方法(自然也對一切需要使用古典文獻(xiàn)資料的專業(yè)研究)起到了極大沖擊。首先簡單回顧一下計算機(jī)技術(shù)在古典文獻(xiàn)研究領(lǐng)域內(nèi)發(fā)展的歷程。上世紀(jì)80年代初,我國一些圖書館、大專院校及科研機(jī)構(gòu)陸續(xù)開始大規(guī)模地利用計算機(jī)設(shè)計并建立數(shù)據(jù)庫。大致說來有兩類數(shù)據(jù)庫,一類是書目數(shù)據(jù)庫,一類是文獻(xiàn)數(shù)據(jù)庫。南京圖書館于90年代初率先建立書目數(shù)據(jù)庫,對讀者檢索有關(guān)書目起到了極大的幫助。之后,各地圖書館紛紛效尤,類似的書目數(shù)據(jù)庫很快就普及了。雖說至今各地圖書館的書目數(shù)據(jù)庫的檢索方式,仍存在機(jī)讀編碼格式不統(tǒng)一的問題,然而書目數(shù)據(jù)庫提供的方便快捷的查詢功能,對讀者來說無疑是一件大好事,具體到學(xué)術(shù)研究來說,至少為研究者提供了一個比較方便的查找有關(guān)古典文獻(xiàn)的實用工具?! ?/span>
在建立書目數(shù)據(jù)庫的同時,一些大專院校與科研機(jī)構(gòu)開始研發(fā)各自的文獻(xiàn)數(shù)據(jù)庫。從數(shù)據(jù)制作格式來說,大致可以區(qū)分為兩類,一類是圖像格式,即將按原著內(nèi)容掃描成PDF圖像文本,另一類是元數(shù)據(jù)格式,即錄入文獻(xiàn)文本內(nèi)容(或掃描并轉(zhuǎn)化為電子文本)導(dǎo)入數(shù)據(jù)庫,并轉(zhuǎn)換成可閱讀與檢索的數(shù)據(jù)庫機(jī)讀格式。一般說來,無論是PDF格式還是元數(shù)據(jù)格式,它們數(shù)據(jù)庫容量都較大,也提供了較為原始的檢索方式,為學(xué)術(shù)研究提供了不小的幫助。從上述兩類制作格式的數(shù)據(jù)庫來說,PDF圖像文本可以直接閱讀圖像文字,但總體說來不太適應(yīng)古典文獻(xiàn)整理與研究的需要。而元數(shù)據(jù)格式較為精致,初步具備了較為方便的常用的功能,可以檢索、作卡片等等。古典文獻(xiàn)數(shù)據(jù)庫可以分為兩類:一類是類目數(shù)據(jù)庫,即按“類”收錄有關(guān)圖籍,如經(jīng)學(xué)類、史學(xué)類、文學(xué)類以及甲骨文、金文或出土文獻(xiàn)資料、石刻資料等等,另一類是綜合數(shù)據(jù)庫,如《四庫全書》、《四部叢刊》、《國學(xué)寶典》之類數(shù)據(jù)庫。
計算機(jī)技術(shù)的飛速發(fā)展,為古典文獻(xiàn)研究的現(xiàn)代化提供了堅實的基礎(chǔ),其貢獻(xiàn)是有目共睹的。然而,計算機(jī)技術(shù)在古典文獻(xiàn)研究中的運用仍然存在著極為嚴(yán)重的缺陷也是不容回避的。中國大陸最早的古典文獻(xiàn)數(shù)據(jù)庫是建立于1987年河南大學(xué)的《宋人筆記檢索系統(tǒng)南宋主要歷史文獻(xiàn)》。之后,各種數(shù)據(jù)庫紛紛涌現(xiàn),比較重要的有南京大學(xué)、河南大學(xué)、蘇州大學(xué)聯(lián)合研制的《計算機(jī)甲骨文信息處理系統(tǒng)》、中國社會科學(xué)院《全唐詩》、《先秦魏晉南北朝詩》、《全上古三代秦漢三國六朝文》、《十三經(jīng)》、《全唐文》、《諸子集成》等數(shù)據(jù)庫、北京大學(xué)《全宋詩》數(shù)據(jù)庫、南京師范大學(xué)《全唐五代宋詞》數(shù)據(jù)庫、四川大學(xué)《宋會要輯稿》數(shù)據(jù)庫(與海外合作)等等。港臺古籍?dāng)?shù)字化起步較早,均采用繁體字形式。1984年臺灣中央研究院歷史語言研究所開始研發(fā)《漢籍全文資料庫》,香港中文大學(xué)則有《漢及以前全部傳世文獻(xiàn)》、《魏晉南北朝全部傳世文獻(xiàn)》、《竹簡帛書出土文獻(xiàn)》數(shù)據(jù)庫等等。其中《竹簡帛書出土文獻(xiàn)》收錄《馬王堆漢墓帛書》、《武威漢簡》、《睡虎地秦墓?jié)h簡》、《銀雀山漢簡》、《居延漢簡釋文合?!芳捌渌⒁姾啝┕?40多萬字的竹簡帛書出土文獻(xiàn),價值頗高。計算機(jī)技術(shù)在古典文獻(xiàn)整理與研究中的貢獻(xiàn)是極大的,但目前存在著缺乏統(tǒng)一領(lǐng)導(dǎo)與規(guī)劃;開發(fā)商嗜利忘義;熱門文獻(xiàn)數(shù)據(jù)重復(fù),冷門文獻(xiàn)數(shù)據(jù)罕見;技術(shù)關(guān)卡重重,難以互相兼容;功能單調(diào),難以真正為科研服務(wù);學(xué)術(shù)圈地,使人心有余而力難用等問題。解決這一問題的關(guān)鍵在于建立公共古典文獻(xiàn)數(shù)據(jù)庫和開發(fā)個性化文獻(xiàn)檢索服務(wù)系統(tǒng)兩個方面。具體說來是加強(qiáng)總體規(guī)劃,建立公共古典文獻(xiàn)數(shù)據(jù)庫;數(shù)據(jù)庫內(nèi)容與文獻(xiàn)檢索服務(wù)系統(tǒng)分離;加速確定字庫方案;徹底解決古典文獻(xiàn)版權(quán)問題;建立公平的交易平臺和發(fā)展新興學(xué)科,培養(yǎng)專業(yè)人才。值得注意的是,這些數(shù)據(jù)庫主要是提供給本單位研究人員使用的,當(dāng)然也有部分?jǐn)?shù)據(jù)庫對外開放,為其他研究者提供一定幫助。雖然這些數(shù)據(jù)庫有種種限制,但它們無疑為古典文獻(xiàn)的研究(當(dāng)然包括其它專業(yè)的學(xué)術(shù)研究)提供了方便。之后,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,各科研機(jī)構(gòu)、大專院校、各地方的圖書館、以及其它數(shù)以百計的網(wǎng)站向用戶提供收費或不收費的古籍文獻(xiàn)檢索服務(wù),甚至還提供古籍文獻(xiàn)的下載服務(wù)。顯然,這些工作的開展,為學(xué)術(shù)研究的現(xiàn)代化提供了極為有力的支持。至今為止,據(jù)筆者所查索到的除科研機(jī)構(gòu)、大專院校、各地圖書館數(shù)據(jù)庫之外,提供各種文獻(xiàn)下載的中文網(wǎng)站至少在200個以上,其中就有不少古籍文獻(xiàn)下載的網(wǎng)站。這些古典文獻(xiàn)數(shù)據(jù)庫或有關(guān)網(wǎng)站的建立,確實為古典文獻(xiàn)整理與研究乃至其它學(xué)術(shù)研究提供了極有價值的幫助。
對于以上有更好觀點的朋友,歡迎評論區(qū)評論!