數(shù)字文化建設(shè)的有關(guān)問(wèn)題分析
作者:??讖?qiáng)
摘要:
文化數(shù)據(jù)資源因其種類(lèi)龐雜、數(shù)量眾多、涉及面廣而長(zhǎng)期無(wú)法形成統(tǒng)一的數(shù)宇化模式。但在文化遺產(chǎn)保護(hù)、公共數(shù)宇文化服務(wù) 等不同領(lǐng)域均有各具特色的數(shù)字化建設(shè)成果。2001年,財(cái)政部和國(guó)家文物局聯(lián)合啟動(dòng)了 “文物調(diào)查及數(shù)據(jù)庫(kù)管理系統(tǒng)建設(shè)”項(xiàng)目,首 次開(kāi)啟以數(shù)字化手段調(diào)查完善我國(guó)文物業(yè)的國(guó)情資料,2011年,財(cái)政部和文化部又提出公共數(shù)字文化建設(shè)概念,并重點(diǎn)實(shí)施了文化共 享工程、數(shù)字圖書(shū)館推廣工程和公共電子閱覽室建設(shè)計(jì)劃三大公共數(shù)字文化惠民工程。文化資源數(shù)字化是一項(xiàng)長(zhǎng)期、基礎(chǔ)性工作,需 要從其基本規(guī)律入手,采取科學(xué)、靈活、有效的方法,逐步實(shí)現(xiàn)聚沙成塔、集胲成裘。
談到文化資源數(shù)字化,離不開(kāi)數(shù)字文化,更要先從文化說(shuō)起。文化的概念有多種說(shuō)法,僅《辭?!分袑?duì)文化的定義就有三種:
一是從廣義來(lái)說(shuō),指人類(lèi)社會(huì)歷史實(shí)踐過(guò)程中所創(chuàng)造的物質(zhì)財(cái)富和精神財(cái)富的總和。從狹義來(lái)說(shuō),指社會(huì)的意識(shí)形態(tài),以及與之相適應(yīng)的制度和組織機(jī)構(gòu);
二是泛指一般知識(shí),包括語(yǔ)文知識(shí)在內(nèi)。例如“學(xué)文化”就指的是學(xué)習(xí)文字和求取一般知識(shí)。又如對(duì)個(gè)人而言的“文化水平”,也是指一個(gè)人的語(yǔ)文和知識(shí)程度;
三是指中國(guó)古代封建王朝所施的文治和教化的總稱(chēng)。如南齊王融《曲水詩(shī)序》:“設(shè)神理以景俗,敷文化以柔遠(yuǎn)?!?span style="font-size: 10px;color: rgb(165, 165, 165);"> [1]文化是民族生存和發(fā)展的重要力量,是強(qiáng)大的精神支撐。
當(dāng)今世界,文化更是融人政治、經(jīng)濟(jì)等各領(lǐng)域,作為軟實(shí)力的體現(xiàn),其地位和作用更是無(wú)可替代。
數(shù)字化則是近年出現(xiàn)的新概念,百度定義說(shuō):數(shù)字化就是將許多復(fù)雜多變的信息轉(zhuǎn)變?yōu)榭梢远攘康臄?shù)字、數(shù)據(jù),再以這些數(shù)字、數(shù)據(jù)建立起適當(dāng)?shù)臄?shù)字化模型,把它們轉(zhuǎn)變?yōu)橐幌盗卸M(jìn)制代碼,引入計(jì)算機(jī) 內(nèi)部,進(jìn)行統(tǒng)一處理,這就是數(shù)字化的基本過(guò)程①。
簡(jiǎn)單理解,數(shù)字化工作是對(duì)現(xiàn)實(shí)世界信息的一個(gè)描述。采用數(shù)字化手段可以產(chǎn)生一個(gè)現(xiàn)實(shí)世界的鏡像, 當(dāng)然也可以產(chǎn)生一個(gè)不同于現(xiàn)實(shí)世界的新環(huán)境。作為一種技術(shù)手段,數(shù)字化不能完全無(wú)縫的復(fù)制、記錄下現(xiàn)實(shí)世界的所有信息,但卻為建立起一個(gè)對(duì)應(yīng)于現(xiàn)實(shí)世界的物質(zhì)模型和表述其蘊(yùn)含信息提供了技術(shù)上的可能。
作為文化與數(shù)字的結(jié)合體,數(shù)字文化是信息社會(huì)特有的文化概念,是文化與科技融合的新形態(tài),是文 化表現(xiàn)形式的新階段,是促進(jìn)文化繁榮發(fā)展的新手段。數(shù)字文化的興起不僅僅促進(jìn)了文化產(chǎn)生、傳導(dǎo)、 表現(xiàn)形式的多元化和高效率,更將促進(jìn)文化內(nèi)容的極大豐富和文化產(chǎn)品的不斷創(chuàng)新,在有效緩解人民日益增長(zhǎng)的文化生活需要和不平衡不充分的發(fā)展之間的矛盾中必將發(fā)揮重要作用。[2]
相較于傳統(tǒng)文化而言,融入現(xiàn)代信息技術(shù)手段的數(shù)字文化具有較多新特點(diǎn),比如開(kāi)放性、共享性、虛擬性、創(chuàng)新性、平等性,還有更多的趨同化、草根性等等特點(diǎn),如此不勝枚舉。但從其本質(zhì)而言,建議我們不妨從兩個(gè)方面予以關(guān)注:
一是文化的數(shù)字形態(tài);
二是數(shù)字的文化表征。[3]
“文化的數(shù)字形態(tài)”是指利用現(xiàn)代信息技術(shù)對(duì)文 化和文化信息的數(shù)字化呈現(xiàn),通俗理解為“文化的數(shù)字”。1946年世界上第一臺(tái)電子數(shù)字計(jì)算機(jī)——ENINC的誕生,標(biāo)志著人類(lèi)從此拉開(kāi)了信息化時(shí)代的序幕,數(shù)字化開(kāi)始成為人類(lèi)新的技術(shù)手段。后來(lái),隨著存儲(chǔ)器的出現(xiàn),人類(lèi)發(fā)現(xiàn)計(jì)算機(jī)不僅僅用于科學(xué)計(jì)算,還可以用于管理。當(dāng)我們把文化的信息存儲(chǔ)于計(jì)算機(jī)系統(tǒng)并進(jìn)行管理時(shí),“文化的數(shù)字”就出現(xiàn)了。
文化的數(shù)字形態(tài)包含多重含義,它不僅僅是文化信息的數(shù)字化呈現(xiàn),更是文化實(shí)體表現(xiàn)的新形態(tài),也是對(duì)文化內(nèi)涵抽象表達(dá)的新模式。文化資源數(shù)字化工作是獲取文化數(shù)字形態(tài)的重要途徑。
“數(shù)字的文化表征”是指數(shù)字化的文化環(huán)境和數(shù)字文化所蘊(yùn)涵與表達(dá)的文化信息,通俗理解為“數(shù)字的文化”。數(shù)字的文化表征既包括了數(shù)字文化的信息,也包括數(shù)字化環(huán)境自身的文化特征。計(jì)算機(jī)出現(xiàn)的同時(shí)也標(biāo)志著數(shù)字的文化環(huán)境應(yīng)運(yùn)而生。
眾所周知,截至目前已經(jīng)出現(xiàn)了以個(gè)人計(jì)算機(jī)普及應(yīng)用為標(biāo)志的第一次信息化浪潮,以互聯(lián)網(wǎng)大規(guī)模應(yīng)用為標(biāo)志的第二次信息化浪潮,以物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能等廣泛應(yīng)用為標(biāo)志的第三次信息化浪潮也正在風(fēng)起云涌。這些變化無(wú)一不體現(xiàn)出數(shù)字文化環(huán)境的變遷與發(fā)展,也促進(jìn)了數(shù)字文化信息表達(dá)手段的極大豐富與提高。
數(shù)字化是產(chǎn)生現(xiàn)代信息資源的新手段,通過(guò)數(shù)字化方式獲取的信息資源也叫數(shù)據(jù)資源。文化數(shù)據(jù)資源同其他數(shù)據(jù)資源一樣,具有可復(fù)制、可再生、可關(guān)聯(lián)、可共享等基本特征。
圖:中國(guó)絲綢博物館藏品數(shù)字化互動(dòng)裝置 @文博圈
隨著現(xiàn)代信息網(wǎng)絡(luò)技術(shù),尤其是云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)等新理念、 新技術(shù)的普及與應(yīng)用,數(shù)據(jù)資源越來(lái)越海量化、越來(lái)越復(fù)雜化。文化數(shù)據(jù)資源與其他類(lèi)型的數(shù)據(jù)資源一樣,也變得更加海量與復(fù)雜。
由于文化的范疇更廣闊、內(nèi)容更豐富,不可否認(rèn),相較于其他領(lǐng)域而言, 文化數(shù)據(jù)資源的海量性和復(fù)雜度有過(guò)之而無(wú)不及。
除此之外,文化數(shù)據(jù)還有兩個(gè)有別于其他數(shù)據(jù)資源的獨(dú)有特性,即價(jià)值“永續(xù)”和范圍“無(wú)界”。
文化具有傳承性和發(fā)展性。博古而通今,溫故而知新。沒(méi)有傳承,就沒(méi)有發(fā)展。既有傳承,必需保留;若要?jiǎng)?chuàng)新,必先知舊。因此,與其他門(mén)類(lèi)的數(shù)據(jù) 資源相比而言,文化數(shù)據(jù)資源的價(jià)值是永遠(yuǎn)存在的。
當(dāng)我們記錄下一件文物的質(zhì)地、度量等本體屬性時(shí), 就相當(dāng)于留下了一份真實(shí)的檔案。文物存在時(shí),為了保護(hù),有必要利用這一數(shù)據(jù)提供應(yīng)用服務(wù);萬(wàn)一文物不在時(shí),也只有這一數(shù)據(jù)可資利用了。
從對(duì)文化的基礎(chǔ)定義和理解上可以看出,文化內(nèi)涵博大精深,輻及萬(wàn)事萬(wàn)物,普蓋古今中外,既涉及璀璨輝煌的古代文明,也包容豐富多彩的現(xiàn)實(shí)世界, 更通達(dá)遙遠(yuǎn)無(wú)盡的未來(lái)創(chuàng)造。凡有人類(lèi)活動(dòng)的痕跡, 必能留下文化的烙印。因此,據(jù)文化數(shù)字化而形成的文化數(shù)據(jù)也必然擁有無(wú)界的范圍。更何況現(xiàn)代數(shù)字化技術(shù)更在其自身數(shù)字空間的基礎(chǔ)上不斷創(chuàng)新生產(chǎn)著新的文化。
既然明確了文化數(shù)據(jù)范圍的無(wú)界特征,要對(duì)其分類(lèi)確非易事。但這項(xiàng)工作又是必須要做的。在文化領(lǐng)域,國(guó)家管理部門(mén)根據(jù)業(yè)務(wù)管理工作需要,已有不同類(lèi)別的劃分。
比如,黨的十九大報(bào)告中指出“中國(guó)特色社會(huì)主義文化,源自于中華民族五千多年文明歷史 所孕育的中華優(yōu)秀傳統(tǒng)文化,熔鑄于黨領(lǐng)導(dǎo)人民在革命、建設(shè)、改革中創(chuàng)造的革命文化和社會(huì)主義先進(jìn)文化,植根于中國(guó)特色社會(huì)主義偉大實(shí)踐。”[4]
根據(jù)原文化部和國(guó)家文物局的管理工作需要?jiǎng)澐?,現(xiàn)代的有書(shū)法、美術(shù)、戲曲、音樂(lè)、舞蹈等等,傳統(tǒng)的文化遺產(chǎn)又分為文物和非物質(zhì)文化遺產(chǎn),文物又可細(xì)分為可移動(dòng)文物和不可移動(dòng)文物等等。現(xiàn)在我們不妨換個(gè)角度,嘗試從信息技術(shù)和應(yīng)用服務(wù)的角度對(duì)文化 數(shù)據(jù)作一切分。據(jù)此,可將描述文化內(nèi)涵與外延的數(shù)據(jù)資源劃分為三類(lèi),分別是基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)。
文化基礎(chǔ)數(shù)據(jù)即是按照特定標(biāo)準(zhǔn)對(duì)文化資源的數(shù)字化描述,是文化資源提供服務(wù)的核心。常見(jiàn)的對(duì)文物本體的描述、采集非遺的影音資料、書(shū)法美術(shù)作品的影像等等都屬于這一范疇。
文化業(yè)務(wù)數(shù)據(jù)是文化生產(chǎn)部門(mén)在業(yè)務(wù)工作中產(chǎn)生的統(tǒng)計(jì)、分析等業(yè)務(wù)型數(shù)據(jù),目的是為了滿(mǎn)足文化業(yè)務(wù)運(yùn)行的需要。常見(jiàn)的調(diào)研報(bào)告、文化評(píng)論都屬于此 類(lèi)數(shù)據(jù)資源。
文化管理數(shù)據(jù)是實(shí)現(xiàn)文化管理的機(jī)構(gòu)、人員、財(cái)務(wù)等管理型數(shù)據(jù),目的是為了保證文化行業(yè)管理的需要。常見(jiàn)的年鑒統(tǒng)計(jì)資料、財(cái)務(wù)統(tǒng)計(jì)報(bào)表等均屬此類(lèi)數(shù)據(jù)。
文化基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、管理數(shù)據(jù)三者之間既有關(guān)聯(lián)聚合,也有重疊交叉,并非嚴(yán)格割裂的。很多專(zhuān)項(xiàng)數(shù)據(jù)資源往往包括其中兩者,甚至三者都有。
比如我們常說(shuō)的政務(wù)信息資源既包括基礎(chǔ)數(shù)據(jù),也有業(yè)務(wù)數(shù)據(jù),更有管理數(shù)據(jù)。之所以作此種劃分,無(wú)非是希望能夠從技術(shù)角度作一切分,以便于文化數(shù)據(jù)資源的統(tǒng)籌規(guī)劃、標(biāo)準(zhǔn)制定、存儲(chǔ)管理和應(yīng)用服務(wù)而已。
數(shù)據(jù)釆集工作也是永遠(yuǎn)在路上的。文化數(shù)據(jù)采集工作是文化建設(shè)領(lǐng)域的一項(xiàng)基礎(chǔ)工作,也是一項(xiàng)長(zhǎng)期的艱巨任務(wù)。文化數(shù)據(jù)采集與資金、技術(shù)、人才、體 制機(jī)制等多項(xiàng)因素有關(guān),既不能一蹴而就,也不能一勞永逸,往往需要設(shè)置專(zhuān)門(mén)的機(jī)構(gòu),設(shè)立專(zhuān)項(xiàng)的資金用于此項(xiàng)工作的長(zhǎng)期開(kāi)展,通過(guò)多種途徑實(shí)現(xiàn)文化遺產(chǎn)數(shù)字資源的釆集和完善。文化數(shù)據(jù)采集工作應(yīng)遵循 “方法多樣、規(guī)模適度、內(nèi)容真實(shí)、方式夠用、服務(wù) 應(yīng)用”的基本原則。
“等閑識(shí)得東風(fēng)面,萬(wàn)紫千紅總是春”。數(shù)據(jù)采集的方式方法多種多樣,豐富多彩,切勿執(zhí)著單一而局促受限,只要能夠?qū)崿F(xiàn)目標(biāo),在合理合規(guī)的情況下,不妨能用盡用。以下列出幾種常用的數(shù)據(jù)釆集途徑,以供參考。
1. 依托重點(diǎn)工作,采集基礎(chǔ)數(shù)據(jù)。數(shù)據(jù)采集工作耗資大、歷時(shí)長(zhǎng),需要調(diào)配的資源眾多,專(zhuān)項(xiàng)的普查、調(diào)查工作是獲取文化基礎(chǔ)數(shù)據(jù)的最佳機(jī)會(huì)。國(guó)家文物局已經(jīng)開(kāi)展的“文物調(diào)查及數(shù)據(jù)庫(kù)管理系統(tǒng)建設(shè)”項(xiàng)目、第三次全國(guó)文物調(diào)查、長(zhǎng)城資源調(diào)查、國(guó)有可移動(dòng)文物普查等,文化部開(kāi)展的數(shù)字圖書(shū)館推廣工程、文化信息資源共享工程、非物質(zhì)文化遺產(chǎn)調(diào) 查、全國(guó)美術(shù)館藏品普查等專(zhuān)項(xiàng)工作都在一定程度上 采集了大量的文化基礎(chǔ)數(shù)據(jù)資源。由于專(zhuān)項(xiàng)工作在覆蓋面、投入量、管理力度等方面均有較大優(yōu)勢(shì),所釆集的基礎(chǔ)數(shù)據(jù)也相對(duì)全面,權(quán)威,真實(shí)。
2. 結(jié)合行政管理,積累管理數(shù)據(jù)。通過(guò)推進(jìn)電子政務(wù)和政務(wù)信息系統(tǒng)整合共享,建設(shè)并運(yùn)行統(tǒng)一的行政審批管理平臺(tái),持續(xù)積累各類(lèi)政務(wù)信息資源數(shù)據(jù), 加強(qiáng)業(yè)務(wù)檔案和資料數(shù)據(jù)管理,是獲取管理數(shù)據(jù)的有效途徑。相比于重點(diǎn)專(zhuān)項(xiàng)工作來(lái)說(shuō),通過(guò)行政管理采 集的數(shù)據(jù)較為散亂、無(wú)序,但其優(yōu)勢(shì)是權(quán)威、可持續(xù),只要持之以恒的累積、整理,往往能夠形成專(zhuān)題系列,達(dá)到意想不到的效果。
3. 圍繞課題項(xiàng)目,豐富業(yè)務(wù)數(shù)據(jù)。課題研究也是行業(yè)常態(tài)性的工作之一。圍繞文化領(lǐng)域的專(zhuān)項(xiàng)課題研究是獲取文化業(yè)務(wù)數(shù)據(jù)的重要來(lái)源之一。這種數(shù)據(jù)采集的內(nèi)容不僅僅包括課題本身的研究成果,更要關(guān)注與其相關(guān)的調(diào)研、分析等背景性數(shù)據(jù)資料。一項(xiàng)優(yōu)秀的課題研究成果往往能帶動(dòng)一個(gè)體系的數(shù)據(jù)采集標(biāo)準(zhǔn)、方法、管理與應(yīng)用服務(wù)的發(fā)展建設(shè)。
圖:敦煌研究院官網(wǎng)|孫志軍
4. 整理資料檔案,實(shí)現(xiàn)文本數(shù)字化。系統(tǒng)整理已有的各類(lèi)業(yè)務(wù)檔案、學(xué)術(shù)專(zhuān)著、專(zhuān)題出版物、錄音影像等資料,持續(xù)開(kāi)展數(shù)字化采集工作,是建立專(zhuān)題資料數(shù)據(jù)庫(kù)的重要手段之一。尤其很多早期開(kāi)展的專(zhuān)項(xiàng)工作,因?yàn)闆](méi)有數(shù)字化的資料留存,只能通過(guò)文字錄 入、圖片掃描等數(shù)字化手段加以整理。這種資料檔案整理工作往往帶有較強(qiáng)的針對(duì)性和搶救保護(hù)性質(zhì),是耗時(shí)、費(fèi)力、枯燥的事情。但其意義重大,應(yīng)用普遍,往往是不得不用的辦法。
5. 搭建共享平臺(tái),探索交換模式。通過(guò)多種有效機(jī)制和技術(shù)手段,搭建文化資源共享交換平臺(tái),通過(guò)資源整合、數(shù)據(jù)共享方式,擴(kuò)展數(shù)據(jù)資源的來(lái)源渠道,促進(jìn)基層文化單位在數(shù)據(jù)共享與交流的過(guò)程中不斷完善數(shù)據(jù)資源建設(shè)的形式,充實(shí)基礎(chǔ)數(shù)據(jù)內(nèi)容,更在此基礎(chǔ)上形成國(guó)家層面的數(shù)據(jù)體系。數(shù)據(jù)交流才能共生,資源共享方顯價(jià)值。探索數(shù)據(jù)共享交換模式是促進(jìn)數(shù)據(jù)釆集工作實(shí)現(xiàn)良性循環(huán)的有效途徑。
6. 加強(qiáng)國(guó)際交流,擴(kuò)充數(shù)據(jù)來(lái)源。廣義的說(shuō),文化是人類(lèi)共有的財(cái)富。通過(guò)加強(qiáng)國(guó)際文化的信息交流與合作,在保證安全穩(wěn)妥的前提下,探索文化數(shù)據(jù)資源的相互交流合作模式,也是豐富文化資源類(lèi)型和數(shù)據(jù)覆蓋范圍的有效途徑之一。文化因包容共生而繁榮,文明因交流互鑒而發(fā)展。良好的國(guó)際交流氛圍, 暢通的資源共享渠道,必將為實(shí)現(xiàn)世界文化數(shù)據(jù)資源的繁榮發(fā)展創(chuàng)造有利條件。
7. 創(chuàng)新釆集模式,探索資源采集的社會(huì)化途徑。 曾有廣告說(shuō),大數(shù)據(jù)時(shí)代,隨著指尖每敲動(dòng)一下鍵盤(pán)就將產(chǎn)生出新的數(shù)據(jù)信息。這話(huà)有些夸張,但很形象。隨著移動(dòng)互聯(lián)網(wǎng)的應(yīng)用普及,也同時(shí)開(kāi)啟了自媒體時(shí)代。類(lèi)似于微信、微博等平臺(tái)上也擁有眾多有深度、有價(jià)值的文化數(shù)據(jù)資源。通過(guò)主題活動(dòng)征集、社交平臺(tái)收集、網(wǎng)絡(luò)爬蟲(chóng)搜索等方式方法,都可以獲取 到數(shù)量眾多且又擁有不可估量?jī)r(jià)值的文化數(shù)據(jù)資源。
“量力而行,先謀而后動(dòng)”。注重規(guī)模適度是數(shù)字化釆集工作的必修課,切忌眼大肚子小,貪多嚼不爛。
在國(guó)家層面的數(shù)據(jù)釆集過(guò)程中,應(yīng)注重宏觀數(shù)據(jù)的獲取,重點(diǎn)放在數(shù)據(jù)廣度的擴(kuò)展上,適當(dāng)選取有代表性、有重要價(jià)值的文化遺產(chǎn)實(shí)施深度采集?;鶎游幕瘑挝粍t應(yīng)根據(jù)自身的人力、財(cái)力和實(shí)際應(yīng)用情況等,可以在保證重點(diǎn)項(xiàng)目的前提下,適當(dāng)把重心放在微觀數(shù)據(jù)的采集上,以保證本單位的日常運(yùn)行管理和研究應(yīng)用為目的。
保證原始數(shù)據(jù)的原真性是數(shù)字化采集工作的基本原則之一。數(shù)據(jù)真實(shí)性的意義無(wú)庸多言,虛假數(shù)據(jù)的危害性非常大。很難想象一條不真實(shí)的數(shù)據(jù)能夠在管 理與應(yīng)用中發(fā)揮出積極、正面的作用。但如何保證數(shù)據(jù)的真實(shí)性卻非常復(fù)雜,排除出現(xiàn)虛假數(shù)據(jù)的主觀因素外,也不僅僅是工作理念的正確認(rèn)識(shí)問(wèn)題,還包括有技術(shù)性和方法性問(wèn)題。
首先,要保證采集對(duì)象的真實(shí)性。例如在采集文化遺產(chǎn)的原始數(shù)據(jù)時(shí),不可片面的依照已有檔案的資料數(shù)據(jù)記載。已有檔案可以作為一個(gè)歷史記錄,但隨著時(shí)間推移,文化遺產(chǎn)本身也可能會(huì)發(fā)生一些變化, 比如文物會(huì)存在殘損、缺失等情況。
此外,也不能完 全保證已有檔案記載的絕對(duì)真實(shí)性。因此,即使受時(shí) 間、人力等條件所限,不得不利用已有檔案資料的數(shù) 字化成果,也要在后期進(jìn)行必要的復(fù)核。但對(duì)文物影 像的拍攝一定要選取原物,切忌翻拍雜志、圖錄等出版物,否則就失去了此項(xiàng)數(shù)字化工作的物證意義。
其次,要保證采集方法的科學(xué)性。“工欲善其事,必先利其器。”先進(jìn)、成熟、可靠的數(shù)據(jù)采集工 具對(duì)數(shù)字化采集工作具有重要意義。在經(jīng)濟(jì)許可范圍內(nèi)要盡量選取高質(zhì)量的設(shè)備,提高數(shù)據(jù)精度、減少出錯(cuò)率。當(dāng)然一些小的技巧也能產(chǎn)生很好的效果,比如 照片拍攝過(guò)程中,在不易確定高度的器物邊放一把尺子,在不好分辨色彩的書(shū)畫(huà)、雕塑等作品后放一幅參考性的背景色譜等,這些都是不錯(cuò)的選擇。
第三,要重視質(zhì)量管理的嚴(yán)謹(jǐn)性。獲取高質(zhì)量數(shù)據(jù)的最關(guān)鍵之處不在技術(shù)而在于管理。大規(guī)模的數(shù)據(jù)采集過(guò)程中,難免會(huì)因大量的重復(fù)性勞動(dòng)造成人員疲勞、工作松懈等情況。即使在日常的業(yè)務(wù)工作中也可能會(huì)因?yàn)槭韬龆斐蓴?shù)據(jù)信息出錯(cuò)。如何保證數(shù)據(jù)質(zhì)量,需要規(guī)劃合理的工作流程、制定科學(xué)的工作管理機(jī)制,減少采集工作的復(fù)雜度,加大數(shù)據(jù)審核的頻度和工作力度,把數(shù)據(jù)質(zhì)量管理的關(guān)口前移。
數(shù)字化采集工作往往受當(dāng)時(shí)的工藝水平、經(jīng)濟(jì)實(shí)力、人才能力等條件所限,是不可能達(dá)到盡善盡美的。因此,建議擯棄一些投資大、收益少,費(fèi)工時(shí)、 意義小的采集方式。怎樣才能保證采集數(shù)據(jù)資源達(dá)到夠用標(biāo)準(zhǔn),首先一條是必須要有業(yè)務(wù)人員的參與。一定要堅(jiān)持業(yè)務(wù)主導(dǎo)原則:數(shù)據(jù)采集工作不僅僅屬于信息化的工作范疇,更是業(yè)務(wù)工作的重點(diǎn)。排除必須的技術(shù)要素外,數(shù)據(jù)采集的標(biāo)準(zhǔn)實(shí)質(zhì)上就是業(yè)務(wù)需求的 標(biāo)準(zhǔn)。
圖 16素材網(wǎng)
數(shù)據(jù)采集的目的毫無(wú)疑問(wèn)是為了應(yīng)用。但在實(shí)際工作中,我們經(jīng)常忽視這一點(diǎn),往往變成了為了釆集而釆集。如果失去了數(shù)據(jù)采集的方向,就無(wú)從談起釆集方法的科學(xué)性。
概括地說(shuō),數(shù)據(jù)應(yīng)用需求有三個(gè)層 面:宏觀管理、科學(xué)研究和公眾服務(wù)。根據(jù)不同應(yīng)用層面,其數(shù)據(jù)采集的規(guī)模、方法等都有所不同。
宏觀管理需求的數(shù)據(jù)應(yīng)用一般在國(guó)家層面,重視數(shù)據(jù)的廣度;
科學(xué)研究需求的數(shù)據(jù)一般是部門(mén)層面,重視數(shù)據(jù)的深度;
公眾服務(wù)需求的數(shù)據(jù)一般在教育和娛樂(lè)層面,重視數(shù)據(jù)的知識(shí)性、趣味性。
根據(jù)不同層面的應(yīng)用需求,釆集整理不同類(lèi)別的數(shù)據(jù)至為重要。只有量體裁衣,方能事半功倍。
數(shù)據(jù)管理是文化資源數(shù)字化工作的核心內(nèi)容之一,是數(shù)據(jù)資源應(yīng)用的基礎(chǔ),其內(nèi)容包括數(shù)據(jù)存儲(chǔ)、 整理、傳輸、交換、共享等諸多環(huán)節(jié)。數(shù)據(jù)傳輸依托于有形或無(wú)形的網(wǎng)絡(luò)體系,數(shù)據(jù)交換與共享在技術(shù)層面的關(guān)鍵要素是遵循統(tǒng)一的標(biāo)準(zhǔn),其核心難點(diǎn)在于機(jī)制、 體制問(wèn)題。以下我們重點(diǎn)談一下數(shù)據(jù)存儲(chǔ)和資源整理。
存儲(chǔ)的最終目的是為了使用。因此,數(shù)據(jù)存儲(chǔ)工 作的重點(diǎn)是保證數(shù)據(jù)的安全和應(yīng)用的便捷性。針對(duì)文化數(shù)據(jù)資源實(shí)際,有以下幾點(diǎn)關(guān)于數(shù)據(jù)存儲(chǔ)的建議可供參考。
圖:騰訊云
1. 集中與分布相結(jié)合。隨著信息技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)帶寬不斷擴(kuò)充,數(shù)據(jù)存儲(chǔ)與傳輸?shù)钠款i問(wèn)題會(huì)越來(lái)越小。因此,數(shù)據(jù)集中與分布存儲(chǔ)都有可能, 可以根據(jù)實(shí)際情況靈活選擇。
建議在國(guó)家與省級(jí)行政管理層面可以集中存儲(chǔ)文化管理數(shù)據(jù)和必須的業(yè)務(wù)數(shù)據(jù),以及基層單位的數(shù)據(jù)資源目錄;基層文化單位則可以分布存儲(chǔ)詳細(xì)的、豐富的全部數(shù)據(jù)。以此形成統(tǒng)分結(jié)合的動(dòng)態(tài)數(shù)據(jù)存儲(chǔ)體系,既便于統(tǒng)一管理,也便 于各自維護(hù)。
2. 小成本,多副本。文化的數(shù)據(jù)量龐大,就目前現(xiàn)狀而言不可采用完全統(tǒng)一的存儲(chǔ)模式,應(yīng)該靈活選擇。針對(duì)更新實(shí)時(shí)性不高的數(shù)據(jù)(比如文物、藝術(shù)品的本體描述信息,在一定時(shí)間內(nèi)基本上不會(huì)發(fā)生大的變化),在數(shù)據(jù)存儲(chǔ)介質(zhì)的選擇上建議以適用為原則,注重多材質(zhì)、多套件、經(jīng)濟(jì)型的選擇。比如,采取磁盤(pán)陣列、磁帶、光盤(pán)等多種組合方式,保留多個(gè)存儲(chǔ)副本,以保證數(shù)據(jù)安全。
3. 應(yīng)用與保存分開(kāi)。無(wú)須多言,估計(jì)很多部門(mén)都 不會(huì)把自己的核心數(shù)據(jù)直接拿出來(lái)提供應(yīng)用服務(wù)。這 種管理方式不能簡(jiǎn)單的定義為保守主義,保護(hù)核心數(shù) 據(jù)的安全應(yīng)是第一位的,沒(méi)有錯(cuò)誤可言。只是在具體操作時(shí),可以通過(guò)一些技術(shù)處理,達(dá)到既保證數(shù)據(jù)安全,又能廣泛提供應(yīng)用的目的。
首先是將核心存儲(chǔ)數(shù)據(jù)與應(yīng)用數(shù)據(jù)分開(kāi),“應(yīng)用”數(shù)據(jù)由核心數(shù)據(jù)中提取加工而來(lái),與“原始”數(shù)據(jù)要做到物理上的分隔;其次,可以分散提供應(yīng)用內(nèi)容,做到小規(guī)模、多層面, 既保證應(yīng)用效率,也避免整體安全隱患,當(dāng)然這種“分散”絕不是“散亂”,在機(jī)制、架構(gòu)上應(yīng)是統(tǒng)一的,否則就加大了管理的難度。
4.重視備份。數(shù)據(jù)備份的重要性毋庸置疑,但如 何做到科學(xué)、合理的備份卻并不容易。如果對(duì)所有文 化數(shù)據(jù)都采用系統(tǒng)應(yīng)用級(jí)備份,多多少少是有些浪費(fèi) 資源的,不妨根據(jù)實(shí)際情況多采用常態(tài)、多點(diǎn)的冷備 方式。在條件不具備的情況下,甚至不必要一定將存 儲(chǔ)介質(zhì)存放在環(huán)境要求較高的機(jī)房環(huán)境,只要采用多 點(diǎn)模式,能夠保護(hù)備份介質(zhì)的不丟失、不損壞,就能 滿(mǎn)足數(shù)據(jù)備份的基本要求了。但數(shù)據(jù)備份點(diǎn)的選擇卻 非常重要,一定要選擇安全的場(chǎng)所,條件允許的情況 下,既要考慮同城備份,也要考慮異地容災(zāi)。
文化數(shù)據(jù)整理是對(duì)文化數(shù)據(jù)進(jìn)行的審核、校正、 梳理、加工,建立各類(lèi)專(zhuān)題數(shù)據(jù)庫(kù),為不同需求的應(yīng) 用服務(wù)做好準(zhǔn)備的過(guò)程。數(shù)據(jù)整理既有對(duì)原始“數(shù) 據(jù)”的使其“規(guī)范”化操作過(guò)程,也包括把原始“數(shù)據(jù)”轉(zhuǎn)化為“資源”、“信息”、“知識(shí)”和“產(chǎn) 品”的過(guò)程[5]。但數(shù)據(jù)整理不是一項(xiàng)孤立的工作,與文化數(shù)據(jù)資源建設(shè)的諸多環(huán)節(jié)都有著廣泛聯(lián)系。
1. 整理以應(yīng)用為目的。數(shù)據(jù)整理工作一定是以數(shù) 據(jù)應(yīng)用為目的的,否則就只能是盲目的“調(diào)整”,而 且調(diào)整以后還要調(diào)整。只有充分考慮并科學(xué)的分析應(yīng) 用需求,才能合理規(guī)劃、有效部署數(shù)據(jù)整理的方式 方法。
2. 整理從采集開(kāi)始。嚴(yán)格意義上說(shuō),數(shù)據(jù)整理工 作在數(shù)據(jù)采集時(shí)就需要同步開(kāi)展了,具體表現(xiàn)為數(shù)據(jù) 質(zhì)量的監(jiān)督管理和實(shí)時(shí)審核,實(shí)現(xiàn)數(shù)據(jù)質(zhì)量管理的關(guān) 口前移。如果采集的原始數(shù)據(jù)就已經(jīng)非常規(guī)范、科 學(xué)、有效了,后期的數(shù)據(jù)整理重點(diǎn)就可以放在組合歸 類(lèi)、挖掘分析等層面’勢(shì)必就減少了工作的復(fù)雜度。
3. 整理不是改變。數(shù)據(jù)整理的目的是使已有的數(shù) 據(jù)更規(guī)范、更科學(xué)、更易用,但一定要注意方式、方 法,隨意改變數(shù)據(jù)的性質(zhì)' 內(nèi)容是一大禁忌。在數(shù)據(jù) 整理過(guò)程中,可以有類(lèi)似于合并同類(lèi)項(xiàng)、釆用標(biāo)準(zhǔn)用 詞替代習(xí)慣用語(yǔ)等操作手段,但不可隨意擴(kuò)大數(shù)據(jù)內(nèi) 容范圍、更不可無(wú)中生有。為了保證數(shù)據(jù)的原真性, 在做數(shù)據(jù)整理工作前,一定要對(duì)原始“數(shù)據(jù)”做好妥 善的備份,以備整理過(guò)程中若發(fā)生錯(cuò)誤時(shí)可以隨時(shí)查 看原始檔案,及時(shí)修正錯(cuò)誤。
前文提過(guò),數(shù)據(jù)應(yīng)用有三個(gè)層面:宏觀管理、科學(xué)研究、公眾服務(wù),分別對(duì)應(yīng)于管理人員、研究人員和社會(huì)公眾,各自服務(wù)于政府、行業(yè)和社會(huì)。
管理人員的數(shù)據(jù)應(yīng)用重點(diǎn)在于數(shù)據(jù)的統(tǒng)計(jì)、分析、查詢(xún)等, 數(shù)據(jù)內(nèi)容一般在內(nèi)部網(wǎng)絡(luò)體系中運(yùn)行,其目的是為業(yè)務(wù)管理和行政決策提供科學(xué)的參考依據(jù),同時(shí),也為相關(guān)部門(mén)協(xié)同管理提供數(shù)據(jù)支持;研究人員的數(shù)據(jù)應(yīng)用大部分在單機(jī)或者內(nèi)部網(wǎng)絡(luò)體系,少量在外網(wǎng)運(yùn)行,對(duì)數(shù)據(jù)的深度要求較高,要求提供數(shù)據(jù)查詢(xún)和信息定制服務(wù);社會(huì)公眾的數(shù)據(jù)應(yīng)用主要在于數(shù)據(jù)的查 詢(xún)和產(chǎn)品的使用,需要數(shù)據(jù)有足夠的知識(shí)性和趣味性。
也可以適應(yīng)教育、科研、娛樂(lè)等需要,為影視、 動(dòng)漫、游戲生產(chǎn)提供基礎(chǔ)數(shù)據(jù)資料,促進(jìn)相關(guān)文化產(chǎn)業(yè)的發(fā)展。因此,針對(duì)不同的數(shù)據(jù)應(yīng)用對(duì)象需要通過(guò)不同的途徑,提供不同的數(shù)據(jù)類(lèi)型。
文化數(shù)據(jù)資源應(yīng)用的方式多種多樣,包括內(nèi)部查詢(xún)、網(wǎng)站發(fā)布、研究報(bào)告、資料出版、產(chǎn)品制作等。 按數(shù)據(jù)應(yīng)用的內(nèi)容劃分,有簡(jiǎn)單數(shù)據(jù)應(yīng)用(如數(shù)據(jù)查詢(xún))和復(fù)雜數(shù)據(jù)應(yīng)用(如數(shù)據(jù)挖掘分析);按數(shù)據(jù)應(yīng)用的渠道劃分,有在線(xiàn)數(shù)據(jù)應(yīng)用(如網(wǎng)上發(fā)布)和離線(xiàn)數(shù)據(jù)應(yīng)用(如光盤(pán)發(fā)行);按數(shù)據(jù)應(yīng)用的商業(yè)模式劃分,有免費(fèi)數(shù)據(jù)應(yīng)用和收費(fèi)數(shù)據(jù)應(yīng)用。
數(shù)據(jù)應(yīng)用的總體原則應(yīng)是多種類(lèi)型結(jié)合,多條渠道結(jié)合。具體采用什么樣的數(shù)據(jù)應(yīng)用方式,與數(shù)據(jù)應(yīng)用的對(duì)象和數(shù)據(jù)提供的內(nèi)容有關(guān),應(yīng)該靈活處理、區(qū)別對(duì)待。
數(shù)字文化建設(shè)是一項(xiàng)復(fù)雜、龐大的工程,涉及面廣、工作量大,在實(shí)施文化資源普查、文化遺產(chǎn)保護(hù)、文化藝術(shù)創(chuàng)作、公共文化服務(wù)、文化市場(chǎng)管理、 文化產(chǎn)業(yè)發(fā)展、對(duì)外文化交流等各項(xiàng)工作中都發(fā)揮著重要作用。
以上僅是結(jié)合文化數(shù)字化領(lǐng)域的工作實(shí)踐,對(duì)數(shù)字文化及其文化數(shù)據(jù)采集、管理和應(yīng)用環(huán)節(jié)的一些膚淺認(rèn)識(shí),內(nèi)容不夠全面,也不成體系,且難免存在偏頗與錯(cuò)誤之處,在此提出來(lái)與大家共同分享、討論,以期為數(shù)字文化建設(shè)工作的科學(xué)發(fā)展略盡微薄之力。
作者簡(jiǎn)介:??讖?qiáng),男,文化部信息中心總工程師,主要研究方向:網(wǎng)絡(luò)安全和信息化規(guī)劃管理、電子政務(wù)和數(shù)據(jù)資源建設(shè)。
聯(lián)系客服