得益于像Facebook、Twitter這類社交網(wǎng)站的崛起,用戶擁有了實時發(fā)布和獲取相關(guān)信息的能力。但是有新的研究表明,在這些信息內(nèi)容里面,很多鏈接所指向的網(wǎng)頁內(nèi)容已經(jīng)不翼而飛。
在當(dāng)下的媒體時代,我們會接收到大量變化迅速的信息,不管它是來自于博客、新聞網(wǎng)站還是社交網(wǎng)站。如果你非常喜歡閱讀實時信息,這肯定是一件好事。但是它也存在一個不是那么隱晦的缺陷:許多信息將會被新的內(nèi)容所覆蓋,部分內(nèi)容也在無聲中消失。有研究報告指出,那些通過Twitter分享的新聞鏈接很多已經(jīng)失效,比如說跟中東阿拉伯之春的革命的相關(guān)內(nèi)容消失了不少,這可能會引起很大的問題。
在這份研究報告中,研究人員主要把過去三年所發(fā)生的重大新聞作為調(diào)查對象,當(dāng)中包括埃及的革命、邁克爾·杰克遜的逝去、伊朗的選舉和H1N1病毒的爆發(fā)等。他們跟蹤了Twitter上的相應(yīng)分享鏈接,最終發(fā)現(xiàn)了一個驚人的結(jié)果。
在鏈接所指向的頁面里面,30%歷經(jīng)兩年半后已經(jīng)消失
研究人員指出,在過去的一年里,有11%的鏈接內(nèi)容已經(jīng)不復(fù)存在。如果把時間范圍擴展到兩年半的話,這個比例到達30%!基于這個信息“衰變”的速度,有專家認(rèn)為一年內(nèi)消失的新聞內(nèi)容會占總體的10%,剩下的則以每天0.02%的速率消失。
在這份報告里面并沒有說明新聞消息消失的原因,很有可能是網(wǎng)站把相關(guān)的內(nèi)容刪除或者轉(zhuǎn)移到別的地方去了?!犊萍紕?chuàng)業(yè)》認(rèn)為這些信息是非常有價值的,它們可以用來跟蹤歷史的發(fā)展。
其他科學(xué)家也對這些“數(shù)字?jǐn)?shù)據(jù)”的消失而感到擔(dān)憂。蘇格蘭的國家圖書館認(rèn)為那些與蘇格蘭相關(guān)的數(shù)字生活數(shù)據(jù)正在消失,他們要求政府迅速立法,允許圖書館對各大網(wǎng)站的內(nèi)容進行備份。網(wǎng)絡(luò)先驅(qū)Brewster Kahle在數(shù)字存檔這方面是富有名氣的,因為他參與了互聯(lián)網(wǎng)檔案計劃(Internet Archive),使得早期的網(wǎng)站內(nèi)容得到了存檔。
獲得社交數(shù)據(jù)不是一件易事
對于Twitter上的內(nèi)容,不管是鏈接所指向的內(nèi)容還是自身的,要收集起來都是有一點難度的。Twitter的搜索是出了名非常不靠譜的,要把一周以外的內(nèi)容搜索出來是無法保證的。有一個名叫Gnip的外部服務(wù)可以訪問Twitter完整的內(nèi)容存檔,但是它是要付費的。用戶也可以通過基于Twitter的搜索小引擎Tops對tweet進行歸檔,哪怕是非常老舊的內(nèi)容都能搜刮出來。雖然上述的兩個工具在存檔方面提供了一些便利,但是要它們和歷史研究與歸檔結(jié)合起來的話還是存在不少困難的。美國國會圖書館對Twitter的消息內(nèi)容也保留了一份存檔,但是一般用戶是不能輕易讀取得到的,而且它的內(nèi)容也不一定及時更新了。
雖然Twitter一直有說要向用戶提供一個可以下載自己內(nèi)容的服務(wù),但是具體的時間我們是無法確定的。就算用戶能夠通過Twitter的服務(wù)(或者第三方的工具或者服務(wù))來做內(nèi)容存檔,但是要從中篩選有用的歷史信息作為研究對象也是有一定難度的。不僅僅是Twitter,要獲得Facebook的內(nèi)容存檔也是一樣的困難。
那些散播在我們身邊的信息可以說是稍縱即逝的,而我們也缺乏很好的工具去把它們都記錄下來。從長期上來看,這些社交元素會對“數(shù)字失憶”造成多大的影響呢?我們的歷史又會在數(shù)據(jù)膨脹的過程中被遺忘嗎?