看到一篇很有趣的文章,原文:
http://www.rinf.com/news/nov05/googlefacts.html來自費樂沃的譯文:
http://web.mblogger.cn/philewar/posts/48991.aspx我在原文下追加自己的觀點,帶邊框的表格里是費樂沃翻譯的內(nèi)容。
1. 不死的cookie:
在各家搜索引擎中,Google第一個使用到2038年才過期的cookie。那個時候網(wǎng)站還被禁止使用永久有效的cookie?,F(xiàn)在,各家搜索引擎服務提供商都使用永久有效的cookie。因為沒有人對這一點有異議,因此Google的行為為整個行業(yè)設定了標準。Google的cookie在你的硬盤上放置一個唯一的標識數(shù)。不管什么時候,只要你打開Google的網(wǎng)頁,如果你的硬盤上沒有Google的cookie,Google就會給你放一個。如果你有了,Google就會讀取你的標識數(shù)并做記錄。
我覺得這個沒什么大不了,甚至應該感謝Google把痛苦留給了自己。因為Google很可能只使用這一個Cookie就能解決所有需要通過cookie解決的問題,比如為Adwords廣告商提供conversion tracking服務、檢測Adsense publisher的點擊欺詐、記錄每個用戶的使用習慣(如首頁默認語言)等等。熟悉Web開發(fā)的可以想想,單單這三個需求你需要幾個Cookie?Google只需要一個 - 只要這個Cookie能唯一的表識一臺電腦。然后所有需要通過其它cookie完成的記錄,Google都寫到了自己的數(shù)據(jù)庫中,而索引就是這個唯一的用戶標示。所以這個唯一的用戶標識保留的長度越長越好,否則同一臺電腦會被重復識別多次。cookie技術(shù)不應該滅亡,除非未來的操作系統(tǒng)們能統(tǒng)一的使用更為可靠和安全的技術(shù)來表識每臺計算機,但我實在想不出有什么比cookie更合適的標準。要是沒了這種客戶端記錄的技術(shù),WWW將會崩潰。
2. Google記錄一切他們能記錄的東西
你每做一次搜索,Google就會記錄cookie的標識數(shù)和遞交搜索的IP地址,時間日期,搜索關(guān)鍵詞和瀏覽器配置。Google越來越可能提供基于你IP地址優(yōu)化的搜索結(jié)果,因為IP地址分配和物理位置是有關(guān)系的。
有些可能為了更好地服務,比如對于某個Adwords廣告商,他理所當然的希望自己的廣告被同一個用戶點擊兩次以上時只只付一次點擊。對于Adsense Publihser們理所當然的希望同一個網(wǎng)站瀏覽者不要在看到他們已經(jīng)點擊過的廣告(不知道Google實現(xiàn)了這個沒有)。此外如果不判斷用戶的地理位置和鍵盤語言,Google是無法為Adwords廣告商提供GeoTarget的廣告服務等等。當然無需隱瞞,任何人都會對這些令人好奇地統(tǒng)計數(shù)據(jù)感興趣,特別是當你有了像Google這樣一個能形成統(tǒng)計級數(shù)據(jù)的服務的時候。需要特別一提的是,單獨一條數(shù)據(jù)記錄毫無意義,何況這些數(shù)據(jù)對應的只是一個用戶標識。
3. Google永久保存他們記錄的數(shù)據(jù)
Google內(nèi)部沒有數(shù)據(jù)保留多久的規(guī)定。有證據(jù)表明Google能夠很方便地接觸到搜集和保存的全部用戶信息。
只有永久保留才能起到統(tǒng)計的作用,但Google或許可以考慮提供一個刪除個人記錄的服務:訪問某個Google的URL,這個URL讀出用戶標識(如果有的話),刪除這個Cookie,然后刪除Google端該索引的所有記錄。但這對于用戶有什么意義呢?對于Google則是災難。
4. Google不解釋為什么他們需要這些數(shù)據(jù)
向Google發(fā)出隱私政策的查詢總是得不到回應。當紐約時報詢問Sergey Brin(Google創(chuàng)始人之一和總裁)Google有沒有因為隱私政策信息而受到法庭傳喚時,他不予置評。
可能涉及到搜索和廣告技術(shù),不知道那些公開的專利文檔上有沒有這些東西。
5. Google雇傭間諜
Matt Cutts,一位重要的工程師,曾經(jīng)為National Security Agency(譯者按:我不清楚這個組織是干什么的)工作。Google希望能夠雇傭更多的人來對搜集到的數(shù)據(jù)進行調(diào)查,這樣他們就能向華盛頓的間諜們組織叫賣值錢的信息。
GoogleGuy成了間諜-_-!!!。我覺得這個翻譯不好(原文用的是Google hires spooks,而不是Spy)。具我了解GoogleGuy絕對是一個技術(shù)人員,而非從某個特務組織挖來的專家。恰恰相反,GoogleGuy作為非官方發(fā)言人,從多種途徑幫助了很多站長(如
Google半官方對一些問題的解釋)。
在Google上搜索National Security Agency,找到
http://www.nsa.gov/about/index.cfm。從這里可以看到這個為US政府服務的機構(gòu)確實是數(shù)據(jù)處理的專家機構(gòu)。
6. Google 工具欄是間諜軟件
如果你允許使用高級選項,那么你看的每一個網(wǎng)頁都會被工具欄記錄并且傳送到Google服務器。安裝工具欄時候的隱私策略已經(jīng)承認了這一點,不過那僅僅是因為可能的起訴。Alexa的工具欄干了同樣的事情卻沒有在隱私策略中聲明,從而輸?shù)袅艘粯豆偎尽8愕氖?,Google工具欄不會在升級之前詢問你的意見,它總是靜悄悄的就完成了升級。這意味著,一旦你安裝了Google工具欄,每一次你連接到Google網(wǎng)頁(一天里有很多次吧),Google就對你的硬盤有完全的訪問權(quán)限。大多數(shù)軟件供應商,甚至微軟都會詢問你是否需要升級。Google不是這樣。任何自動升級的軟件意味著大量潛在的安全隱患。
Google的隱私聲明等基本很豐富了。我沒有注意到Google Toolbar會自己升級,但是記錄用戶訪問懷疑是真的(沒有試過)。如果Google工具欄是間諜軟件,那國內(nèi)那些公司的插件算什么?圣母瑪利亞?
7. Google的網(wǎng)頁快照是非法的
依據(jù)第九巡回法庭將美國版權(quán)法應用于互聯(lián)網(wǎng)的判例判斷,Google的網(wǎng)頁快照似乎不合法。唯一避免網(wǎng)站被Google保存快照的辦法就是在每一個頁面里面加上noarchive元標記。瀏覽者喜歡網(wǎng)頁快照,但是網(wǎng)站管理員們不喜歡。很多網(wǎng)站站長已經(jīng)刪除了網(wǎng)站上有問題的內(nèi)容,卻發(fā)現(xiàn)這些內(nèi)容依然存活于網(wǎng)頁快照。網(wǎng)頁快照應該是可以選擇加入或不加入,而不是現(xiàn)在這樣,只能選擇退出或不退出。
如果你不喜歡網(wǎng)頁快照,可以用上面的方法嘍。
8. Google不是你的朋友
到目前為止,絕大多數(shù)網(wǎng)站訪問量的75%都來自于Google。如果網(wǎng)站站長要增加流量,他們得先問問Google同不同意。如果站長們想利用Google半保密半公開的算法中的某些漏洞來得利,他們很快就會被Google懲罰,流量完全沒有了。Google沒有發(fā)布詳細公開的懲治流程。對被處罰的網(wǎng)站來說,也找不到任何上訴的途徑。Google的行為根本是無法預計的。大多時候Google甚至都不回復網(wǎng)站站長的信件。
75%訪問量都來自Google確實不是什么好兆頭,不過這是微軟和Yahoo的不對,而不是Google。如果被Google懲罰了,可以直接看Google Webmaster指南提供的解決方法,詳見
如何要求Google重新收錄被屏蔽的網(wǎng)站9. Google是隱私定時炸彈
Google每天承擔2億次的搜索,其中大多數(shù)來自美國以外。由此可見,Google已經(jīng)積累了足可以引發(fā)一場隱私災難的數(shù)據(jù)。華盛頓那些新上任的負責數(shù)據(jù)挖掘的官僚做夢都想的高效率早就被Google實現(xiàn)了。
不大明白這條。最后很想邀請原文作者到中國來喝喝牛奶,上上網(wǎng)。