摘要:在社會(huì)科學(xué)的研究中,空間分析占有非常重要的地位。對(duì)這一重要概念的忽略,有可能遮蔽我們對(duì)于現(xiàn)實(shí)世界的更深入了解。但是,遺憾的是,在國內(nèi)社會(huì)學(xué)的相關(guān)研究領(lǐng)域中,空間的量化分析一直是缺失的。本文試圖簡單地梳理空間分析的一些核心概念和分析技術(shù),并通過一個(gè)社會(huì)組織的實(shí)例,演示如何在社會(huì)學(xué)的分析模型中納入空間這一概念,以期對(duì)學(xué)界有所裨益。
關(guān)鍵詞:空間分析; 空間回歸; 社會(huì)組織
一、引言
在西方社會(huì)科學(xué)研究領(lǐng)域中,空間概念和技術(shù)一直得到廣泛的應(yīng)用,包括流行病學(xué)、公共衛(wèi)生與健康、人口學(xué)、社會(huì)學(xué)、政治學(xué)、公共管理等學(xué)科。在社會(huì)科學(xué)的發(fā)展史上,空間分析占有非常重要的地位。1920 年代芝加哥學(xué)派的興起,很大程度上源于對(duì)于城市空間居住形態(tài)及其機(jī)制的闡釋,隨后發(fā)展出來對(duì)于城市居住模式、居住隔離、犯罪與自殺問題、城市亞文化研究的議題,空間分析的概念一直受到重視。
社會(huì)學(xué)自創(chuàng)立之初就格外關(guān)注社會(huì)底層群體,如城市中少數(shù)群體的居住隔離與聚居,城市貧困與貧民區(qū),鄰里、社區(qū)及地方社會(huì)結(jié)構(gòu)在城市發(fā)展中的作用,城市中越軌行為的空間分布模式,城市內(nèi)的居住遷移模式,城市公共服務(wù)設(shè)施的可達(dá)性等等,都是城市社會(huì)學(xué)研究經(jīng)久不衰的經(jīng)典題目,而這些研究領(lǐng)域,都與空間分析概念緊密結(jié)合在一起。在新近的一篇文章中,羅根(John Logan) 呼吁社會(huì)科學(xué)研究更多地關(guān)注空間概念。他認(rèn)為,在當(dāng)代社會(huì)科學(xué)的發(fā)展過程中,隨著大規(guī)模包含地理信息的調(diào)查數(shù)據(jù)日益增多,空間分析正在獲得強(qiáng)勁的發(fā)展,空間分析的可用性也在不斷增長,空間分析在社會(huì)科學(xué)中有更大的研究需求。同時(shí),隨著計(jì)算機(jī)技術(shù)的發(fā)展,以及統(tǒng)計(jì)程序在集群抽樣、空間相關(guān)性、多層建模和空間回歸方面的進(jìn)展,這一研究領(lǐng)域應(yīng)該獲得越來越多的注意。
在社會(huì)中,很多現(xiàn)象具有明顯的空間聚類特征,即相似的事情在地理空間上也是彼此接近的。如自殺率具有明顯的空間聚集效應(yīng),即使控制了很多可能的變量,周邊地區(qū)實(shí)際上還是會(huì)影響觀測(cè)值,這種現(xiàn)象稱為“空間滯后”(spatial lag) ,如果忽略這一空間效應(yīng),那么模型的估計(jì)結(jié)果將會(huì)存在很大偏誤。在社會(huì)科學(xué)的研究工作中,通過空間數(shù)據(jù)的可視化,可以使學(xué)者們很容易發(fā)現(xiàn)許多有意思的現(xiàn)象。在西方城市研究的空間分析中,很多都依賴地理信息系統(tǒng)(Geographical Information System,GIS) 技術(shù)。這一分析技術(shù)在空間分析方面具有諸多優(yōu)勢(shì): 首先,很多零散的數(shù)據(jù)一旦做成地圖,很多空間特征就會(huì)一目了然,從而可以發(fā)現(xiàn)一些傳統(tǒng)研究方法容易忽略的特征。如在大都市地區(qū)不同社會(huì)群體的居住和工作在空間分布上的不同形態(tài),可能存在明顯的空間不平等現(xiàn)象。其次,快速發(fā)展的空間統(tǒng)計(jì)方法,如空間相關(guān)指數(shù)(Moran’s I) 、空間回歸分析模型(Spatial Regression Model) 等,可以修正傳統(tǒng)數(shù)據(jù)模型中可能存在的空間自相關(guān)問題,從而讓學(xué)者對(duì)不同變量之間的關(guān)系進(jìn)行更精確的分析。
近年來,社區(qū)效應(yīng)或者稱為鄰里效應(yīng)(Neighborhood Effect) ,也得到越來越廣泛的關(guān)注。 研究表明,社區(qū)環(huán)境對(duì)個(gè)體的影響并不僅僅是通過使用多層次模型(Multilevel Model) 就可以解決,也就是說,不僅僅是個(gè)體所在的社區(qū)會(huì)影響到個(gè)體的某些行為特征,他也會(huì)受到周圍社區(qū)的影響,這也是“空間滯后”的影響效果。
遺憾的是,相對(duì)于西方社會(huì)科學(xué)界日益廣泛應(yīng)用的空間概念和空間分析技術(shù),國內(nèi)社會(huì)科學(xué)界對(duì)空間概念的實(shí)證分析是非常缺乏的。究其原因,一方面是因?yàn)閹в锌臻g屬性的數(shù)據(jù)的缺乏,另一方面是因?yàn)榫唧w分析技術(shù)(包括軟件應(yīng)用) 方面的缺乏。本文試圖用簡單易懂的語言梳理空間分析的一些核心概念和技術(shù),并通過一個(gè)現(xiàn)實(shí)的社會(huì)組織的分析示例,展示在社會(huì)學(xué)中如何引入空間這一分析概念,以期對(duì)學(xué)界有所裨益。
二、空間分析模型
在本節(jié),使用一個(gè)假設(shè)的例子(上海市某中心區(qū)的5 個(gè)街道) ,簡單介紹空間分析中的一些重要概念和計(jì)算方法,包括空間相關(guān)性、空間相鄰性、空間權(quán)重、空間滯后量、空間相關(guān)系數(shù)、空間回歸模型。
(一) 空間相關(guān)性
對(duì)于空間相關(guān)性的研究,最早起源于對(duì)倫敦地區(qū)霍亂的分析。19 世紀(jì),隨著倫敦地區(qū)的快速城市化,大量人口涌入倫敦地區(qū)。但是,由于公共衛(wèi)生設(shè)施的不足,倫敦受到霍亂的嚴(yán)重沖擊。在當(dāng)時(shí),人們一致認(rèn)為霍亂是由空氣傳播的。John Snow 對(duì)這個(gè)觀點(diǎn)頗為懷疑,通過分析1854 年英國Broad 大街的霍亂爆發(fā)地點(diǎn),他發(fā)現(xiàn),死亡發(fā)生地都在Broad 街道中部一處水源(水井) 周圍,有明顯的地理規(guī)律,而市內(nèi)其它水源周圍極少發(fā)現(xiàn)死者(見圖1) 。通過進(jìn)一步調(diào)查,他發(fā)現(xiàn)這些死者都飲用過這里的井水。據(jù)此,他最終確定了霍亂的源頭及傳播機(jī)制。這一研究開啟了學(xué)者對(duì)于空間相關(guān)分析的關(guān)注。
從技術(shù)層面講,通常情況下,在我們使用最小二乘法進(jìn)行回歸分析的時(shí)候,假設(shè)我們關(guān)心的變量Y 有n個(gè)觀測(cè)值y1、y2、y3、……、yn,一般我們假設(shè)這些觀測(cè)值之間是相互獨(dú)立并且服從同一分布的,均值為μ,方差為σ2 (iid 假設(shè)) 。但是,如果觀測(cè)值之間存在空間相關(guān),通過經(jīng)典檢驗(yàn)的結(jié)果將是有偏的。如果yi之間存在空間相關(guān),如觀測(cè)值yi與yj在空間上隔得越近相似性越大,那么其方差將會(huì)大于σ2 ; 這種相關(guān)導(dǎo)致均值的真實(shí)標(biāo)準(zhǔn)誤近似于:
對(duì)于存在空間相關(guān)性的數(shù)據(jù),如果忽略這種相關(guān)性,會(huì)使得基于獨(dú)立同分布假設(shè)(iid) 的統(tǒng)計(jì)檢驗(yàn)出現(xiàn)嚴(yán)重的問題,將會(huì)導(dǎo)致對(duì)數(shù)據(jù)真實(shí)方差(或標(biāo)準(zhǔn)誤) 的低估: σ < σy; 根據(jù)公式Z = b /σ,如果σ 被低估,那么統(tǒng)計(jì)值Z 值就會(huì)被高估; 如果高估了統(tǒng)計(jì)值,會(huì)使得研究者更容易拒絕原假設(shè),而這種拒絕是錯(cuò)誤的。而且,更為嚴(yán)重的是,這種作用并不會(huì)隨著樣本量的增大而消失。
(二) 空間相鄰性
假設(shè)上海某區(qū)的5 個(gè)街道,分別用1—5 來表示(圖2) 。要標(biāo)示這5 個(gè)區(qū)域之間的空間相鄰性,可以有多種方法,如地理上是否相連、行政中心是否在某個(gè)距離之內(nèi)、是否有地鐵直達(dá)、是否能步行10 分鐘到達(dá)等等。這種界定,更多地取決于理論假設(shè),如我們甚至可以根據(jù)“街道領(lǐng)導(dǎo)人是否高中同學(xué)、是否曾經(jīng)是同事、是否參加過同一個(gè)黨校學(xué)習(xí)”等來界定兩個(gè)街道是否屬于“相鄰”狀態(tài)。
一般來說,我們通常使用空間上是否接壤來界定空間相鄰性。可以發(fā)現(xiàn),街道1 和街道2、4 相鄰; 街道2 和街道1、3、4 相鄰; 街道3 與街道2、4、5 相鄰; 街道4 和其他所有4 個(gè)街道都相鄰; 街道5 與街道3、4 相鄰(圖3) ??梢园焉蠄D轉(zhuǎn)化為一個(gè)類似于社會(huì)網(wǎng)絡(luò)的表格(見表1) :
再進(jìn)一步,我們可以把表1 用一個(gè)5* 5 的矩陣C 來表示,Cij表示空間區(qū)域i 與空間區(qū)域j 是否相鄰,Cij= 1 表示空間區(qū)域i 與空間區(qū)域j 處于相鄰狀態(tài),Cij = 0 則表示空間區(qū)域i 與空間區(qū)域j 不相鄰。這一矩陣形式被稱為空間連接矩陣C(見表2) 。
(三) 空間權(quán)重
在連接矩陣C 的基礎(chǔ)上,將矩陣中每一個(gè)數(shù)字除以每行的總連接數(shù)Ci* ,使得每行加總為1,這一矩陣稱為行標(biāo)準(zhǔn)化的空間權(quán)重矩陣W(見表3) 。
(四) 空間滯后量
給定一個(gè)特定的觀測(cè)值Y,如街道的人口數(shù)、GDP、社會(huì)組織數(shù)量等任意一個(gè)我們感興趣的指標(biāo),將街道i 周圍相鄰單位j 的觀測(cè)值乘以相對(duì)應(yīng)的空間權(quán)重Wij 后相加,得到街道i 所有相鄰觀測(cè)值的平均值,Yis =ΣWij* Yi,稱為空間單位(街道) i 的空間滯后變量,也可以記做Ys =WY。以街道1 為例,它與街道2、4 相鄰,街道2、4 的Y 值(如人口) 分別為25、20,因此街道1 的空間滯后為25* 0.5 + 20* 0.5 = 22.5,這表示街道1 周圍街道的平均人口為22.5(見表4) 。
(五) 空間相關(guān)系數(shù)
以觀測(cè)值Y 為橫坐標(biāo),以Y 的空間滯后量Ys 為縱坐標(biāo),計(jì)算Y 與Ys 之間的相關(guān)系數(shù),就是空間相關(guān)系數(shù),也稱作Moran’s I 系數(shù):
其中wij是行標(biāo)準(zhǔn)化的空間權(quán)重矩陣,y 是我們所關(guān)注的變量。Moran’s I 是一種基于全局分析的空間自相關(guān)(Global Spatial Autocorrelation) 的測(cè)量指標(biāo),表示該區(qū)域空間聚集或離散的總體情況。Moran’s I 指標(biāo)的值介于- 1 到1 之間,當(dāng)指標(biāo)相似的地區(qū)存在空間聚集時(shí),Moran’s I 為正(正相關(guān)) ,表示觀測(cè)值高的地區(qū)其周圍的觀測(cè)值也高,觀測(cè)值低的地區(qū)其周圍的觀測(cè)值也低; 當(dāng)指標(biāo)相反的地區(qū)存在空間聚集時(shí),Moran’s I 為負(fù)(負(fù)自相關(guān)) ,表示觀測(cè)值高的地區(qū),其周圍的觀測(cè)值偏低;而當(dāng)不相關(guān)時(shí),為- 1 / ( n - 1) (當(dāng)n 足夠大時(shí),其值接近于0) 。通過圖4 可以看出,上面例子中的變量Y 與其滯后變量之間存在比較明顯的正相關(guān)關(guān)系。某個(gè)地區(qū)單位(街道) 的Y(人口數(shù)) 越大,其周圍街道的人口數(shù)也越大。如街道1 的人口數(shù)為50,周圍街道的平均人口數(shù)為22.5; 而街道5 的人口數(shù)為5,周圍街道的平均人口數(shù)為15。如同常規(guī)的相關(guān)系數(shù)一樣,Moran’s I 系數(shù)在統(tǒng)計(jì)上是否顯著,也是可以進(jìn)行統(tǒng)計(jì)檢驗(yàn)的。對(duì)于Moran’s I 系數(shù)的檢驗(yàn),一般采取兩種方法: 一種是假設(shè)數(shù)據(jù)分布是正態(tài)的,一種是假設(shè)數(shù)據(jù)分布是隨機(jī)的,使用蒙特卡洛模擬(Monte Carlo Simulation) 進(jìn)行檢驗(yàn)。通常情況下這兩種方法會(huì)得到相似的結(jié)果。使用第二種方法,對(duì)上述5 個(gè)街道的Y 進(jìn)行空間相關(guān)性檢驗(yàn),得到Moran’s I 系數(shù)為2.37,p 值為0.0089。即這5 個(gè)街道的Y 存在顯著的空間聚集現(xiàn)象,Y 值比較大的街道,其周圍街道的平均Y 值也比較大,反之亦然。
(六) 空間回歸模型
如前所示,如果觀測(cè)值存在顯著的空間相關(guān),那么就不應(yīng)忽略這種會(huì)影響統(tǒng)計(jì)結(jié)果的因素,而應(yīng)將之納入統(tǒng)計(jì)分析模型。在過去幾十年中,統(tǒng)計(jì)學(xué)家已經(jīng)發(fā)展出了比較成熟的空間回歸模型來處理這個(gè)問題。在當(dāng)今的社會(huì)科學(xué)界,有2 種空間回歸模型應(yīng)用最廣: 空間滯后模型與空間誤差模型。傳統(tǒng)的最小二乘法回歸(OLS) 可以如下表達(dá):
Y = Xβ + ε (1)
如果我們將觀測(cè)變量Y 的空間滯后變量WY 認(rèn)為是Y 的一種本質(zhì)特征,而不是一種統(tǒng)計(jì)上的干擾,即某一特定觀測(cè)單位i 周圍空間單位的平均Y 會(huì)對(duì)地區(qū)i 的Y 產(chǎn)生影響,如GDP 高的地區(qū),其周圍地區(qū)的平均GDP 也會(huì)比較高,那么,可以把這種空間滯后變量的影響效果獨(dú)立出來,并納入回歸模型進(jìn)行分析??梢詫⑸鲜街械恼`差項(xiàng)分解為兩項(xiàng): 因變量的空間滯后項(xiàng)和自變量的誤差,即: ε = ρWY + μ代入式(1) ,就得到空間滯后回歸模型(spatial lag model) :
Y = Xβ + ρWY + μ (2)
ρ 表示因變量Y 的空間滯后項(xiàng)WY 對(duì)因變量的影響效果。
或者,如果我們把空間相關(guān)看做一種統(tǒng)計(jì)干擾,認(rèn)為模型中的誤差項(xiàng)雖然在空間上是相關(guān)的,但并非由因變量的空間滯后導(dǎo)致,那么,可以將誤差項(xiàng)拆分為兩個(gè)部分: 包含空間因素的誤差項(xiàng)與空間不相關(guān)的誤差項(xiàng),即: ε = λWξ + μ
代入式(1) ,就得到空間誤差回歸模型(spatial error model) :
Y = Xβ + λWξ + μ (3)
λ 表示相鄰觀測(cè)值的空間誤差項(xiàng)Wξ 的相關(guān)程度,如果觀測(cè)值i 和觀測(cè)值j 之間的誤差項(xiàng)在空間上不存在相關(guān)關(guān)系,則λ = 0,上式可簡化為傳統(tǒng)的OLS 模型。
三、一個(gè)例子: 上海市社會(huì)組織的空間分析
在本節(jié)中,筆者使用上海市2010 年社會(huì)組織的數(shù)據(jù),進(jìn)行一個(gè)實(shí)際的空間回歸分析,對(duì)空間分析的應(yīng)用進(jìn)行演示。
(一) 數(shù)據(jù)說明
上海市社會(huì)組織的數(shù)據(jù)來自于上海社團(tuán)管理部門網(wǎng)站(“上海社會(huì)組織”網(wǎng)站) 所公示的上海所有在冊(cè)社會(huì)組織信息,通過“網(wǎng)絡(luò)爬蟲”,我們獲得了上海所有在冊(cè)社會(huì)組織的如下變量: 組織名稱、組織注冊(cè)代碼、注冊(cè)時(shí)間、證書有效時(shí)間、組織類型、注冊(cè)地、主管單位、法人代表、地址、郵編、電話、網(wǎng)址、主要業(yè)務(wù)內(nèi)容以及獎(jiǎng)懲情況等變量信息。網(wǎng)絡(luò)爬取時(shí)間為2014 年1 月1 日。
國內(nèi)社會(huì)組織分為三種類型,包括民辦非企業(yè)組織、社會(huì)團(tuán)體和基金會(huì)。在本文的實(shí)際分析中,僅保留了2010 年及之前成立的“民辦非企業(yè)組織”作為分析的示例。本文使用的軟件為R,下文所有結(jié)果均由R軟件計(jì)算得到。
用于分析的自變量數(shù)據(jù),主要來自《中國2010 年人口普查分鄉(xiāng)、鎮(zhèn)、街道資料》中的上海部分?jǐn)?shù)據(jù),包括總?cè)丝凇?4 歲以下人口、60 歲以上人口、戶籍人口等幾個(gè)核心指標(biāo)。
還有一部分地理信息的自變量,通過R 中的GIS 包生成,包括街道/鄉(xiāng)鎮(zhèn)面積、是否屬于鄉(xiāng)鎮(zhèn)(虛擬變量,鄉(xiāng)鎮(zhèn)= 1。在上海,鄉(xiāng)鎮(zhèn)具有獨(dú)立的財(cái)政,而街道沒有) ,是否屬于中心城區(qū)(虛擬變量,中心城區(qū)= 1) 。
(二) 自變量
用于分析的自變量數(shù)據(jù),主要來自《中國2010 年人口普查分鄉(xiāng)、鎮(zhèn)、街道資料》中的上海部分?jǐn)?shù)據(jù),包括總?cè)丝凇?4 歲以下人口、60 歲以上人口、戶籍人口等幾個(gè)核心指標(biāo)。
還有一部分地理信息的自變量,通過R 中的GIS 包生成,包括街道/鄉(xiāng)鎮(zhèn)面積、是否屬于鄉(xiāng)鎮(zhèn)( 虛擬變量,鄉(xiāng)鎮(zhèn)= 1。在上海,鄉(xiāng)鎮(zhèn)具有獨(dú)立的財(cái)政,而街道沒有) ,是否屬于中心城區(qū)(虛擬變量,中心城區(qū)= 1) 。
(三) 社會(huì)組織的空間分布
在進(jìn)行模型分析之前,首先進(jìn)行分析數(shù)據(jù)的前期準(zhǔn)備工作,包括: (1) 讀取上海地圖數(shù)據(jù),一般是GIS 軟件通用的shape 格式(polygon) ; (2) 讀取社會(huì)組織數(shù)據(jù),通常是外部文件,包括stata 格式、文本格式、excel 格式等等,然后轉(zhuǎn)化為shape 格式的點(diǎn)圖(point) 格式; (3) 讀取人口數(shù)據(jù),通常為excel 格式; (4) 將人口數(shù)據(jù)與地圖數(shù)據(jù)合并、生成我們需要的一系列測(cè)量指標(biāo)(如街道/鄉(xiāng)鎮(zhèn)面積、是否屬于鄉(xiāng)鎮(zhèn)、是否屬于中心城區(qū)) 。在數(shù)據(jù)準(zhǔn)備完成之后,可以先進(jìn)行數(shù)據(jù)的地圖展示,比如社會(huì)組織的空間分布、歷史發(fā)展、頻數(shù)分布等。
從圖5 可以看出,上海社會(huì)組織的分布,存在明顯的空間聚集,具體表現(xiàn)為: (1) 在中心城區(qū),存在密集的空間分布形態(tài); (2) 在各個(gè)區(qū)縣的中心地區(qū),社會(huì)組織的分布更密集一些,呈現(xiàn)明顯的中心化趨勢(shì)。
從成立年份可以看出,民辦非企業(yè)組織在2000 年之后開始迅猛發(fā)展,且一直保持比較高的發(fā)展速度,每年都有約500 個(gè)新的民辦非企業(yè)組織成立。
圖6 是民辦非企業(yè)組織的分布密度圖。從圖中可以看出,雖然這個(gè)變量的分布不是完全正態(tài)分布,但比較接近正態(tài)分布,因此本文使用線性模型(Linear Model) 進(jìn)行估計(jì)。
(四) 空間相鄰與空間權(quán)重
空間權(quán)重矩陣是進(jìn)行空間回歸分析的必要前提。引入不同的空間權(quán)重矩陣,可能會(huì)導(dǎo)致不同的模型結(jié)果(當(dāng)然,對(duì)于不同空間權(quán)重的界定,更需要來源于理論上對(duì)于觀測(cè)變量的理解) 。本文使用地理空間是否接壤(Queen) 來界定上海市街道的空間相鄰。利用空間相鄰矩陣C,生成用于后文分析的空間權(quán)重矩陣W,空間權(quán)重矩陣采用行標(biāo)準(zhǔn)化的方法。圖7 展示了本文使用數(shù)據(jù)的空間相鄰圖。
(五) Moran’s I 檢驗(yàn)
我們關(guān)注的觀測(cè)變量,是否存在空間相關(guān)性,可以使用Moran’s I 系數(shù)進(jìn)行檢驗(yàn)。如果檢驗(yàn)不顯著,說明并不存在明顯的空間相關(guān),那可以使用傳統(tǒng)的OLS 進(jìn)行估計(jì); 如果檢驗(yàn)顯著,則認(rèn)為存在明顯的空間相關(guān)關(guān)系,也就是說,某個(gè)街道的社會(huì)組織數(shù)目,受到周圍街道社會(huì)組織數(shù)目的影響,在這種情況下,忽略空間影響的效果,OLS 估計(jì)的結(jié)果將是有嚴(yán)重問題的,需要使用空間回歸模型來進(jìn)行估計(jì)。
通過Moran’s I 檢驗(yàn),民辦非企業(yè)組織的Moran’s I 統(tǒng)計(jì)值為7.76,在0.0001 的水平上顯著(見圖8) ,也就是說,“2010 年上海市民辦非企業(yè)組織”這一觀測(cè)值在空間上存在統(tǒng)計(jì)顯著的空間聚集效應(yīng),民辦非企業(yè)組織數(shù)目多的街道,其周圍街道的民非組織平均數(shù)也高。因此,在這種情況下,對(duì)于社會(huì)組織的分析,應(yīng)將空間滯后變量納入模型估計(jì)當(dāng)中,需要使用空間回歸模型而非OLS 模型來進(jìn)行估計(jì)。
(六) 空間回歸模型結(jié)果
對(duì)于空間滯后模型或者空間誤差模型的選擇,更多取決于理論的假設(shè)。如果我們把空間相關(guān)看作一種統(tǒng)計(jì)干擾,那么就選擇空間誤差模型; 如果我們將觀測(cè)變量的空間滯后變量看作是影響觀測(cè)變量的一種本質(zhì)特征,即某一特定觀測(cè)單位周圍空間單位的數(shù)值會(huì)與周圍互相影響,則選擇空間滯后模型。一般來說,社會(huì)科學(xué)家更傾向于選擇空間滯后模型,即把觀測(cè)變量的空間滯后項(xiàng)作為影響觀測(cè)變量的因素納入模型。本文僅考慮空間滯后的回歸分析。
事實(shí)上,對(duì)于空間回歸模型的選擇,可以進(jìn)行一個(gè)統(tǒng)計(jì)檢驗(yàn),看具體是存在空間滯后效應(yīng)還是空間誤差效應(yīng)。本文也進(jìn)行了檢驗(yàn),結(jié)果顯示,模型存在明顯的空間滯后效應(yīng),而非空間誤差效應(yīng)。對(duì)于空間滯后效應(yīng)回歸模型的估計(jì),有兩種不同的估計(jì)方式: 一種是使用最大似然法(Maximum Likelihood,ML) ; 另外一種是二階段估計(jì)方法(two stage OLS) ,通過把解釋變量的空間滯后項(xiàng)作為因變量的工具變量(IV) ,在同步聯(lián)立方程組中使用二階段最小二乘法來擬合模型。 前者在R 中使用“spdep”包的“l(fā)agsarlm”命令,后者使用“stsls”命令,本文使用第二種方法進(jìn)行估計(jì)。
在空間回歸模型Y = Xβ + ρWY + μ 中,系數(shù)ρ 表示Y 的空間滯后項(xiàng)的影響效果,系數(shù)ρ 顯著則表示存在空間滯后效應(yīng); 系數(shù)ρ 不顯著,則表示不存在空間滯后效應(yīng),即空間滯后項(xiàng)對(duì)Y 沒有顯著影響。表5 分別呈現(xiàn)了最小二階段回歸模型(OLS) 、使用二階段估計(jì)方法的空間滯后回歸模型(two stages Spatial Lag Model)的結(jié)果。
從模型結(jié)果可以看出,“民辦非企業(yè)組織”的二階段估計(jì)方法的空間滯后回歸模型( Spatial Lag) 的結(jié)果顯示,系數(shù)ρ 是非常顯著的。這說明,街道i 周圍街道的社會(huì)組織數(shù)目會(huì)對(duì)街道i 的社會(huì)組織數(shù)產(chǎn)生顯著的影響; 而且,這一系數(shù)的符號(hào)為正,說明街道的社會(huì)組織數(shù)目與周圍的社會(huì)組織數(shù)目存在正向的相關(guān)關(guān)系,即周圍的社會(huì)組織數(shù)目越多,街道本身的社會(huì)組織數(shù)目也會(huì)越多。
在這種情況下,如果僅僅使用OLS 方法進(jìn)行分析,會(huì)忽略非常重要的空間聚集效應(yīng),在這種情況下,OLS的估計(jì)也是有問題的。對(duì)于這一點(diǎn),從模型結(jié)果的常數(shù)項(xiàng)可以看出,在OLS 模型中,常數(shù)項(xiàng)是非常顯著的,而在控制空間滯后效應(yīng)后,常數(shù)項(xiàng)則變得不顯著。從對(duì)現(xiàn)實(shí)世界的實(shí)質(zhì)理解上,這表明,社會(huì)組織的發(fā)展存在明顯的空間聚集,這也許與地方政府之間的組織模仿行為有關(guān)。在經(jīng)驗(yàn)?zāi)P椭?,如果忽略這點(diǎn),對(duì)于經(jīng)驗(yàn)世界的理解是有偏差的。
從民辦非企業(yè)組織的回歸結(jié)果可以看出,在加入空間效應(yīng)之后,原先在OLS 模型中顯著的變量如“是否鄉(xiāng)鎮(zhèn)”變得不顯著,說明這一變量的作用與空間效應(yīng)是重合的,在控制空間效應(yīng)之后,這一變量對(duì)于民非組織的影響效果消失了。在這種情況下,如果忽略空間滯后效果,僅僅使用OLS 模型進(jìn)行估計(jì),得到的結(jié)果是有偏差的。其余幾個(gè)在空間回歸模型中仍然顯著的變量,在控制空間滯后效應(yīng)滯后,其系數(shù)明顯減小,如總?cè)丝诘挠绊懶Ч? 絕對(duì)值) 從1. 7 減少為1.6,14 歲以下人口的效應(yīng)從23.3 減少為21.1,中心城區(qū)的效果( 絕對(duì)值) 從9.5 減少為5.1。當(dāng)然,對(duì)于社會(huì)組織分布形態(tài)的更詳盡的分析,超出了本文的容量,作者擬在后續(xù)的研究中進(jìn)一步探討。
四、小結(jié)
一直以來,在社會(huì)科學(xué)的很多重要議題中,如居住隔離、犯罪與自殺問題、城市亞文化研究等等,空間分析的概念和技術(shù)都扮演著非常重要的角色。但是,遺憾的是,在國內(nèi)社會(huì)科學(xué)尤其是社會(huì)學(xué)的研究領(lǐng)域中,空間分析的概念一直付諸闕如。而對(duì)這一重要概念的忽略,有可能遮蔽我們對(duì)于現(xiàn)實(shí)世界的更深入了解。因此,本文試圖簡單地梳理空間分析的一些核心概念和分析技術(shù),并通過一個(gè)社會(huì)組織的實(shí)例,演示如何在社會(huì)學(xué)的分析模型中納入空間這一概念,以期對(duì)學(xué)界有所裨益。
當(dāng)然,我們需要看到,將空間分析引入中國的社會(huì)科學(xué)研究,仍然面臨一些問題。首先,從理論層面來看,國內(nèi)對(duì)于城市社會(huì)學(xué)的關(guān)注,具有非常明顯的人文主義色彩,對(duì)于比較量化的實(shí)證分析則比較缺乏,尤其是對(duì)于西方城市研究中已經(jīng)非常成熟的社會(huì)區(qū)因子分析的研究范式,在國內(nèi)社會(huì)學(xué)的城市研究中尚未得到足夠重視,這種情況在某種程度上可能會(huì)阻礙我們對(duì)于當(dāng)今中國快速城市化背景下的城市研究。
其次,從數(shù)據(jù)方面來看,在國內(nèi),獲取含有GIS 信息的社會(huì)科學(xué)技術(shù)比較困難,在西方,這部分工作多由政府來完成,如含有GIS 信息的普查數(shù)據(jù)的公開發(fā)布,而這一點(diǎn),在國內(nèi)仍然具有一定的困難,尤其是對(duì)于社會(huì)學(xué)家而言。
再次,從技術(shù)層面來看,對(duì)于空間分析需要的技術(shù)方法、軟件操作等等,都對(duì)社會(huì)科學(xué)研究人員提出了新的要求,如ArcGIS 軟件、R 軟件等。這些知識(shí)的掌握,需要一個(gè)學(xué)科的人才培養(yǎng)、課程設(shè)置等方面都做出一系列的調(diào)整。
最后,空間概念如何納入現(xiàn)有研究議題中,仍然是一個(gè)需要不斷摸索、討論的過程。西方的城市空間研究,已經(jīng)形成了定性與定量相結(jié)合的發(fā)展模式。國內(nèi)城市社會(huì)學(xué)的研究,即使引入量化研究的范式,也應(yīng)該從理論層面討論中國城市發(fā)展的形成機(jī)制與內(nèi)在邏輯,只有這樣,我們才會(huì)形成真正有學(xué)術(shù)生命力的城市研究。
(文章原載《山東社會(huì)科學(xué)》,版權(quán)歸作者所有。)
聯(lián)系客服