![]()
張延吉
探索街景圖像大數(shù)據(jù)中的社會(huì)事實(shí)
作者 |張延吉
作者單位 |福州大學(xué)
原文 |
《中國(guó)城市社會(huì)空間分異的現(xiàn)狀、變遷及影響因素——基于街景深度學(xué)習(xí)方法》一文有幸在《社會(huì)學(xué)研究》2026年第1期發(fā)表。應(yīng)編輯部邀請(qǐng),撰寫這篇作者手記,我想從交叉學(xué)科如何切入社會(huì)學(xué)研究的角度分享這篇論文的成稿過(guò)程。
社會(huì)空間分異是各類社會(huì)分層現(xiàn)象在空間上的投射,可從兩個(gè)視角進(jìn)行考察:一是關(guān)注不同群體在城市內(nèi)部空間分布上的差異;二是關(guān)注社會(huì)環(huán)境、空間品質(zhì)、公服資源在城市內(nèi)部的非均質(zhì)分布。肇始于芝加哥學(xué)派,歐美社會(huì)學(xué)界對(duì)城市社會(huì)空間分異的量化方法、發(fā)展趨勢(shì)、形成機(jī)制、社會(huì)效應(yīng)開展了大量研究。可惜的是,鮮見(jiàn)涵蓋中國(guó)所有城市的社會(huì)空間分異狀況及其演進(jìn)規(guī)律的研究,主要原因在于數(shù)據(jù)可得性。與量化收入或財(cái)富差距可依賴抽樣調(diào)查數(shù)據(jù)不同,對(duì)社會(huì)空間分異的測(cè)度需要小尺度空間單元(如社區(qū)、1km×1km單元網(wǎng)格)的社會(huì)經(jīng)濟(jì)地位(SES)指標(biāo),而后者在數(shù)據(jù)獲取上存在障礙。
為了探究中國(guó)城市的社會(huì)空間分異狀況,我們開展了一些前期研究,它們構(gòu)成了本文的基礎(chǔ)。2022年我在Journal of Transport Geography發(fā)表Temporal variation in activity-space-based segregation: A case study of Beijing using location-based service data一文。該文利用手機(jī)信令大數(shù)據(jù),估計(jì)了北京市某一工作日和休息日每小時(shí)的社會(huì)空間分異程度。這項(xiàng)工作突破了只從居住地的靜態(tài)視角探討社會(huì)空間分異的局限。以此為基礎(chǔ),我在Annals of the American Association of Geographers發(fā)表From residential neighborhood to activity space: The effects of educational segregation on crime and their moderation by social context一文,探討了社會(huì)空間分異對(duì)犯罪活動(dòng)的影響機(jī)制。遺憾的是,手機(jī)信令等大數(shù)據(jù)獲取昂貴、推斷社區(qū)SES指標(biāo)的AI算法存在黑箱,致使這項(xiàng)工作僅限于北京,無(wú)法拓展到更多城市。
2023年賀瓊博士(現(xiàn)任教于香港大學(xué))給我推薦了一篇Leckie(2012)的論文,該文巧妙地使用多層模型在各層的隨機(jī)效應(yīng)量化特定尺度上的社會(huì)空間分異程度,借此繞開需要全域覆蓋、小微尺度SES指標(biāo)的數(shù)據(jù)要求,轉(zhuǎn)而可用抽樣調(diào)查數(shù)據(jù)測(cè)度城市社會(huì)空間分異。受此啟發(fā),我們運(yùn)用某項(xiàng)全國(guó)社會(huì)調(diào)查在區(qū)縣、街道鄉(xiāng)鎮(zhèn)、居委村委三個(gè)尺度上對(duì)中國(guó)各地級(jí)市的社會(huì)空間分異狀況進(jìn)行了測(cè)度和解釋。詳見(jiàn)2025年我們?cè)贏pplied Geography發(fā)表的Understanding multi-scale educational and hukou segregation in urban China: A multilevel modeling approach一文。但該文的不足在于樣本的代表性問(wèn)題,國(guó)內(nèi)常用的CGSS、CSS調(diào)查數(shù)據(jù)樣本僅在全國(guó)尺度具有代表性,人口普查微觀調(diào)查數(shù)據(jù)只在地級(jí)市及以上尺度具有代表性。受成本所限,社會(huì)抽樣調(diào)查很難在街道鄉(xiāng)鎮(zhèn)、社區(qū)等中微觀尺度上具有樣本代表性,這也制約了社會(huì)空間分異研究結(jié)論的可靠性。
2023年我和我的碩士生(也是本文的第二作者)游永熠同學(xué)在完成由我主持的有關(guān)犯罪社會(huì)學(xué)的國(guó)家社科基金項(xiàng)目過(guò)程中,開始學(xué)習(xí)街景圖像挖掘和計(jì)算機(jī)視覺(jué)算法,為本研究?jī)?chǔ)備了所需數(shù)據(jù)和方法。我們的第一項(xiàng)工作是探究破窗效應(yīng)對(duì)犯罪活動(dòng)的影響,破窗理論特別提及物理失序(physical disorder)概念,將其定義為城市景觀中的雜亂破敗現(xiàn)象及衰退失控信號(hào),如垃圾、涂鴉、建筑破敗。一個(gè)社區(qū)的物理失序程度是該地社會(huì)經(jīng)濟(jì)地位的晴雨表,這為我們將物理失序作為社區(qū)SES代理變量,進(jìn)而測(cè)度社會(huì)空間分異埋下了種子。在2024年發(fā)表的《物理失序?qū)ΡI竊犯罪的影響及其在3D建成環(huán)境影響中的調(diào)節(jié)作用——基于街景圖像深度學(xué)習(xí)的上海案例》一文中,我們以上海為案例,掌握了街景圖像獲取方法和目標(biāo)檢測(cè)算法,由訓(xùn)練而得的目標(biāo)檢測(cè)模型可對(duì)全域大規(guī)模街景圖像中的物理失序現(xiàn)象進(jìn)行高效率、高精度的自動(dòng)識(shí)別。
我們的第二項(xiàng)工作受到MIT Place Pulse項(xiàng)目的啟發(fā),在對(duì)訓(xùn)練集中街景圖像的主觀感知(如安全感、富裕感)完成標(biāo)注后,執(zhí)行圖像回歸的深度學(xué)習(xí)任務(wù),可對(duì)全域大規(guī)模街景圖像中的主觀感知水平實(shí)現(xiàn)高效率、高精度的自動(dòng)識(shí)別。我們首先將這一思路運(yùn)用于犯罪恐懼感(fear of crime)的測(cè)度,并在北京完成首次嘗試。詳見(jiàn)2024年發(fā)表的《犯罪恐懼感的空間格局、影響因素及其與犯罪活動(dòng)的異同》。社研論文中富裕感知的測(cè)度也遵循了上述思路。
這兩項(xiàng)探索性研究的成功促使我回到社會(huì)空間分異議題。我意識(shí)到,通過(guò)結(jié)合街景圖像大數(shù)據(jù)與深度學(xué)習(xí)方法,可望在全國(guó)所有城市實(shí)現(xiàn)跨時(shí)期、廣覆蓋、小尺度、高精度、低成本的社會(huì)環(huán)境測(cè)度,能在一定程度上克服長(zhǎng)期以來(lái)社會(huì)空間分異研究中存在的數(shù)據(jù)局限。2023年春,我和幾位學(xué)生一起開始進(jìn)行全國(guó)街景圖像收集、物理失序數(shù)據(jù)集標(biāo)注、感知水平數(shù)據(jù)集標(biāo)注等工作,歷時(shí)大半年。宋廣文教授以及游永熠、莊宇丹、黃宏祥、黃佳玲、葉誠(chéng)楷、潘振宇等學(xué)生參與其中。借此機(jī)會(huì)對(duì)他們的貢獻(xiàn)深表感謝!
2025年秋,我們收到編輯部發(fā)來(lái)的外審專家意見(jiàn)。意見(jiàn)詳實(shí)、尖銳、富有建設(shè)性,其中最具挑戰(zhàn)性的兩條意見(jiàn)涉及概念界定和解釋框架。在概念界定方面,本文分別采用各城市中各社區(qū)物理失序面積或富裕感知得分的
Gini指數(shù)和空間
Gini指數(shù)測(cè)度社會(huì)空間分異。審稿人指出,兩者的區(qū)別應(yīng)在概念命名上有所體現(xiàn)。我聯(lián)想到,用以測(cè)度多人群空間分布差異的D指數(shù)(Dissimilarity Index)在提出之初,僅考慮城市內(nèi)部各地理單元人群構(gòu)成比例的相似性,即使各地理單元位置有變,也不會(huì)改變D指數(shù)大小,因此被認(rèn)為是不具有空間性質(zhì)的社會(huì)空間分異指標(biāo)(aspatial index),其特征類似于測(cè)度單一經(jīng)濟(jì)社會(huì)變量在各地理單元之間差異性的
Gini指數(shù)。后續(xù)學(xué)者提出的空間D指數(shù)則在考慮本地理單元人群構(gòu)成的基礎(chǔ)上,也考慮周邊地理單元的人群構(gòu)成,以從空間視角反映社會(huì)空間分異(spatial index),其特征類似于測(cè)度單一經(jīng)濟(jì)社會(huì)變量在局部鄰里環(huán)境中分異狀況的空間
Gini指數(shù)。可惜的是,既有文獻(xiàn)并未統(tǒng)一兩者命名,若將其分別稱之為“非空間社會(huì)空間分異”和“空間社會(huì)空間分異”容易產(chǎn)生混淆。我草擬了幾個(gè)概念的提法,聽(tīng)取了芝加哥大學(xué)社會(huì)學(xué)系蔡樑博士的意見(jiàn),最終我們決定將兩者分別命名為“社會(huì)空間全域分異”和“社會(huì)空間鄰域分異”。全域分異反映資源稟賦及社會(huì)環(huán)境在城市內(nèi)部各地理單元間的離散程度,屬于非空間性概念,可用D指數(shù)、
Gini指數(shù)測(cè)量;鄰域分異聚焦個(gè)體在小尺度局部相鄰環(huán)境中體驗(yàn)到的社會(huì)空間分化,屬于空間性概念,可用空間D指數(shù)、空間
Gini指數(shù)測(cè)量。為便于理解兩者的意涵及其差異,我們還在修改稿中新增了示意圖進(jìn)行解讀(圖1)。希望學(xué)界對(duì)我們的這一概念分析框架提出批評(píng)建議。
![]()
圖1 城市社會(huì)空間結(jié)構(gòu)的模擬示意
關(guān)于解釋框架,寫作初稿時(shí)我們引入西方文獻(xiàn)中提及的幾個(gè)經(jīng)典理論,試圖檢驗(yàn)中國(guó)城市社會(huì)空間分異的影響因素。這些理論包括:①全球城市理論,強(qiáng)調(diào)城市嵌入國(guó)際分工體系的影響;②空間同化理論,強(qiáng)調(diào)貧富差距的影響;③福利國(guó)家理論,強(qiáng)調(diào)政府再分配政策的影響。審稿人指出,這些理論關(guān)注的影響因素并無(wú)空間屬性,用非空間因素解釋社會(huì)空間分異存在不足。受此啟發(fā),我們提出了市場(chǎng)-政府“雙主體”與宏觀環(huán)境-微觀空間“雙視角”的解釋框架(圖2),該框架既可把現(xiàn)有理論囊括在內(nèi),也能補(bǔ)充市場(chǎng)主體和政府政策的微觀空間特征。為此,我們?cè)鲅a(bǔ)了外企與本土企業(yè)空間分布的相似性指數(shù)、外來(lái)人口與本地人口分布的孤立指數(shù)、公共設(shè)施的空間集聚度、紳士化與郊區(qū)化程度等空間類指標(biāo),以充實(shí)解釋框架的內(nèi)容。這些空間類變量的測(cè)量需要用到各種大數(shù)據(jù),如居住人數(shù)來(lái)自WorldPop數(shù)據(jù)庫(kù)(https://hub.worldpop.org)、土地出讓數(shù)據(jù)來(lái)自土地市場(chǎng)網(wǎng)(https://www.landchina.com)、企業(yè)數(shù)據(jù)來(lái)自工商企業(yè)注冊(cè)數(shù)據(jù)庫(kù)(https://shiming.gsxt.gov.cn/corp-query-homepage)、POI取自高德地圖(https://lbs.amap.com)、道路矢量地圖取自O(shè)penStreetMap。要在一個(gè)月的返修期內(nèi)完成對(duì)全國(guó)范圍內(nèi)大量數(shù)據(jù)的收集、整理、清洗、計(jì)算是一大挑戰(zhàn)。除游永熠同學(xué)的辛勞工作外,碩士生潘振宇同學(xué)在AI指導(dǎo)下編寫了用以數(shù)據(jù)整理和變量測(cè)量的Python代碼,這一創(chuàng)新極大提高了工作效率,特此感謝!
![]()
圖2 “雙主體-雙視角”解釋框架示意圖
最后,我要感謝外審專家、編輯部各位老師在本文修改中提出的真知灼見(jiàn)!感謝政光景老師在三輪校稿過(guò)程中對(duì)本文進(jìn)行的細(xì)致修改!感謝《社會(huì)學(xué)研究》對(duì)交叉研究的支持和對(duì)青年學(xué)人的勉勵(lì)!也要特別感謝福州大學(xué)社會(huì)學(xué)系和城鄉(xiāng)規(guī)劃系,福州大學(xué)允許我同時(shí)在兩個(gè)專業(yè)招收碩士研究生、給兩個(gè)專業(yè)的同學(xué)上課,這使我的小團(tuán)隊(duì)中始終充滿多學(xué)科交叉氛圍,各位同學(xué)在互學(xué)所長(zhǎng)、追求前沿的過(guò)程中獲得進(jìn)步,也令這項(xiàng)具有空間視角、融合計(jì)算機(jī)前沿方法的社會(huì)學(xué)研究成為可能。在本文寫作期間,我迎來(lái)了女兒的誕生,由衷感謝家人們的高效協(xié)作和互相支持,讓我能有比較充足的時(shí)間和精力投入研究。熱切期待各位學(xué)界前輩和同仁對(duì)本文提出批評(píng)建議,來(lái)信可發(fā)送至chairman7up@126.com。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.