【文萃】陈云松 贺光烨 吴赛尔:走出定量社会学双重危机
中国社会科学网

文章指出近十年来,我国定量社会学发展迅速,开始真正承担起解释、预测社会实质的学科使命,但也遭遇了双重危机——基于内生性问题的因果逻辑危机和基于时空问题的理论视野危机。作者认为当定量社会学的传统方法、手段和范式不能解决这些危机时,我们必须动员起新的方法、新的数据、新的模型、新的范式、新的思维,确保定量学人能够应对这些挑战,走出历史的关口。
文章主要分为几个部分:第一部分,导言;第二部分,交织的双重危机;第三部分,走出危机的五个途径;第四部分,定量社会学研究范式前瞻。

作者对定量社会学这一概念进行了界定,即以数据为基础,以统计方法为手段对社会结构、过程和现象等进行证实或证伪的社会科学。文章指出中国定量社会学研究,已经从20世纪80年代的学步、90年代的追赶,在21世纪初转入与全球社会学研究前沿进行对话的历史新阶段。尤其是近十年来,中国定量社会学的方法进步令人瞩目。定量研究的思维和应用,已经成为当代人文社科最具活力、最有潜力和最有利于形成公共学术智业的前沿。当前定量研究者已不再满足于早期的数据描述和限于浅表的关联分析,而是逐步开始承担起解释社会和预测社会的学科使命。
二 交织的双重危机定量社会学交织的双重危机主要是指基于内生性问题的因果逻辑危机和基于时空问题的理论视野危机。“内生性”(Endogeneity)问题是指由于总有某种无法观测的个人能力或者异质性的存在,基于观测数据的定量研究,其单方程经典回归模型系数统计显著与否,本质上只能说明该对变量在统计上是否具有关联,至于孰因孰果,以及这一关系的真正体量,却因偏误重重而无力推断。广义的内生性问题除遗漏偏误之外,还有自选择偏误、样本选择偏误和联立性偏误等诸多来源。作为定量社会学面临的视野危机,它最初来自于数据层面的过度微观化和生产滞后性,并逐渐发展成为一种分析时空、理论视野的窄化,以及论证习惯的惰性滞后,最终以学术使命危机呈现而陷定量研究者于危地。作者认为不论是内生性问题还是时空问题,两者并非独立存在。当其交织在一起时,在数据、假说等定量研究具体的维度中,表现为四“多”四“难”,即:
第一,研究多基于截面数据,难以进行因果推断。目前的社会学定量研究通常是基于以年为单位的截面数据。在不使用工具变量(Instrumental Variable)的情况下,仅仅基于截面数据的研究,内生性问题难以厘清,因果关系难以判断。
第二,研究多囿于个体层面,难以进行宏观检验。缺乏对宏观数据的关注,使得定量研究呈现出三个方面的缺憾即:个体数据不利于理论发展;个体数据无法进行大跨度的纵贯分析;个体数据难以助推理论的跃迁。
第三,研究多忽视濡染机制,难以进行空间分析。濡染机制(第一地理定律)是指相似的事情在地理空间上也是彼此接近的,或者说社会现象会出现地理空间上的扩散濡染。由于缺乏空间思维训练,缺乏地理空间数据以及相应的分析技术,定量社会学界长期以来对这一机制的关注颇为有限。
第四,研究多限于当代调查,难以进行大历史研究。“调查革命”出现后的几十年,传统调查问卷技术迅速发展,以问卷调查数据为主要研究对象的微观定量社会学研究突飞猛进,但是,再大的样本,仍然不是全部总体;再长的追踪期,难以超越数代人的历程。
三 走出危机的五个途径作者针对当前定量社会学的双重危机与交织其中的四个不足,梳理出五个相对前沿并值得当前中国社会学定量研究者高度关注的途径,即:
(一)追踪时间差异:时间序列和面板分析。相比截面数据分析,时间序列分析往往是基于单个个体分析其随时间的变化状态,而面板分析的数据综合了截面数据和时间序列数据,是对不同个体随时间变化状态的分析。时间序列分析与面板数据对于解决内生性问题的优势在于,均可做到对同一个体进行追踪以得到个体随时间变化的趋势与规律。

(二)培育实验思维:工具变量、双重差分法与断点回归。实验思维是解决内生性问题的有力工具,而其中的随机试验又是识别因果的最优选择。工具变量方法简洁强大,但其外生性无法进行统计检验,也非常难以寻找。运用双重差分法要求掌握样本的前后两期数据,其本质也是一个二期的面板数据。断点回归(Regression Discontinuity)也是一种拟随机实验方法,其基本思想是,个体被分配到不同组(干预组和控制组)通常是基于某个预先计划的临界分数,在该临界分数变化前后较小的区间内(意味着我们所比较的群体具有较高的同质性),我们可以比较对于某个项目,最需要或最应该进入该项目的群体在参加与不参加该项目上获得的差异。在断点回归中,我们利用临界值附近样本的系统性变化来识别因果效应。
(三)关注濡染机制:空间分析模型。目前,空间分析中应用最为广泛的模型为空间滞后模型与空间误差模型,其原理并不复杂。真正的社会科学研究中,很多现实现象都或多或少具有空间相关性。空间相关在传统社会科学研究中可能是一个重要的遗漏变量,如若置之不理,非但不能观测到社会现象是否具有濡染现象,而且还会对标准回归模型产生不可靠的偏误结论。
(四)构建宏观测量:借助大数据。大数据的出现和发展为定量社会学者研究大历史、大空间的宏观社会过程提供了全新的前景。对于社会学而言,目前可用的大数据主要包括数量级以千亿词汇、万亿字节计的数字化书籍、媒体、语料库、视频库、互联网文本、搜索引擎记录以及脸书、微博、微信等当代自媒体平台。利用大数据来进行人文社科领域的量化研究,使得研究成果具有大视野、大跨度的特征,具备高度的科学性和说服力。
(五)再建理论思维:重读人文经典。对于习惯于从数据发掘规律,从结果验证理论的定量学人而言,重读人文经典书籍,可以带来四个方面的重要拓展即:可以从中获得理论研究的定量分析对象;可以从中获得重要的社会科学数据来源;可以让定量分析者作品的文采和感染力进一步增强,改变定量文章因为本身结构化特征给读者带来的枯燥感;有助于定量研究者重新熟悉自己踏入社会学领域之初所获得的理论训练和青少年时代的通识阅读。
四 定量社会学研究范式作者提出要走出双重危机,在以下几种研究范式上定量学人也应该有发展和突破。
(一)研究论据复合化:一变量多测量、一假说多模型、一模型多数据。作者认为,研究论据复合化的方法将更加普遍地用于增加文章可信度。也即,在一篇文章中通过多种测量、多种模型、多种数据证明同一个假说,以此提高定量社会学研究结论稳健性。

(二)检验方法复制化:走向开源、可复制的社会学。在定量分析中,复制性研究是利用已有研究成果的数据和估算相关模型所用的计算机程序代码,对其研究的全过程进行再现,达到校验(即使用相同数据相同模型)和拓展(使用相同数据不同模型或者不同数据相同模型)该项研究的目的。因此,复制性研究是将社会学引向规范化的重要手段,也是未来定量研究的必然趋势。
(三)呈现方式精炼化:提倡结构化、集约化、可视化、多元化。借鉴自然科学研究成果的展陈方式,定量社会学研究也应提倡如下四个方面:第一,结构科学化,形成明晰的逻辑模板,提倡科学的“八股”;第二,适当压缩文献回溯提炼,倡导集约化的文献和理论部分文字,避免对海量文献的过量铺陈。第三,多利用可视化的图形来表现文章信息;第四,定量社会学的论文展示应该多元化。
(四)研究目标科学化:重返描述,告别关联,解决因果,走向预测。对于重大社会议题,应该鼓励利用质量优秀、来源新颖、代表性强的数据进行描述性研究。走向预测,不仅能够促进学科间的融合,同时可以令定量社会学更多利用非常识来建立更加科学有效的理论。
综上,社会学定量发展瓶颈的背后,不仅仅是调查、数据、方法和模型的问题,更是理论发展相对滞后的问题。新的数据来源和模型设置,必将为社会学定量研究打开新的研究之门,极大丰富定量社会学的研究主题与技术技巧,促进学科持续繁荣发展。作为学科使命的当代承担者主体,我们必须认清历史的使命和学术的社会道义价值,以百倍的努力、信心,以更为宏大的视野和更宽厚的肩膀,来应对历史的挑战,迎接社会学大时代的真正到来。
(摘编自《中国社会科学评价》2017年第3期《走出定量社会学双重危机》,于翠杰/摘编)
(作者:陈云松,南京大学社会学院副教授;贺光烨,南京大学社会学院助理研究员;吴赛尔,香港科技大学商学院经济学系研究生)
来源:中国社会科学网
责任编辑:张卓晶