公務(wù)員期刊網(wǎng) 論文中心 正文

計算社會學(xué)基礎(chǔ)問題及未來挑戰(zhàn)

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計算社會學(xué)基礎(chǔ)問題及未來挑戰(zhàn)范文,希望能給你帶來靈感和參考,敬請閱讀。

計算社會學(xué)基礎(chǔ)問題及未來挑戰(zhàn)

計算社會學(xué)是計算社會科學(xué)與社會學(xué)的學(xué)科交叉,是一門新興學(xué)科。社會學(xué)作為一門獨立的學(xué)科經(jīng)歷了近200年的發(fā)展,已經(jīng)形成完善的學(xué)科體系,但是其倡導(dǎo)的實證主義在宏觀解釋與微觀解釋、數(shù)據(jù)驅(qū)動與理論驅(qū)動、相關(guān)分析與因果推斷、信度與效度等方面長期存在內(nèi)在“張力”。計算社會科學(xué)是對社會科學(xué)實證主義傳統(tǒng)的推進,借助于計算機和信息通信技術(shù)(ICT)的迭代更新,其研究方法和研究設(shè)計都有別于傳統(tǒng)范式,研究議題越來越突破傳統(tǒng)的學(xué)科界限。面對作為典型的復(fù)雜性系統(tǒng)的社會,計算社會學(xué)具有的學(xué)科交叉、基礎(chǔ)理論和應(yīng)用對策并行等特質(zhì),使其在回應(yīng)實證主義面臨的諸多困境時具有明顯優(yōu)勢。

一、實證社會科學(xué)面臨的不確定性

實證社會科學(xué)是指利用實際調(diào)查或訪談資料來驗證理論假設(shè)或者構(gòu)建理論的研究范式,它有別于純理論思辨式的傳統(tǒng)社會科學(xué)。社會學(xué)在實證社會科學(xué)的發(fā)展早期發(fā)揮了舉足輕重的作用??椎绿岢龅纳鐣锢韺W(xué)力圖用科學(xué)的方法研究人類社會的構(gòu)想,在實證社會科學(xué)的發(fā)展歷史中遇到了許多困難。如果將社會科學(xué)研究看成是研究主體、研究客體和研究過程所構(gòu)成的三個有機整體,則可以更清晰地理解其面臨的不確定性。首先,理解并揭示社會現(xiàn)象發(fā)生和發(fā)展的因果關(guān)系是實證社會科學(xué)一直追求的,但社會復(fù)雜性所帶來的不確定性使得實現(xiàn)上述目標(biāo)的難度大大增加。在復(fù)雜系統(tǒng)內(nèi),多元個體在某一框架之內(nèi)進行互動,行為會彼此影響,并且個體具有適應(yīng)性和學(xué)習(xí)能力,最終引起特定的功能涌現(xiàn)。正是由于社會系統(tǒng)的復(fù)雜性,并不存在像“萬有引力”那樣的普遍規(guī)律,加之系統(tǒng)成員具有自主選擇和創(chuàng)造的能力,使得實證研究發(fā)現(xiàn)在一般化上總是不甚理想。其次,實證社會科學(xué)已經(jīng)發(fā)展出完備的理論和方法工具箱,但是研究者在方法論的認(rèn)同和運用上的偏好都會帶來實證發(fā)現(xiàn)的不確定性。社會科學(xué)家有一種自然而然的研究傾向,即嘗試通過理解行動者的意圖、信念、場景和機遇,去解釋他們的行動及后果。在田野調(diào)查中,不同的研究者即使從訪談對象那里獲得完全相同的信息,在“裁剪”的過程中仍然無法避免出現(xiàn)理解偏差;在定量研究中,雖然開放性、透明性和標(biāo)準(zhǔn)化程度相對更高,但這并不意味著研究者偏好對實證研究的“干預(yù)”更少。最后,研究設(shè)計是實證社會科學(xué)區(qū)別于思辯哲學(xué)的關(guān)鍵環(huán)節(jié),當(dāng)然也是不確定性的主要生成器。一方面表現(xiàn)為模型設(shè)定起點的不確定性。理論導(dǎo)向的實證研究尤為強調(diào)理論對模型建立的指導(dǎo),通常采取的策略是以所對話的理論為起點。要探究理論之核心變量對因變量的影響模式,必須排除若干競爭性解釋,這在模型上主要通過引入控制變量來實現(xiàn)。另一方面,模型假定、數(shù)據(jù)構(gòu)成、操作化測量、事后因果框架等都導(dǎo)致模型輸出結(jié)果的不確定性。任何模型對資料(定性或定量)構(gòu)成都有相應(yīng)的前提假定,如總體分布、代表性(包括類型)、信度、效度等,研究者不得不通過“改造”資料以減少實際研究中遇到的前提假設(shè)違背困境??傊芯拷Y(jié)果的不確定性是實證社會科學(xué)的基本特征之一,如何消解其對社會科學(xué)的約束一直是個棘手的問題。數(shù)據(jù)密集型(data-intensive)科學(xué)范式的到來,為實證社會科學(xué)提供了許多變革的機遇。由此,筆者認(rèn)為有必要將該問題置于計算社會科學(xué)的發(fā)展脈絡(luò)中。

二、計算社會科學(xué)的主要傳統(tǒng)

計算社會科學(xué)能夠積極應(yīng)對實證社會科學(xué)的不確定性。其中,基于模擬社會系統(tǒng)或過程的社會仿真可以克服傳統(tǒng)模型的線性思維和化約主義,對于復(fù)雜性有著更科學(xué)的探究;大數(shù)據(jù)分析通過對海量數(shù)據(jù)的挖掘推動知識生產(chǎn),減少了模型設(shè)定、測量和結(jié)論泛化的不確定性。

(一)社會仿真:生成解釋的傳統(tǒng)

生成解釋(generativeexplanation)是通過建立有關(guān)被研究社會系統(tǒng)的模型,并從模型的運行過程和結(jié)果中獲得對研究對象的理解。該傳統(tǒng)主要通過對主體的行動及其相互作用規(guī)則的設(shè)定,從演化過程中獲得新的機制解釋。“復(fù)雜性”是生成解釋背后的認(rèn)識論基礎(chǔ),它將現(xiàn)代物理和生物學(xué)結(jié)合,認(rèn)為社會永遠處于時間的邊緣,結(jié)構(gòu)時刻在組合、衰敗和發(fā)展。社會仿真(simulation)是生成解釋的主要方法,它始于20世紀(jì)50年代,在研究社會的復(fù)雜性上遠遠超越了其他多數(shù)研究方法。該方法通過建立一個模擬社會系統(tǒng)或過程的計算機模型,即建立一個能夠表征現(xiàn)實世界的“人工社會”,開展各種社會科學(xué)分析。仿真模型能夠容納具有適應(yīng)性的主體,實現(xiàn)主體之間的交互,展現(xiàn)了從微觀個體行為到宏觀系統(tǒng)狀況的“涌現(xiàn)”。它能夠?qū)⑿袆又黧w的異質(zhì)性、自我適應(yīng)性、有限理性、交互性等重要因素重新納入研究框架之中,克服多數(shù)模型的線性外推思維、無法反映宏觀-微觀線性內(nèi)在聯(lián)系、缺乏對“活”系統(tǒng)成員的描述等不足,自下而上地構(gòu)建一個逼近真實的人工社會,以揭示事件發(fā)生的條件、概率、限度以及多種可能選擇的策略??傮w而言,社會仿真經(jīng)歷了從宏觀仿真到微觀仿真,再到基于主體仿真的發(fā)展歷程,主要分為面向變量模型、面向?qū)ο竽P秃突旌仙鐣P偷阮愋?。其中,基于行動者的模型(agent-basedmodelling,ABM)屬于面向?qū)ο蠼?,為研究者提供了?chuàng)建、分析和試驗由在環(huán)境中互動的行動者構(gòu)成的模型。

(二)大數(shù)據(jù)分析:數(shù)據(jù)挖掘的傳統(tǒng)

數(shù)據(jù)挖掘傳統(tǒng)主要基于互聯(lián)網(wǎng)在線實時所產(chǎn)生的大數(shù)據(jù),利用數(shù)據(jù)科學(xué)和計算科學(xué)的前沿技術(shù)做數(shù)據(jù)挖掘,進行理論檢驗和社會預(yù)測。有別于社會仿真,該傳統(tǒng)的數(shù)據(jù)資料來源更加多元、時空跨度更大、體量更大、形式多樣,由此為計算社會科學(xué)的發(fā)展提供了難得的機遇。與傳統(tǒng)主要通過收集觀察、抽樣調(diào)查的數(shù)據(jù)不同,大數(shù)據(jù)是在弱選擇性觀察、弱設(shè)計、弱標(biāo)準(zhǔn)化、弱目的性的前提下自動存取的非結(jié)構(gòu)化的痕跡數(shù)據(jù)。雖然無法回避算法干擾、數(shù)據(jù)漂移、代表性、個人隱私等方面的困擾,但它還是為社會科學(xué)家打開了一扇理解人類社會的新大門。同時,大數(shù)據(jù)在方法論層面為傳統(tǒng)社會科學(xué)研究注入了新的活力,即來自計算科學(xué)的數(shù)據(jù)驅(qū)動?;趯A繑?shù)據(jù)的挖掘去探尋突破人類既有知識結(jié)構(gòu)的新發(fā)現(xiàn),并在此技術(shù)上發(fā)現(xiàn)和建構(gòu)新理論和新理解。這種方法論上的革新,促使演繹和歸納更為密切地結(jié)合,也使得計算科學(xué)、數(shù)據(jù)科學(xué)和社會科學(xué)的聯(lián)系更為緊密。數(shù)據(jù)挖掘無論在數(shù)據(jù)屬性、分析方法和研究目標(biāo)上都與實證社會科學(xué)存在明顯不同。數(shù)據(jù)挖掘的分析對象有別于傳統(tǒng)數(shù)據(jù),研究者往往需要借助自然語言處理(包括情感分析、潛在狄利克雷模型等)、圖像識別、深度學(xué)習(xí)等發(fā)端于計算科學(xué)的分析工具。在研究目標(biāo)上,大數(shù)據(jù)分析將預(yù)測置于核心位置,有別于實證社會科學(xué)強調(diào)因果解釋的傳統(tǒng)。由于大數(shù)據(jù)不再局限于“觀察”,全息記錄不會對非直接關(guān)聯(lián)變量進行過早篩選,因此恰恰可以為預(yù)測提供更全面的基礎(chǔ)信息。加之機器學(xué)習(xí)強調(diào)偏差與方差的權(quán)衡(bias-variancetradeoff),也使得模型預(yù)測的穩(wěn)健性得到顯著提升。

三、計算社會學(xué)的基礎(chǔ)問題

(一)概念界定

計算社會學(xué)是計算社會科學(xué)的分支。本文認(rèn)為,計算社會學(xué)是以計算科學(xué)、數(shù)據(jù)科學(xué)等為主要分析工具,將非介入方式收集的大規(guī)模數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)集相結(jié)合,挖掘人類社會和社會互動的規(guī)則和模式,用以解釋人類行為與社會運行規(guī)律的科學(xué)。

(二)學(xué)科界限

與社會學(xué)其他分支相比,計算社會學(xué)的理論更多來自相鄰分支,而研究方法則從計算科學(xué)和數(shù)據(jù)科學(xué)遷移而來。在學(xué)科內(nèi)部,計算社會學(xué)是一門提供“范式”的學(xué)科,它能夠在方法論和研究方法上開辟新的方向,有助于拆除社會學(xué)中定性和定量研究之間的藩籬;從經(jīng)濟社會學(xué)、組織社會學(xué)、政治社會學(xué)等分支學(xué)科汲取理論養(yǎng)分,使學(xué)科內(nèi)部彼此融通;通過多理論整合、多方法融合和多類型數(shù)據(jù)匹配,將傳統(tǒng)社會學(xué)在數(shù)據(jù)生產(chǎn)上的優(yōu)勢得以延展。在學(xué)科之間,計算社會學(xué)采用人工智能和數(shù)據(jù)挖掘等計算科學(xué)方法,不局限于總體性思維,在技術(shù)的層面具有天然的開放性和包容性,有助于達成共識;其同時重視理論創(chuàng)新和現(xiàn)實關(guān)懷,既可以與管理學(xué)、新聞傳播等應(yīng)用性強的學(xué)科交叉,也能與哲學(xué)、歷史學(xué)等基礎(chǔ)性學(xué)科交叉。

(三)研究范式

計算社會學(xué)作為一門“范式”型的學(xué)科,至少包括方法論和學(xué)科定位兩個面向。在方法論層面,歸納和演繹是知識發(fā)現(xiàn)的基礎(chǔ)。囿于社會科學(xué)的特殊性,歸納和演繹并不能較好地整合起來。計算社會科學(xué)的核心之一是數(shù)據(jù)挖掘,實際上是一個知識發(fā)現(xiàn)的過程,包括理解問題領(lǐng)域、理解數(shù)據(jù)、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、評估新知識和使用新知識等環(huán)節(jié),融合了歸納和演繹兩種研究方法。由此,計算社會學(xué)主要包括兩種:一是理論與數(shù)據(jù)雙向驅(qū)動。理論與數(shù)據(jù)雙向驅(qū)動是以現(xiàn)實問題為導(dǎo)向,以社會科學(xué)相關(guān)領(lǐng)域的理論知識經(jīng)驗為基礎(chǔ),提出理論假設(shè)和研究框架,然后收集適當(dāng)?shù)脑紨?shù)據(jù),并采用適切的分析技術(shù)從中提取信息挖掘知識,然后以科學(xué)可靠的方式運用數(shù)據(jù)和知識來檢驗理論假設(shè),最終發(fā)現(xiàn)和揭示人類社會的規(guī)律。二是理論引導(dǎo)的大數(shù)據(jù)分析。計算社會學(xué)把社會學(xué)理論以及研究方法與大數(shù)據(jù)分析融為一體,為大數(shù)據(jù)分析開啟了許多新議題。在學(xué)科定位層面,與傳統(tǒng)社會學(xué)不同,計算社會學(xué)更強調(diào)理論創(chuàng)新與現(xiàn)實關(guān)懷的結(jié)合,而不滿足于象牙塔。首先是社會預(yù)測。機器學(xué)習(xí)可以為社會科學(xué)處理結(jié)構(gòu)更為復(fù)雜、樣式更加多元的信息內(nèi)容,并生成可供分析的變量形式,從而拓展社會科學(xué)的研究視界:獲得潛藏指標(biāo)、啟發(fā)理論假說、助力因果推斷、實現(xiàn)數(shù)據(jù)增生和推動理論創(chuàng)新。其次是整合“解釋—預(yù)測”。該范式試圖建立一種綜合模型,提倡一個明確的標(biāo)簽系統(tǒng),用以更清楚地描述個人的研究貢獻,識別其所屬的象限,倡導(dǎo)開放的科學(xué)實踐。最后是社會干預(yù)。計算社會學(xué)有著更強的科學(xué)性和應(yīng)用性傾向,社會計算不僅是技術(shù)手段,也是社會現(xiàn)實的生成過程。除了能在研制與開發(fā)新型社會計算工具中發(fā)揮重要作用,研究計算與社會的關(guān)系和有關(guān)計算/技術(shù)的問題同樣是計算社會學(xué)的重要內(nèi)容。

(四)研究方法

計算社會學(xué)的研究方法很大程度上受益于計算社會科學(xué)。目前,計算社會科學(xué)已經(jīng)形成了社會數(shù)據(jù)計算、互聯(lián)網(wǎng)社會科學(xué)實驗、社會模擬三大方法體系。社會數(shù)據(jù)計算主要集中于數(shù)據(jù)挖掘過程,這種方法背后的計算思維強調(diào)對所需優(yōu)化問題的理解,將其分解為不同的任務(wù),最后通過計算機的自動化實現(xiàn)這些分解的任務(wù)。社會數(shù)據(jù)計算的應(yīng)用場景不僅包括對大數(shù)據(jù)的清洗(如針對變量缺失、代表性弱、非結(jié)構(gòu)化等),還涵蓋特征提取、交叉驗證、模型校準(zhǔn)等,其基礎(chǔ)是機器學(xué)習(xí)。互聯(lián)網(wǎng)社會科學(xué)實驗是將互聯(lián)網(wǎng)平臺作為一種“實驗室”,運用新興的信息技術(shù)作為工具開展隨機實驗。和實驗室實驗、自然實驗等傳統(tǒng)社會科學(xué)實驗相比,該方法在樣本代表性、環(huán)境仿真度、條件控制力、可復(fù)制性、主事者偏差、受試者偏差、內(nèi)在效度和外部效度等方面都具有不同程度的優(yōu)勢。最后,社會仿真實質(zhì)上是在計算機中構(gòu)造與現(xiàn)實世界相對應(yīng)的人工世界,建立起與真實系統(tǒng)相對應(yīng)的平行系統(tǒng),并在人工世界與平行系統(tǒng)中對現(xiàn)實復(fù)雜系統(tǒng)進行試驗性研究。

四、計算社會學(xué)在中國發(fā)展的挑戰(zhàn)

計算社會學(xué)作為計算社會科學(xué)的子集,無法逃脫數(shù)據(jù)共享、數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)、倫理遵循、學(xué)術(shù)復(fù)合型人才培養(yǎng)等諸多挑戰(zhàn)。本文將從國家定位與學(xué)科自覺、定性與定量、抽樣調(diào)查與感應(yīng)器采集之間的內(nèi)在張力等方面歸納計算社會學(xué)在中國發(fā)展可能面臨的挑戰(zhàn)。

(一)學(xué)科定位

中國社會學(xué)恢復(fù)以來,始終堅持“兩條腿”走路,即遵循學(xué)科發(fā)展規(guī)律不斷建立和健全學(xué)科體系的同時,回應(yīng)重大的理論和現(xiàn)實問題。計算社會學(xué)自提出以來就有著很強的應(yīng)用性底色。以社會決策為例,傳統(tǒng)的預(yù)測和決策多依賴于對常規(guī)性事實的研究,而計算社會學(xué)提供了一個應(yīng)對高度復(fù)雜和快速變化環(huán)境的高效能、低成本的新工具。當(dāng)然,計算社會學(xué)在學(xué)科拓展的過程中要始終保持理論自覺。在計算社會學(xué)中,理論和計算的關(guān)系不再是單向的指導(dǎo)與被指導(dǎo)關(guān)系,而是雙向促進和螺旋上升的過程。

(二)方法超越

定性和定量研究方法的爭論在國內(nèi)社會科學(xué)中較為普遍。由于社會學(xué)兼具“人文”和“科學(xué)”雙重性格,加上社會學(xué)在中國恢復(fù)發(fā)展的特定歷史原因,超越定性與定量之爭的問題相對突出。囿于計算社會學(xué)天然的量化屬性,也就自然被卷入研究方法之爭。相比于傳統(tǒng)的量化研究,計算社會學(xué)的資料收集和分析邊界變得更加模糊,數(shù)據(jù)挖掘的算法不再僅僅是一種簡單的應(yīng)用,其團隊協(xié)作對成員的知識構(gòu)成和規(guī)模都提出了更高的要求。如今,計算社會科學(xué)正在引發(fā)數(shù)據(jù)觀念、研究設(shè)計、模型選擇和推論原則等方面的實質(zhì)性影響,調(diào)整了社會科學(xué)研究中依賴?yán)碚摰乃季S定勢。然而,如果無法超越定性與定量之爭,計算社會學(xué)的合法性危機在相當(dāng)長的時期內(nèi)都將難以消解。

(三)數(shù)據(jù)生產(chǎn)

實證社會科學(xué)的發(fā)展離不開數(shù)據(jù)的采集及處理技術(shù)的進步。事實上,社會學(xué)不僅輸出了許多理解人類社會的“語法”,也構(gòu)建了以抽樣調(diào)查為核心的研究方法體系,為知識界生產(chǎn)和積累了大量的高質(zhì)量數(shù)據(jù)。然而,作為工業(yè)化產(chǎn)物的社會調(diào)查,正在受到以感應(yīng)器為基礎(chǔ)設(shè)施的數(shù)據(jù)生產(chǎn)體系越來越多的挑戰(zhàn)。

作者:范曉光 劉金龍 單位:浙江大學(xué)社會學(xué)