電子科大把大數(shù)據(jù)運(yùn)用到社會科學(xué)的研究中
掃描二維碼
隨時隨地手機(jī)看文章
日前,電子科技大學(xué)大數(shù)據(jù)研究中心主任周濤教授、高見博士在《物理報道》發(fā)表長篇綜述論文。《物理報道》是物理科學(xué)和交叉科學(xué)類最具國際影響力的期刊之一,是國際頂尖級期刊。這篇名為“計算社會經(jīng)濟(jì)學(xué)”的論文,主要是通過利用采集的大數(shù)據(jù),分析全球經(jīng)濟(jì)發(fā)展?fàn)顩r、區(qū)域經(jīng)濟(jì)水平、城市空間結(jié)構(gòu)布局和個體社會經(jīng)濟(jì)狀況等。相比過去而言,改變了傳統(tǒng)的“問卷調(diào)查、普查”的方式,獲取的數(shù)據(jù)更具有真實性,對政府的決策更有指導(dǎo)意義。
大數(shù)據(jù)的運(yùn)用改變社會科學(xué)的調(diào)查方式
據(jù)周濤教授介紹,社會科學(xué)的研究非常復(fù)雜,其基本單元(人)要比物理學(xué)的基本單元(基本粒子)復(fù)雜得多。社會科學(xué)的研究對象具有極大的不完備性和不確定性,如政策和法律條文,不僅復(fù)雜,而且不容易用數(shù)值手段來刻畫。同時,影響社會發(fā)展的因素數(shù)不勝數(shù),任何包羅萬象的理論都不可能將它們?nèi)P納入,而單個因素也是不獨(dú)立不穩(wěn)定的,受到外部環(huán)境和其他因素的影響很多。因此,搜集大量的數(shù)據(jù),覆蓋足夠的面,可以讓社會科學(xué)調(diào)查得到的結(jié)果更加真實,為政府決策提供更加科學(xué)合理的建議。
但是,此前很多社會學(xué)的研究,依賴于問卷調(diào)查、普查等方式,這些數(shù)據(jù)采集的規(guī)模相對較小,不具有廣泛的代表意義;此外,還存在獲取數(shù)據(jù)的成本較高、時間滯后等劣勢。而此次在論文中所推薦的調(diào)查方式,則是基于新興的大數(shù)據(jù)技術(shù)。
高見博士提到,隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,為社會經(jīng)濟(jì)帶來了前所未有的機(jī)遇和改變。一方面,我們可以用相對較低的成本獲取衛(wèi)星遙感、手機(jī)通訊、社交媒體等大規(guī)模社會經(jīng)濟(jì)數(shù)據(jù),其具有實時性強(qiáng)和高時空分辨率等優(yōu)勢。另一方面,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析等計算方法的發(fā)展,有效提升了定量感知和預(yù)測社會經(jīng)濟(jì)態(tài)勢的能力。
新興交叉學(xué)科計算社會經(jīng)濟(jì)學(xué)應(yīng)運(yùn)而生
這篇綜述文章可以看作一個新興的交叉學(xué)科——計算社會經(jīng)濟(jì)學(xué),它基于大規(guī)模的真實數(shù)據(jù),用定量化的手段研究社會經(jīng)濟(jì)發(fā)展中的各種現(xiàn)象,特別是與社會過程有關(guān)的經(jīng)濟(jì)發(fā)展問題,以及與經(jīng)濟(jì)發(fā)展有關(guān)的社會問題。它既可以被看作是社會經(jīng)濟(jì)學(xué)因為方法論的變革所形成的新分支,也可以被看作是計算社會科學(xué)因為研究對象的聚焦所形成的新分支。計算社會經(jīng)濟(jì)學(xué)特別強(qiáng)調(diào)三個關(guān)鍵詞:“定量化”,強(qiáng)調(diào)用數(shù)值而非描述來刻畫問題和呈現(xiàn)結(jié)果;“真實數(shù)據(jù)”,強(qiáng)調(diào)理論模型必須要服從真實數(shù)據(jù),以對真實數(shù)據(jù)的解釋和預(yù)測能力為評價準(zhǔn)繩;“大規(guī)模”,強(qiáng)調(diào)盡可能獲取能夠直接反映全體的數(shù)據(jù)樣本,即全體尺度數(shù)據(jù)。文章通過介紹大量的研究實例,描摹了社會經(jīng)濟(jì)學(xué)發(fā)展在方法論上正在產(chǎn)生的兩大改變。一是為了分析遙感圖像、街景照片、社交網(wǎng)絡(luò)、文本內(nèi)容這些新型數(shù)據(jù),傳統(tǒng)的統(tǒng)計分析工具無法滿足需求,必須高度依賴于人工智能,特別是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的先進(jìn)技術(shù),例如深度學(xué)習(xí)算法。二是我們可以通過建立利用全體尺度的數(shù)據(jù)預(yù)測少量高價值數(shù)據(jù)的模型,從而可以推斷出全體尺度上的高價值信息。
例如,科學(xué)家對盧旺達(dá)856名手機(jī)用戶的家庭經(jīng)濟(jì)情況進(jìn)行了詳細(xì)的調(diào)查,然后通過機(jī)器學(xué)習(xí)方法,建立了利用手機(jī)數(shù)據(jù)預(yù)測家庭經(jīng)濟(jì)情況的模型,從而以很高的精度直接從手機(jī)數(shù)據(jù)中推測盧旺達(dá)150多萬家庭的經(jīng)濟(jì)情況。這種結(jié)合全體尺度易獲得數(shù)據(jù),少量難以獲得的高價值數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,去推斷全體尺度難以獲得的高價值數(shù)據(jù),是計算社會經(jīng)濟(jì)學(xué)研究中很有代表性的一種新方法,體現(xiàn)了社會科學(xué)和計算機(jī)科學(xué)理念和方法的深度融合。總體而言,社會經(jīng)濟(jì)學(xué)將會和數(shù)據(jù)科學(xué)、人工智能結(jié)成方法論上的深度聯(lián)盟。周濤表示,長遠(yuǎn)來看,這種由大數(shù)據(jù)和人工智能發(fā)展所驅(qū)動的新理念和新方法論,毫無疑問會成為未來社會科學(xué)主流的方法論,并且將不可逆轉(zhuǎn)而深刻地改變整個社會科學(xué)!