數(shù)據(jù)新聞的發(fā)端
數(shù)據(jù)新聞的發(fā)端可以追溯到對美國大選結果的預測。而大約60年后,電腦輔助的報道工具在全球范圍內成為調查性報道的核心手段。
許多實踐者將計算機輔助報道和數(shù)據(jù)新聞的發(fā)端回溯到了1952年。當時美國的哥倫比亞廣播公司(CBS)試圖讓專家在大型計算機的幫助下預測總統(tǒng)選舉的結果。這看起來與當下的數(shù)據(jù)新聞相去甚遠,因為當時他們根本沒有使用數(shù)據(jù)。直到1967年,數(shù)據(jù)分析才開始流行起來。
那一年夏天底特律發(fā)生了嚴重的黑人騷亂,為了了解并解釋底特律騷亂,《底特律自由報》的Philip Meye運用了計算機對一份針對底特律居民的調查進行了分析。(幾十年后《衛(wèi)報》在英國使用了一些相同的方法來研究種族騷亂的事件并引用了邁耶的作品。)
在70年代,Philip Meye繼續(xù)與地方報紙《費城問詢報》(Philadelphia Inquire)的Donald Barlett和James Steele合作分析了當?shù)厮痉ㄏ到y(tǒng)的量刑模式,與Rich Morin在《邁阿密先驅報》(Miami Herald)分析了資產評估記錄。Philip Meye還出版了一本書叫做《精確新聞》(Precision Journalism),解釋并進一步提倡使用數(shù)據(jù)庫分析和社會調查的辦法來報道新聞,自此這本書一版再版。
然而,在80年代中期以前依然只有寥寥可數(shù)的幾位記者采用了這些技術手段。那時的一個標志性事件是Elliot Jaspin在新聞中使用數(shù)據(jù)庫進行分析而在《普羅維登斯雜志公報》備受賞識,他的代表作包括了對危險校車司機的分析和對與住房貸款有關的政治丑聞的調查。同時另外有50名左右的記者在80年代末經常與Philip Meye,Jaspin或者史蒂夫·多依格的《邁阿密先驅報》進行交流,開始在他們的新聞中報道進行數(shù)據(jù)分析。
這時,輔助記者們進行報道的是更加先進的個人電腦以及一個由Jaspin和新聞程序師Daniel Woods寫的程序——Nine Track Express,這個程序使得電腦與磁盤間的信息傳輸更加便捷。這樣的條件使得當時的記者得以繞過官僚機構和只能在大學或報社使用大型計算機造成的延期。
1989年,美國新聞業(yè)界終于承認了計算機輔助新聞報道的價值,并為《亞特蘭大憲法報》(The Atlanta Journal-Constitution)調查住房貸款中種族差異的報道頒發(fā)了普利策新聞獎。同一年,Jaspin在密蘇里新聞學院建立了如今廣為人知的美國計算機輔助報道協(xié)會(The National Institute for Computer-Assisted Reporting -NICAR)的前身。之后1990年,印第安納州大學教授詹姆斯·布朗(James Brown)在印第安納州首府印第安納波利斯主持舉辦了第一屆計算機輔助新聞峰會。我出版書籍《計算機輔助新聞報道實踐指南》的稿費也資助了這次峰會的舉辦。這本書是第一本探究計算機輔助新聞報道的書籍而現(xiàn)在它已經發(fā)行到第四版了。
在90年代至21世紀早期,計算機輔助新聞報道的使用得到了巨大發(fā)展,主要原因在于美國調查編輯協(xié)會(Investigative Reporters and Editors-IRE)和美國計算機輔助報道協(xié)會在密蘇里州乃至全世界各地不斷舉辦研討會。這一系列的研討會已經是IRE和密蘇里新聞學院的聯(lián)合項目。
IRE官網(wǎng)
21世紀的早些年份,人們見證了全球深度報道網(wǎng)開始發(fā)揮著重要的作用,并于2001年在哥本哈根舉辦了第一屆峰會,這屆峰會提供了強大的計算機輔助新聞報道的路徑和親手實踐的訓練機會。
NICAR時代
1994年,NICAR(全國計算機輔助報道協(xié)會)正式創(chuàng)辦。培訓主管詹妮弗·拉斐爾(Jennifer LaFleur)和我雄心勃勃地發(fā)起了這個不斷壯大的項目,最終這個項目容納了每年50場峰會的規(guī)模。到了1996年,美國的風向成功地拓展到了其他國家,一些國外的記者終于開始在NICAR上成為數(shù)據(jù)新聞的“新兵”。此外,IRE連同麥考密克基金會在墨西哥城設立了一個在拉丁美洲監(jiān)督數(shù)據(jù)訓練的項目。
在90年代,美國之外的記者開始疑慮自己是否能夠在自己的國家獲得數(shù)據(jù)。這個訓練項目為他們展現(xiàn)了怎樣將國際或者美國的數(shù)據(jù)運用到他們的報道中,如何構建起他們自己的數(shù)據(jù)庫以及如何在自己的國家中找到數(shù)據(jù)。
通過這個項目的努力,1999年時芬蘭、瑞士、新西蘭、委內瑞拉、阿根廷、荷蘭、挪威、巴西、墨西哥、俄羅斯、波斯尼亞和加拿大各國的記者都開始在他們的新聞報道中融入數(shù)據(jù)分析。
同時,1997年時在倫敦,新聞學教授Milverton Wallace開始舉行“NetMedia”年度峰會,在互聯(lián)網(wǎng)上提供會話和由NICAR和丹麥記者們授課的計算機輔助新聞報道的相關課程。課程函蓋了互聯(lián)網(wǎng)的基礎使用、電子表格和數(shù)據(jù)庫管理。許多英國以及歐洲其他國家的記者甚至非洲記者都踴躍地參與了這些課程。
在丹麥曾于1996年在密蘇里州參與過訓練營的記者Nils Mulvad和Flemming Svith在NICAR的協(xié)助下在本國舉行了1997和1998年的年度峰會。他們同時出版了一本《丹麥計算機輔助報道手冊》,1998年還創(chuàng)建了丹麥國際分析性報道中心(DICAR)。2001年時他們還同IRE 一同組織籌備了第一屆全球調查性新聞峰會,同時該峰會也成為了瑞典、挪威、芬蘭和荷蘭的重要會議之一。
Nils Mulvad
通過全球調查峰會,使用數(shù)據(jù)的報道手段也很快地傳遞到東歐。在東歐,曾構建了有計劃性的犯罪與腐敗報道項目的Drew Sullivan以及羅馬尼亞記者Paul Radu成為了強有力的支持者和組織者。
研討會也通過密蘇里大學傳遞到了中國,透過世界報業(yè)協(xié)會擴散到了印度。同期,Steve Doig,計算機輔助新聞報道的先驅同時也是現(xiàn)在亞利桑那州立大學計算機輔助報道系的騎士會會長,在全球范圍內游歷講授計算機輔助報道。同他一樣的NICAR的培訓導師還有Jo Craven McGinty, Tom McGinty, Ron Nixon, Andy Lehren 和Sarah Cohen,他們如今都是《紐約時報》或《媒體》的記者。
Steve Doig
數(shù)據(jù)可視化不斷發(fā)展
2005年,新聞報道中的數(shù)據(jù)可視化的應用得到了空前的發(fā)展。當時美國的一位程序員Adrian Holovaty創(chuàng)建了一個關于芝加哥犯罪的谷歌聚合內容。這個項目刺激了更多的程序員針對新聞報道進行開發(fā)。Holovaty在2007年創(chuàng)建了Every Block,運用了更多本地數(shù)據(jù)融入到在線地圖之中,但是這個項目后來因沒有對政府數(shù)據(jù)的準確性進行更徹底的分析而遭到批評。
Adrian Holovaty
同一年,美國的開放數(shù)據(jù)運動正式開始,全球許多地區(qū)也開始進行了類似的努力。這樣的舉措增加了全球范圍內政府數(shù)據(jù)的可訪問性,雖然這樣的需求依然需要通過獲得信息法所保障的自由來獲取政府并未公布的數(shù)據(jù)。
到了2009年,越來越多的計算機程序要同新聞業(yè)內的程序員組建了hacks/hackers,促進了兩個不同職業(yè)的人群共享彼此的信息并緩解了兩個群體之間的文化沖突。
Aron Pilhofer,《紐約時報》、《衛(wèi)報》和西北大學新聞學院的Rich Gordon,都紛紛開始推動創(chuàng)建一個人際圈——這群人“對Web或數(shù)字應用發(fā)展、支持新聞業(yè)任務和目的科技創(chuàng)新感興趣”。同時在硅谷,Burt Herman讓記者和科技人員坐在了一起。三方開始創(chuàng)建Hacks/Hackers,最終達成的結果是一個技術日益成熟的新聞編輯室,增加了從網(wǎng)站獲取數(shù)據(jù)的能力,并使得數(shù)據(jù)更易于管理、可視化和可交互。
另外一個新聞與編程的復合型產物則是對數(shù)據(jù)的固有缺陷以及確保數(shù)據(jù)完整性的重新認知。
正如Marcos Vanetta,在《德州論壇報》的Mozilla OpenNews研究員所說:“錯誤是不可發(fā)生的……在軟件開發(fā)中我們常??梢苑稿e然后糾正它們,甚至最壞的情況下我們還有備份。但是在新聞中,你不能犯錯,你還有聲譽需要維系。編輯團隊并不能夠像開發(fā)人員那樣習慣失誤。”
近年的突破
2009、2010和2011年同樣也是數(shù)據(jù)新聞的突破之年。2009年在加拿大Fred Vallance-Jones 和David McKie出版了一本《計算機輔助報道之全面入門》,其中特別強調了加拿大的計算機輔助報道案例。歐洲的新聞中心開建了數(shù)據(jù)新聞中心,在全歐范圍內組織相關的工作團隊,記者Paul Bradshaw成為英國數(shù)據(jù)新聞公認的先驅。維基解密發(fā)布了阿富汗戰(zhàn)爭筆記及秘密文件還有伊拉克戰(zhàn)爭筆記,正待全世界的記者來處理這些大量的文本數(shù)據(jù)。
緊接著2011年,《衛(wèi)報》刊登的關于城市種族騷亂的系列報道令人印象深刻,同時Journalismfund.eu統(tǒng)籌了第一屆“數(shù)據(jù)收獲季”會議(Data Harvest conference)。
英國的新聞調查中心(由Gavin MacFadyen主導)在早期曾參與提供了IRE關于數(shù)據(jù)新聞的暑期學校課程,而在這個階段,它在計算機輔助報道領域老將David Donald的協(xié)助下繼續(xù)運行著自己的強有力的項目。
同時在南非的智慧大學(Wits University),Anton Harber 和Margaret Renn大大增加了年度電力會議上的數(shù)據(jù)會話,同時數(shù)據(jù)分析已經在亞洲和澳大利亞展開。
到了2015年,經過記者使用數(shù)據(jù)報道新聞快50年的歷程,顯而易見的是數(shù)據(jù)不僅成為了日常新聞的一部分,同時也成為新聞報道的一大驅動力。數(shù)據(jù)作為報道工具和報道手段的情境還在不斷地拓展。
應用電腦工具到新聞報道中發(fā)端于社會學研究手段和應用數(shù)據(jù)統(tǒng)計方法來探究社會問題。但是經過這些年,數(shù)據(jù)計算已經廣泛地拓展到探究典型案例和意外事件,記者們使用電子表格和數(shù)據(jù)管理工具對直觀上并不明顯相關的數(shù)據(jù)集進行相關性分析,使用繪制工具將數(shù)據(jù)映射到地理環(huán)境和社交網(wǎng)絡中,實施網(wǎng)絡抓取,甚至開始清洗數(shù)據(jù),將數(shù)據(jù)應用到眾籌,應用到與受眾的交互中,應用到多媒體環(huán)境乃至應用到文本挖掘。
關于將數(shù)據(jù)應用到高質量新聞和各種品牌活動這樣的行為應該怎么定義,依然有許多值得討論之處。但是,無論我們稱其為“精確新聞”、“計算機輔助報道”、“數(shù)據(jù)新聞”、“數(shù)據(jù)驅動新聞”或是“計算新聞”,好消息是,它將作為新聞的一部分而存在下去。