違規(guī)“爬蟲”遭圍堵,對大數(shù)據(jù)公司監(jiān)管趨嚴
未來幾年數(shù)據(jù)泄露事件的增長率也許會達到100%,除非數(shù)據(jù)在其源頭就能夠得到安全保障??梢哉f,在未來,每個財富500強企業(yè)都會面臨數(shù)據(jù)攻擊,無論他們是否已經(jīng)做好安全防范。而所有企業(yè),無論規(guī)模大小,都需要重新審視今天的安全定義。在財富500強企業(yè)中,超過50%將會設(shè)置首席信息安全官這一職位。
回顧10月發(fā)生的大事,多家大數(shù)據(jù)公司被爆“違規(guī)爬蟲”必須位列其中。北上廣深杭地區(qū)的多家大數(shù)據(jù)公司、爬蟲公司、放貸公司等被查。目前監(jiān)管層的監(jiān)管已經(jīng)進入銀行層面。銀行內(nèi)部人士透露,銀行已經(jīng)收到了通知,稱監(jiān)管層要求銀行填寫是否與第三方數(shù)據(jù)公司開展合作。有業(yè)內(nèi)資深分析人士告訴《華夏時報》記者,大數(shù)據(jù)公司爬取明確禁止或未被授權(quán)的信息,都算是違規(guī)的,爬取數(shù)據(jù)時會有一個robots協(xié)議,明確了網(wǎng)站中哪些內(nèi)容是不應(yīng)被抓取的,哪些是可以抓取的。
大數(shù)據(jù)公司被查
根據(jù)百度百科介紹,網(wǎng)絡(luò)爬蟲(又稱為網(wǎng)頁蜘蛛),是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。“通俗點來講,爬蟲它的基本操作就是模擬人的行為去各個網(wǎng)站溜達,點點按鈕,查查數(shù)據(jù),或者把看到的信息背回來。就像一只蟲子在一幢樓里不知疲倦地爬來爬去。” 一位從業(yè)者王哈魯對本報記者表示。
事實上,爬蟲技術(shù)是具有相關(guān)數(shù)據(jù)業(yè)務(wù)的公司常用的一種技術(shù)。上述業(yè)內(nèi)人士對本報記者坦言,百度、谷歌搜索最基本的技術(shù)就是爬蟲,自動抓取網(wǎng)頁及相關(guān)信息,然后做整合輸出。至于會抓取到什么程度呢?“基本上能看到的都能被抓到。”該業(yè)內(nèi)分析人士還對記者補充說,不顯示并不代表不存在,用戶曾經(jīng)使用的有留存記錄,即使刪除可能還會保存在某數(shù)據(jù)庫或服務(wù)器上,所以仍有被爬蟲到的可能,不過對爬蟲技術(shù)會有很高的要求。
大概是9月中旬前后開始,多家大數(shù)據(jù)公司出現(xiàn)大大小小的事情,起因大都是違規(guī)經(jīng)營爬蟲業(yè)務(wù)。多家大數(shù)據(jù)公司被警方調(diào)查,高管人員被帶走,也停止了爬蟲服務(wù)。9月6日,杭州魔蝎科技的一位核心高管人員被警方帶走調(diào)查。同一天,新顏科技CEO也被警方要求協(xié)助調(diào)查。之后,還有多家大數(shù)據(jù)公司被警方調(diào)查,包括公信寶、集奧聚合、同盾科技、立木征信等,相應(yīng)的爬蟲業(yè)務(wù)也被迫關(guān)停。
行業(yè)也嗅到了危險,紛紛主動停止爬蟲服務(wù)。在魔蝎科技、新顏科技被查后,第三方數(shù)據(jù)服務(wù)公司聚信立做出反應(yīng),并于2019年9月6日停止對外提供用戶授權(quán)的運營商爬蟲服務(wù)。爬蟲服務(wù)平臺白騎士、天機數(shù)據(jù)也已經(jīng)暫停爬蟲服務(wù)。值得一提的是,“爬蟲”早在2017年下半年就已經(jīng)陷入輿論的漩渦,源于一些大數(shù)據(jù)公司被曝出違規(guī)爬蟲竊取現(xiàn)金貸放貸數(shù)據(jù)。
2017年現(xiàn)金貸發(fā)展迅猛,亂象叢生,暴露的問題也越來越多?,F(xiàn)金貸成為眾人口誅筆伐的對象。直到監(jiān)管在2017年12月1日下發(fā)整頓現(xiàn)金貸的141號文,行業(yè)才有了改善?,F(xiàn)金貸行業(yè)出現(xiàn)的問題之一是部分現(xiàn)金貸公司開發(fā)了“同業(yè)爬蟲”產(chǎn)品,可以直接將其他現(xiàn)金貸公司的包括放貸額度、風控等相關(guān)數(shù)據(jù)爬取過來。這樣一來,現(xiàn)金貸公司大大的減少了放貸成本,通過同業(yè)爬蟲就可以解決問題,大數(shù)據(jù)公司的“爬蟲技術(shù)”卻日漸式微。
為了增強自身的競爭力,不少大數(shù)據(jù)公司打“擦邊球”甚至不惜違規(guī)爬蟲。2017年11月,有文章爆出大數(shù)據(jù)公司聚立信、魔蝎科技有償為現(xiàn)金貸公司爬取放貸數(shù)據(jù)等,被爬取的公司包括支付寶、微信、其他現(xiàn)金貸公司。隨后,魔蝎科技COO張俊九發(fā)布內(nèi)部信表示,未來2個月,將逐漸關(guān)停爬蟲業(yè)務(wù),同時會啟動向已簽約客戶的賠償機制。這算是承認了公司存在的違規(guī)爬蟲問題。
為防止個人信息泄露,行業(yè)內(nèi)也出現(xiàn)了反爬蟲技術(shù)。不過上述業(yè)內(nèi)分析人士對本報記者坦言,爬蟲、反爬蟲、反反爬蟲,永遠是一個此消彼長的過程,只要爬數(shù)據(jù)產(chǎn)生的利益大于成本,就會有人去做。所以反爬蟲的關(guān)鍵是加強技術(shù)升級,增加爬數(shù)據(jù)的成本,同時重點監(jiān)控爬數(shù)據(jù)的對象,必要時訴諸法律??膳碌氖?,很多時候,我們根本不知道是誰在爬取數(shù)據(jù)。在移動互聯(lián)網(wǎng)迅猛發(fā)展的時代,數(shù)據(jù)和流量對于互聯(lián)網(wǎng)公司至關(guān)重要,為了兩者甚至不惜一遍遍挑戰(zhàn)監(jiān)管的底線,最終將會遭到監(jiān)管的重罰。
監(jiān)管趨嚴
中國社會科學(xué)院金融研究所法與金融研究室副主任尹振濤曾接受本報記者采訪時表示,催收不是一件小事情也不是新鮮事,現(xiàn)在出臺了《網(wǎng)絡(luò)安全法》,可能還會有《數(shù)據(jù)安全管理辦法》、《個人金融信息(數(shù)據(jù))保護試行辦法》相繼出臺。
《網(wǎng)絡(luò)安全法》于自2017年6月1日起正式實施,明確規(guī)定任何個人和組織不得從事非法侵入他人網(wǎng)絡(luò)、干擾他人網(wǎng)絡(luò)正常功能、竊取網(wǎng)絡(luò)數(shù)據(jù)等危害網(wǎng)絡(luò)安全的活動;不得提供專門用于從事侵入網(wǎng)絡(luò)、干擾網(wǎng)絡(luò)正常功能及防護措施、竊取網(wǎng)絡(luò)數(shù)據(jù)等危害網(wǎng)絡(luò)安全活動的程序、工具;明知他人從事危害網(wǎng)絡(luò)安全的活動的,不得為其提供技術(shù)支持、廣告推廣、支付結(jié)算等幫助。網(wǎng)絡(luò)數(shù)據(jù),是指通過網(wǎng)絡(luò)收集、存儲、傳輸、處理和產(chǎn)生的各種電子數(shù)據(jù)。
2019年6月,網(wǎng)信辦發(fā)布的《數(shù)據(jù)安全管理辦法(征求意見稿)》是對《網(wǎng)絡(luò)安全法》的細化,對網(wǎng)絡(luò)運營者在數(shù)據(jù)收集、處理使用、安全監(jiān)督管理等方面提出了要求,同時對公眾關(guān)心的個人敏感信息收集方式、廣告精準推送、賬戶注銷難等問題做出了回應(yīng)。
即將出臺的《個人金融信息(數(shù)據(jù))保護試行辦法》則側(cè)重于完善征信機制體制建設(shè),將對金融機構(gòu)與第三方之間征信業(yè)務(wù)活動等進一步做出明確規(guī)定,加大對違規(guī)采集、使用個人征信信息的懲處力度。違規(guī)爬蟲的成本提升,網(wǎng)絡(luò)數(shù)據(jù)環(huán)境或許會有所改善。
監(jiān)管也許會遲到,但一定不會缺席。據(jù)財新報道,10月22日,北京金融局窗口指導(dǎo)摸排區(qū)內(nèi)所有大數(shù)據(jù)公司是否存在違規(guī)爬蟲業(yè)務(wù),如果沒有則要求公司做出承諾函,如果存在違規(guī)爬蟲業(yè)務(wù),要上報并盡快整改。
另外21世紀經(jīng)濟報道稱,中國人民銀行、中國銀保監(jiān)會已組成調(diào)查組,摸底大數(shù)據(jù)的使用邊界和采集邊界,將會涉及外包催收公司管理辦法。首批排查和調(diào)研的機構(gòu)包括一諾銀華、萬盛金融和平安普惠。其中,一諾銀華是上海的一家資產(chǎn)處置公司,曾在2015年10月高調(diào)掛牌新三板,在取得掛牌同意函、全國建設(shè)分公司后,卻因政策限制悄然退市。如今,另外一家催收公司湖南永雄又欲赴美上市,結(jié)果如何記者無從得知。
相關(guān)監(jiān)管文件集中爆發(fā)。有銀行內(nèi)部人士透露,銀行已經(jīng)收到了通知,稱央行發(fā)文緊急調(diào)研要求銀行填寫是否與第三方數(shù)據(jù)公司開展合作。排查內(nèi)容涉及數(shù)據(jù)采集、信用欺詐、信用評分、風控建模方面,央行要求上報第三方數(shù)據(jù)公司的名字、股東背景、是否涉及爬蟲??倸w一句話,大數(shù)據(jù)公司將面臨嚴監(jiān)管,用戶的個人信息也會得到維護。