未備案網(wǎng)站如何去發(fā)現(xiàn)
實(shí)施網(wǎng)站備案管理是行業(yè)主管部門加強(qiáng)互聯(lián)網(wǎng)管理的重要舉措。在加強(qiáng)行政管理的同時(shí),使用適當(dāng)?shù)募夹g(shù)手段不僅可以節(jié)省人力資源,而且能大幅提升管理效率。本文通過(guò)對(duì)網(wǎng)站的接入機(jī)制的分析,提出了用技術(shù)手段發(fā)現(xiàn)未備案網(wǎng)站的方法。
未備案網(wǎng)站的接入形態(tài)
按照“先備案后接入”的原則,互聯(lián)網(wǎng)網(wǎng)站在接入前必須履行備案手續(xù)。絕大多數(shù)網(wǎng)站都依法依規(guī)履行了備案手續(xù),但仍然存在少數(shù)未備案接入的網(wǎng)站,并且不易發(fā)現(xiàn),主要有以下幾種情況:
1)虛擬主機(jī)網(wǎng)站。通過(guò)服務(wù)器空間分配及域名與空間對(duì)應(yīng)的技術(shù),實(shí)現(xiàn)一個(gè)IP對(duì)應(yīng)多個(gè)域名的訪問(wèn),即通常的所說(shuō)的虛擬主機(jī)。
2)專線私自接入網(wǎng)站。通過(guò)專線私自接入,網(wǎng)站主辦者如果沒(méi)有主動(dòng)報(bào)備,運(yùn)營(yíng)商很難發(fā)現(xiàn)。
3)IP網(wǎng)站。網(wǎng)站沒(méi)有域名,通過(guò)一個(gè)IP+端口號(hào)的形式提供訪問(wèn),多為企業(yè)自建內(nèi)部使用的系統(tǒng)。
4)跳轉(zhuǎn)網(wǎng)站。通過(guò)跳轉(zhuǎn)服務(wù)器實(shí)現(xiàn)網(wǎng)站異地接入,當(dāng)用戶訪問(wèn)一個(gè)域名時(shí),第一次獲取的IP地市為跳轉(zhuǎn)服務(wù)器地址,第二次獲取的IP地址才是真正的服務(wù)器地址,該類網(wǎng)站是問(wèn)題高發(fā)戶。
解決方案分析
針對(duì)上述網(wǎng)站接入的幾種形態(tài),可采用如下技術(shù)方案:
DNS分析
通過(guò)鏡像方式,實(shí)現(xiàn)對(duì)DNS響應(yīng)流量的采集,實(shí)時(shí)分析DNS響應(yīng)流量,效率高,準(zhǔn)確度高,發(fā)現(xiàn)網(wǎng)站范圍可覆蓋全省,包括虛擬主機(jī)、專線私自接入網(wǎng)站。
如圖1為DNS分析網(wǎng)站發(fā)現(xiàn)方案,在DNS上聯(lián)交換機(jī)鏡像DNS的響應(yīng)流量到一個(gè)千兆網(wǎng)口,并連接DNS分析服務(wù)器。
DNS分析服務(wù)器配置2塊千兆網(wǎng)卡,1個(gè)連接鏡像口,一個(gè)用于訪問(wèn)INTERNET。DNS分析服務(wù)器實(shí)時(shí)接收并分析DNS的響應(yīng)流量,發(fā)現(xiàn)監(jiān)控IP范圍內(nèi)的網(wǎng)站信息。
圖1 DNS分析網(wǎng)絡(luò)連接示意圖
HTTP分析
通過(guò)HTTP分析技術(shù),可有效發(fā)現(xiàn)IDC內(nèi)虛擬主機(jī)網(wǎng)站,該技術(shù)對(duì)流入80端口的流量進(jìn)行分析,處理數(shù)據(jù)量很小,效率高。與DNS技術(shù)相比,其優(yōu)勢(shì)在于不受訪問(wèn)用戶所使用的DNS限制,只要IDC內(nèi)網(wǎng)站被訪問(wèn)即可發(fā)現(xiàn)。
如圖2,通過(guò)在IDC核心交換機(jī)上,鏡像流入IDC內(nèi)的HTTP請(qǐng)求(80端口)并實(shí)時(shí)分析該流量,發(fā)現(xiàn)IDC內(nèi)網(wǎng)站。
圖2 HTTP分析網(wǎng)絡(luò)連接示意圖
爬蟲遍歷
相對(duì)于DNS分析及HTTP分析等被動(dòng)發(fā)現(xiàn)網(wǎng)站的技術(shù),爬蟲發(fā)現(xiàn)網(wǎng)站技術(shù)屬于主動(dòng)發(fā)現(xiàn)網(wǎng)站的技術(shù),該技術(shù)是通過(guò)爬蟲主動(dòng)遍歷網(wǎng)站間的鏈接并分析這些鏈接達(dá)到發(fā)現(xiàn)網(wǎng)站的目的。
從效率上講該技術(shù)不如DNS分析及HTTP分析效率高,但是該技術(shù)也是一種重要的未備案網(wǎng)站發(fā)現(xiàn)技術(shù)。作為DNS分析和HTTP分析技術(shù)手段的補(bǔ)充,爬蟲技術(shù)可發(fā)現(xiàn)上述兩種技術(shù)不能發(fā)現(xiàn)的未備案網(wǎng)站。
如圖3,爬蟲通過(guò)種子站點(diǎn),作為抓取的入口,遍歷網(wǎng)站頁(yè)面的鏈接,通過(guò)URL分析網(wǎng)站的域名信息。
圖3 爬蟲遍歷網(wǎng)絡(luò)連接示意圖
IP網(wǎng)站掃描等技術(shù)
上述3種技術(shù)方案能有效地發(fā)現(xiàn)未備案的網(wǎng)站。對(duì)于IP+端口號(hào)作為訪問(wèn)入口的網(wǎng)站,以及以跳轉(zhuǎn)服務(wù)器作為網(wǎng)站訪問(wèn)入口的跳轉(zhuǎn)網(wǎng)站,在上述3種解決方案做適當(dāng)?shù)刈兓灿休^好地處理效果。
結(jié)語(yǔ) 用技術(shù)方式實(shí)現(xiàn)未備案網(wǎng)站的發(fā)展功能,能有效地增強(qiáng)相關(guān)管理部門對(duì)互聯(lián)網(wǎng)的管理能力。網(wǎng)絡(luò)技術(shù)的發(fā)展日新月異,技術(shù)手段作為一種輔助管理手段,也要與時(shí)俱進(jìn),不斷改進(jìn)和完善。