摘 要:科技情報(bào)大數(shù)據(jù)運(yùn)用行業(yè)人工智能分析技術(shù),基于及時(shí)、海量、跨領(lǐng)域、高縱深的互聯(lián)網(wǎng)大數(shù)據(jù),為政府和企事業(yè)單位打造可定向抓取、語(yǔ)義分析、深度學(xué)習(xí)、完善知識(shí)圖譜的人工智能科技情報(bào)解決方案。還可以滿足地區(qū)競(jìng)爭(zhēng)力、企業(yè)發(fā)展、競(jìng)對(duì)狀況、行業(yè)/技術(shù)跟蹤等方面的科技情報(bào)挖掘需求。IDC估計(jì),到2020年,33%的數(shù)據(jù)將包含有價(jià)值的信息。Hadoop 的目的在于基于一種新的方法來(lái)存儲(chǔ)和處理復(fù)雜的數(shù)據(jù)。通過(guò)把數(shù)據(jù)均衡分布到集群上,復(fù)制副本以確保數(shù)據(jù)的可靠性和容錯(cuò)性。存儲(chǔ)和計(jì)算都分布到多個(gè)機(jī)器上,以充分體現(xiàn)數(shù)據(jù)的本地性,且當(dāng)前很多數(shù)據(jù)庫(kù)也支持?jǐn)?shù)據(jù)分片技術(shù)。Hadoop分布式系統(tǒng)已成為大數(shù)據(jù)挖掘系統(tǒng)的重要組成部分。文中在Hadoop分布式平臺(tái)上完成了科技情報(bào)數(shù)據(jù)深度分析的一次實(shí)踐。
摘 要:在信息化時(shí)代,科技情報(bào)業(yè)務(wù)對(duì)信息系統(tǒng)的依賴日益增強(qiáng),相應(yīng)地,信息系統(tǒng)安全問(wèn)題已引起人們的關(guān)注??萍记閳?bào)業(yè)務(wù)系統(tǒng)如果因系統(tǒng)軟硬件故障、黑客惡意攻擊、網(wǎng)絡(luò)病毒感染、文件非法拷貝而出現(xiàn)問(wèn)題,甚至癱瘓,將直接影響科技情報(bào)收集、分析、加工、發(fā)布等業(yè)務(wù)的正常運(yùn)行。