摘 要:科技情報大數(shù)據(jù)運用行業(yè)人工智能分析技術,基于及時、海量、跨領域、高縱深的互聯(lián)網(wǎng)大數(shù)據(jù),為政府和企事業(yè)單位打造可定向抓取、語義分析、深度學習、完善知識圖譜的人工智能科技情報解決方案。還可以滿足地區(qū)競爭力、企業(yè)發(fā)展、競對狀況、行業(yè)/技術跟蹤等方面的科技情報挖掘需求。IDC估計,到2020年,33%的數(shù)據(jù)將包含有價值的信息。Hadoop 的目的在于基于一種新的方法來存儲和處理復雜的數(shù)據(jù)。通過把數(shù)據(jù)均衡分布到集群上,復制副本以確保數(shù)據(jù)的可靠性和容錯性。存儲和計算都分布到多個機器上,以充分體現(xiàn)數(shù)據(jù)的本地性,且當前很多數(shù)據(jù)庫也支持數(shù)據(jù)分片技術。Hadoop分布式系統(tǒng)已成為大數(shù)據(jù)挖掘系統(tǒng)的重要組成部分。文中在Hadoop分布式平臺上完成了科技情報數(shù)據(jù)深度分析的一次實踐。
摘 要:在信息化時代,科技情報業(yè)務對信息系統(tǒng)的依賴日益增強,相應地,信息系統(tǒng)安全問題已引起人們的關注??萍记閳髽I(yè)務系統(tǒng)如果因系統(tǒng)軟硬件故障、黑客惡意攻擊、網(wǎng)絡病毒感染、文件非法拷貝而出現(xiàn)問題,甚至癱瘓,將直接影響科技情報收集、分析、加工、發(fā)布等業(yè)務的正常運行。