摘要:針對(duì)傳統(tǒng)序列模式挖掘算法都是針對(duì)單機(jī)環(huán)境、靜態(tài)實(shí)例以及非連續(xù)軌跡的不足,提出了Map/Reduce系統(tǒng)與經(jīng)過優(yōu)化的PrefixSpan序列模式挖掘算法相結(jié)合的改進(jìn)型算法。該算法在生成投影數(shù)據(jù)庫(kù)時(shí),只有當(dāng)待投影序列的第一個(gè)元素和前綴的最后一個(gè)元素相同時(shí)才會(huì)被選中,保證了挖掘出的都是連續(xù)軌跡片段。同時(shí)采用并行處理的方法,使用Map函數(shù)構(gòu)建每個(gè)頻繁序列前綴對(duì)應(yīng)的投影數(shù)據(jù)庫(kù),使用Reduce函數(shù)整合所有的中間鍵值對(duì)得到需要的結(jié)果。