摘要:定位技術的飛速發(fā)展催生了時空軌跡大數(shù)據(jù),軌跡數(shù)據(jù)中往往存在著明顯偏離軌跡的異常點。檢測出軌跡中的異常點對提高數(shù)據(jù)質量和后續(xù)軌跡數(shù)據(jù)挖掘精度至關重要。該文提出了一種基于雙向長短時記憶網(wǎng)絡(Bidirectional Long Short-Term Memory, Bi-LSTM)模型的軌跡異常點檢測算法。首先對每個軌跡點提取一個6維的運動特征向量,然后構建了一個Bi-LSTM模型,模型輸入為一定序列長度的軌跡數(shù)據(jù)特征向量,輸出為軌跡點的類型結果。同時,算法采用了欠采樣和過采樣的組合方法緩解類別不平衡對檢測性能的影響。融合了長短時記憶網(wǎng)絡單元和雙向網(wǎng)絡,Bi-LSTM模型能夠自動學習正常點和鄰近異常點在運動特征上的差異?;谡鎸嵈败壽E標注數(shù)據(jù)的實驗結果表明,該文算法的檢測性能顯著優(yōu)于恒定速度閾值法、不考慮數(shù)據(jù)時序性的經(jīng)典機器學習分類算法和卷積神經(jīng)網(wǎng)絡模型,尤其是召回率達到了0.902,驗證了該文算法的有效性。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社