摘要:通信網(wǎng)絡(luò)中的異常檢測為發(fā)現(xiàn)新的攻擊、錯誤配置和網(wǎng)絡(luò)故障提供了依據(jù)。 數(shù)據(jù)存儲、傳輸和處理的資源約束使得將輸入數(shù)據(jù)限制在與檢測任務(wù)高度相關(guān)的特性上,并且 (b)可以很容易地從網(wǎng)絡(luò)觀察中派生出來,而無需昂貴的操作。 去除強(qiáng)相關(guān)、冗余和不相關(guān)的特性也提高了基于學(xué)習(xí)技術(shù)的許多算法的檢測質(zhì)量。 本文討論了基于網(wǎng)絡(luò)流量的異常檢測的特征選擇問題。 我們提出了一種采用過濾器和逐步回歸包裝器的多階段特征選擇方法。 我們的分析基于41個廣泛采用的流量特征,這些特征出現(xiàn)在幾個常用的流量數(shù)據(jù)集中。 結(jié)合特征選擇方法,可以將原始特征向量從41個減少到16個。