目录

KDD99数据集介绍、下载及预处理:

1、NSL-KDD数据集介绍

2、NSL-KDD数据集是KDD 99数据集的改进

3、NSL-KDD数据集各文件介绍与下载KDDTrain+.ARFF: The full NSL-KDD train set with binarylabels in ARFF format

4、参考论文


KDD99数据集介绍、下载及预处理:

https://blog.csdn.net/asialee_bird/article/details/80491256

1、NSL-KDD数据集介绍

       NSL-KDD数据集解决了KDD99数据集中存在的固有问题。NSL-KDD数据集由于缺少基于入侵检测网络的公共数据集,所以NSL-KDD数据集仍然存在一些问题,同时也不是现有真实网络的完美代表。但它仍然可以用作有效的基准数据集,以帮助研究人员比较不同的入侵检测方法。NSL-KDD训练集和测试集的设置是合理的,不同研究工作的评估结果将是一致的和可比的。

2、NSL-KDD数据集是KDD 99数据集的改进

(1)NSL-KDD数据集的训练集中不包含冗余记录,所以分类器不会偏向更频繁的记录;

(2)NSL-KDD数据集的测试集中没有重复的记录,使得检测率更为准确。

(3)来自每个难度级别组的所选记录的数量与原始KDD数据集中的记录的百分比成反比。结果,不同机器学习方法的分类率在更宽的范围内变化,这使得对不同学习技术的准确评估更有效。

(4)训练和测试中的记录数量设置是合理的,这使得在整套实验上运行实验成本低廉而无需随机选择一小部分。因此,不同研究工作的评估结果将是一致的和可比较的。

3、NSL-KDD数据集各文件介绍与下载
KDDTrain+.ARFF: The full NSL-KDD train set with binarylabels in ARFF format

KDDTrain+.TXT: The full NSL-KDD train set includingattack-type labels and difficulty level in CSV format

KDDTrain+_20Percent.ARFF: A 20% subset of the KDDTrain+.arff file

KDDTrain+_20Percent.TXT: A 20% subset of the KDDTrain+.txt file

KDDTest+.ARFF: Thefull NSL-KDD test set with binary labels in ARFF format

KDDTest+.TXT: The full NSL-KDD test set includingattack-type labels and difficulty level in CSV format

KDDTest-21.ARFF: A subset of the KDDTest+.arff file whichdoes not include records with difficulty level of 21 out of 21

KDDTest-21.TXT: A subset of the KDDTest+.txt file whichdoes not include records with difficulty level of 21 out of 21

NSL-KDD数据集打包下载:

https://download.csdn.net/download/asialee_bird/10524006

4、参考论文

(1)A Detailed Analysis of the KDD CUP 99 Data Set

(2)A Detailed Analysis on NSL-KDD Dataset Using Various Machine Learning Techniques for Intrusion Detection