背景我就不介绍了.浪费大家流量.
KDD-99是基于林肯实验室的网络异常流量数据集想下载的链接在这里
源文件的每一行是这样的:
可以看出第2,34还有最后一个都是為非数值类型.
现在我们用python的frame详解的将其中的值根据其在列表中出现的顺序值替换为数值.
列表在这里
先用split()函数将源文件切割成列表
然后傳入一个叫replace_kdd(list)的函数
然后在代码72行有个列表,是用于确定你要替换的在整个源文件中的位置的
99999是用了防止溢出
然后在replace_kdd(list)函数里面调用了一个countingFunction(type_into, name)
这個函数用了计算在上面那个列表中元素的位置然后返回这个位置,作为值写入文件中
替换后的文件如下
思想大概就是这样最后贴出代碼的github位置,欢迎大家提出好的想法联系方式github和CSDN上都有写.
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。