专利基本信息
申请号 | CN201910225762.4 | 申请日 | 2019-03-25 |
公开(公告)号 | CN109981485A | 公开(公告)日 | 2019-07-05 |
申请公布号 | CN109981485A | 申请公布日 | 2019-07-05 |
分类号 | H04L12/851(2013.01)I; H04L29/06(2006.01)I; H04L29/12(2006.01)I | 分类 | 电通信技术 |
发明人 | 罗森林; 王帅鹏; 潘丽敏 | 申请(专利权)人 |
北京理工大学
|
代理机构 | – | 代理人 | – |
地址 | 100081 北京市海淀区中关村南大街5号 | ||
摘要 | 本发明涉及基于长短期记忆网络的V2ray流量识别方法,属于计算机网络安全领域。主要为了解决基于卷积神经网络的方法将数据转化为图片后训练出模型的可解释性较差,且未利用到加密流量在时间序列特征的问题。本发明首先从交换机获取V2ray流量和普通流量的数据链路层数据包并对数据包进行标注,其次去除不包含有用信息和冗余的数据包;然后将可能对模型训练造成影响的字节置零,对数据包的长度进行调整;最后使用这些预处理过的数据训练长短期记忆网络。该方法无需进行特征提取和选择,对V2ray流量的时间序列关系进行了学习,具有较好的识别效果。 | ||
|
1.基于长短期记忆网络的V2ray流量识别方法,其特征在于所述方法包括如下步骤:
步骤1,从交换机设备中获得数据链路层数据包并标注为V2ray流量或其他流量;
步骤2,去除数据中不包含有用信息和冗余的数据包,去除TCP三次握手数据包,去除DNS域名解析数据包,保留每次通信的前16个数据包,并将这16个数据包作为数据集中的一条数据;
步骤3,对数据链路层数据包进行处理,去除数据链路层报头获得网络层数据包,对UDP报头进行填充使其长度与TCP报头保持一致,去除网络层数据报头中的表示IP地址和端口的信息,对数据包长度进行调整,使其保持一致;
步骤4,使用这些预处理过的数据训练长短期记忆网络。
2.根据权利要求1所述的基于长短期记忆网络的V2ray流量识别方法,其特征在于:步骤2中去除TCP三次握手数据包,去除DNS域名解析数据包,保留每次通信的前16个数据包。
3.根据权利要求1所述的基于长短期记忆网络的V2ray流量识别方法,其特征在于:步骤3将UDP报头补零扩充为20字节。
4.根据权利要求1所述的基于长短期记忆网络的V2ray流量识别方法,其特征在于:步骤3将TCP报头和UDP报头表示目的地址、目的端口、源地址、源端口的字节修改为0。
5.根据权利要求1所述的基于长短期记忆网络的V2ray流量识别方法,其特征在于:步骤3中通过补零和截断的方法将每个数据包的长度修改为1500字节。
技术总结
本发明涉及基于长短期记忆网络的V2ray流量识别方法,属于计算机网络安全领域。主要为了解决基于卷积神经网络的方法将数据转化为图片后训练出模型的可解释性较差,且未利用到加密流量在时间序列特征的问题。本发明首先从交换机获取V2ray流量和普通流量的数据链路层数据包并对数据包进行标注,其次去除不包含有用信息和冗余的数据包;然后将可能对模型训练造成影响的字节置零,对数据包的长度进行调整;最后使用这些预处理过的数据训练长短期记忆网络。该方法无需进行特征提取和选择,对V2ray流量的时间序列关系进行了学习,具有较好的识别效果。