文章/答案/技术大牛

发布

社区首页 >问答首页 >互联网流量分类

问互联网流量分类
EN

Stack Overflow用户

提问于 2013-03-03 07:35:31

回答 1查看 578关注 0票数 0

最近，我读了一些关于互联网流量分类的论文，特别是使用机器学习算法。

我打算对它进行研究，我想在本学期的机器学习课上提出一个关于互联网流量分类的项目想法。

我的第一步是在由3-4个客户端组成的本地网络上收集数据。我正在使用wireshark工具来嗅探数据包。

我的下一步是从wireshark数据包中提取TCP流。在这一步中，我尝试在Linux上使用tcpflow。tcpflow为每个流创建不同的文件。在这里，文件的内容大多是二进制的，我不知道如何从这些文件中提取鉴别器。

有人可以给我一个想法或分享他/她的经验，我如何解释tcpflow文件？如果能听到你的建议，我会非常高兴的。

提前谢谢。

machine-learning

classification

traffic

回答 1

Stack Overflow用户

发布于 2013-03-03 08:05:31

以下是您可以从TCP流量中提取的功能的一些想法：

端口/协议(大多数协议通常使用服务器上的同一端口)
数据包频率和大小(短命令数据包或长数据流)
TCP连接阶段
流错误/

控制消息和速率限制

为了更好地提取特征，您可能需要查看一些协议(HTTP、DNS等)本身的详细信息，而不仅仅是TCP流。我认为wireshark已经做到了这一点，那么为什么不重用他们的库功能呢？

您可能还想看看入侵检测系统( design of intrusion detection systems，IDS)，因为它们对流量几乎做了同样的事情，并试图将其分类为良性或恶意。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15180697

复制

相似问题

问互联网流量分类
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问互联网流量分类EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问互联网流量分类
EN