来自 netflow 的数据包配置文件

发布于 2024-12-27 12:56:07 字数 185 浏览 1 评论 0原文

我每 5 分钟有上个月的网络流量数据，我想对所有这些流量进行数据包分析。我需要 1 个数据包流、2 个数据包流等的百分比表示。可以在 1 个数据包流、1-100 个数据包流、100 个数据包流等类别中执行此操作...这并不那么重要。但我的问题是如何做到这一点。如何对无法相加的数据进行百分比表示？比如对每个文件进行百分比表示，然后对其进行某种类型的平均值？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

蒗幽 2025-01-03 12:56:07

“我不能加在一起”是什么意思？实际上，如果您查看手册，您可以使用 nfdump 来做到这一点：-R expr /dir/ file1:file2 读取file1到file2的所有文件。例如

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

将在 16:09 至 16:39 期间收集 NetFlow 信息。然后您可以对该数据执行任何您需要的查询。

What do you mean with "I can't add together"? Actually you can do that with nfdump, if you look at the manual: -R expr /dir/file1:file2 Read all files from file1 to file2. For istance

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

will gather NetFlow informations from 16:09 to 16:39. Then you can do whatever query you need on that data.

回复收藏 0 原文

云仙小弟 2025-01-03 12:56:07

听起来您正在描述直方图：您使用原始计数创建您所描述的大小的“箱”。箱的计数总和就是会话总数。要获得总流量的百分比，只需将每个容器除以总流量计数即可进行标准化。

因此，如果您制作一个两箱直方图，其中第一个箱是所有 << 会话的计数。 100个数据包流和另外100+个数据包流（注意不能有间隙或重叠），计算出前者有30个流，后者有60个流，那么总流数是90个，你33% 的流量少于 100 个数据包。

处理多个文件时，诀窍是始终使用相同的 bin 划分，并尽可能长时间地存储和使用原始计数，并且仅在最后一步导出 %s。您可以毫无问题地将直方图加在一起，只要它们的 bin 含义相同，然后当您对结果进行标准化时，您就可以得到每个 bin 的所有文件的总百分比。如果您需要添加文件，只需跟踪原始计数，以便在出现新数据时可以重新标准化。

您可以在 Matlab 等工具中轻松完成此操作，但要小心，因为其中许多工具会非常友好地为您自动确定 bin 宽度。因此，一个文件的直方图可能具有 bin {x <; 100, 100 <= x < 200, x >= 200} 另一个文件，{x <; 90, 90 <= x < 180, x >=180} 并且您将无法将结果相加。

回复收藏 0 原文

~没有更多了~