kafka如何实时采集http请求

发布于 2021-11-20 14:29:38 字数 238 浏览 866 评论 5

@FrankHui 你好,想跟你请教个问题:
我现在想实时采集Nginx收到的http请求
打算使用kafka来缓存采集到的数据
但是现在的问题就是如何才能将Nignx的请求实时采集到Kafka中
你有遇到过类似的问题吗?
非常感谢

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(5

孤独患者 2021-11-27 02:15:24

目前是用flume做了个转发程序:用embeded的jetty来接收nginx转发的请求,然后再输出到kafka中。但是测试发现转发的性能堪忧,所以想看看有没有什么其它的方式。

乞讨 2021-11-26 21:37:41

我还是觉得他现在的处理方式更简单灵活,找到性能瓶颈优化下

挽清梦 2021-11-26 16:18:04

回复
问题就是用什么来转发的问题。目前的写的flume程序,单独用ab 测试能达到10000/s的量,但是前边加个nginx转发,瞬间就不行了。所以在想有没有什么更好的东西。

流心雨 2021-11-24 12:42:52

现在kafka已经提供了c的模块,可以修改nginx的log module,比较方便 https://cwiki.apache.org/confluence/display/KAFKA/Clients#Clients-C

苍暮颜 2021-11-22 02:37:11

kafka 现在好像只有java的客户端  nginx本身就有日志模块的啊  如果你非要用kafka的话  就按照kafka的协议 写个客户端好了  producer不是很难写的  

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文