如何在 Express.js 服务器上过滤机器人

发布于 2025-01-11 04:22:53 字数 916 浏览 0 评论 0原文

我创建了一个 Express Node.js API，并将其部署到 AWS（带有 2 个 EC2 实例的 Elasticbeanstalk）。我正在使用 morgan-body 包来记录端点上的请求和响应，但似乎有大量机器人正在“攻击”我的 API，这会导致每个月产生数百万条日志，这让我在 datadog 上损失惨重。我已经使用 morgan-boday 的内置“跳过”功能来根据用户代理过滤请求，但似乎每天都会出现新的请求。有没有一种方法可以跳过各种机器人的日志记录，而不需要一一检查它们？这是我的代码，非常感谢您的帮助！ :)

morganBody(app, {
skip: (req, res) => {
    if(req.get('user-agent')){
        if (req.get('user-agent').startsWith('ELB-HealthChecker') ||
        req.get('user-agent').startsWith('Mozilla') ||
        req.get('user-agent').startsWith('Mozlila')||
        req.get('user-agent').startsWith('Python')||
        req.get('user-agent').startsWith('python')||
        req.get('user-agent').startsWith('l9explore')||
        req.get('user-agent').startsWith('Go-http-client')
        
        ) {
            return true
        }
    }
    return false},
    logRequestBody:false,
    logResponseBody: false
});```

原文

I have created an express node.js API, and deployed it to AWS (Elasticbeanstalk with 2 EC2 instances).
I am using the morgan-body package to log the requests and responses on my endpoints, but it seems that tons of bots are "attacking" my API, and this results in millions of logs every months, which cost me a fortune with datadog.
I have used morgan-boday's built-in "skip" feature to filter requests based on the user agents, but new ones seem to appear every day.
Is there a way to skip logging for all kinds of bots, without checking them one by one ?
Here is my code, many thanks for your help ! :)

morganBody(app, {
skip: (req, res) => {
    if(req.get('user-agent')){
        if (req.get('user-agent').startsWith('ELB-HealthChecker') ||
        req.get('user-agent').startsWith('Mozilla') ||
        req.get('user-agent').startsWith('Mozlila')||
        req.get('user-agent').startsWith('Python')||
        req.get('user-agent').startsWith('python')||
        req.get('user-agent').startsWith('l9explore')||
        req.get('user-agent').startsWith('Go-http-client')
        
        ) {
            return true
        }
    }
    return false},
    logRequestBody:false,
    logResponseBody: false
});```

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

﹂绝世的画 2025-01-18 04:22:53

欢迎来到互联网。机器人/垃圾邮件检测是最需要解决的微不足道的问题之一。您添加的每个逻辑都可以通过客户端的反向逻辑来否定。

AWS 本身就有一个工具。
https://aws.amazon.com/waf/features/bot-control/< /a>

过滤流量的良好策略将基于用例。

一些建议。

引入登录/会话仅允许经过身份验证的会话
请求标头过滤
IP范围过滤
来自单个IP的流量
来自不同IP的请求率等。
不需要时使服务离线。

互联网上应该有更多材料。

回复收藏 0 原文

绿光 2025-01-18 04:22:53

我通过简单地跳过所有 GET 请求找到了部分答案：（

if (req.method === "GET") {
    return true
}

我仍然收到机器人的一些 POST 请求，这增加了我的日志量，但我仍然不知道如何过滤它们......）

I figured out part of the answer, by simply skipping all GET requests:

if (req.method === "GET") {
    return true
}

(I am still getting some POST requests by bots which increase my logs volumes and I still do not know how to filter them...)

回复收藏 0 原文

~没有更多了~

关于作者

苍风燃霜

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

如何在 Express.js 服务器上过滤机器人

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

若能看破又如何

夢野间

doggiejohn

就此别过

初见终念

qq_rvKjBH

友情链接

如何在 Express.js 服务器上过滤机器人

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

若能看破又如何

夢野间

doggiejohn

就此别过

初见终念

qq_rvKjBH

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。