是否有可用于发现垃圾邮件机器人的 HTTP 标头字段？

发布于 2024-10-04 17:59:51 字数 706 浏览 21 评论 0原文

按理说，抓取工具和垃圾邮件机器人的构建不会像普通的网络浏览器那样好。考虑到这一点，似乎应该有某种方法可以通过查看公然的垃圾邮件机器人提出请求的方式来发现它们。

是否有任何方法可以分析 HTTP 标头，或者这只是一个白日梦？

Array
(
    [Host] => example.com
    [Connection] => keep-alive
    [Referer] => http://example.com/headers/
    [Cache-Control] => max-age=0
    [Accept] => application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
    [User-Agent] => Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.44 Safari/534.7
    [Accept-Encoding] => gzip,deflate,sdch
    [Accept-Language] => en-US,en;q=0.8
    [Accept-Charset] => ISO-8859-1,utf-8;q=0.7,*;q=0.3
)

原文

It stands to reason that scrapers and spambots wouldn't be built as well as normal web browsers. With this in mind, it seems like there should be some way to spot blatant spambots by just looking at the way they make requests.

Are there any methods for analyzing HTTP headers or is this just a pipe-dream?

Array
(
    [Host] => example.com
    [Connection] => keep-alive
    [Referer] => http://example.com/headers/
    [Cache-Control] => max-age=0
    [Accept] => application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
    [User-Agent] => Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.44 Safari/534.7
    [Accept-Encoding] => gzip,deflate,sdch
    [Accept-Language] => en-US,en;q=0.8
    [Accept-Charset] => ISO-8859-1,utf-8;q=0.7,*;q=0.3
)

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一绘本一梦想 2024-10-11 17:59:51

如果我正在编写垃圾邮件机器人，我会伪造普通浏览器的标头，所以我怀疑这是一种可行的方法。其他一些可能有帮助的建议

代替

如果验证码太烦人，可以使用验证码
，一个简单但有效的技巧是包含一个被 CSS 规则隐藏的文本输入；用户不会看到它，但垃圾邮件机器人通常不会费心去解析和应用所有 CSS 规则，因此他们不会意识到该字段不可见，并会在其中放入一些内容。检查表单提交时该字段是否为空，如果为空则忽略它。
在您的表单上使用随机数；检查呈现表单时使用的随机数是否与提交表单时使用的随机数相同。这不会捕获所有内容，但会确保该帖子至少是由首先收到该表单的人发布的。理想情况下，每次呈现表单时都更改随机数。

回复收藏 0 原文