电子邮件混淆真的会使自动收集变得更加困难吗？

发布于 2024-07-30 12:23:32 字数 380 浏览 8 评论 0原文

许多用户和论坛程序试图通过混淆来使自动电子邮件地址收集更加困难 - @ 被替换为“at”和。被替换为“点”，所以

 [email protected]

现在

team at stackoverflow dot com

我不是正则表达式方面的专家，我真的很好奇 - 这种混淆真的会让自动收获变得更困难吗？自动识别这种混淆的地址真的更难吗？

原文

Many users and forum programs in attempt to make automatic e-mail address harversting harder conseal them via obfuscation - @ is replaced with "at" and . is replaced with "dot", so

 [email protected]

now becomes

team at stackoverflow dot com

I'm not an expert in regular expressions and I'm really curious - does such obfuscation really make automatic harvesting harder? Is it really much harder to automatically identify such obfuscated addresses?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

九歌凝 2024-08-06 12:23:32

确实！

我阅读了这篇文章不久前显示了各种方法的有效性（以及相对程度）。
目前，反转已经反转的字符串似乎是相当不错的保护。

以下代码示例：

<style type="text/css">
   span.codedirection { unicode-bidi:bidi-override; direction: rtl; }
</style>

<p><span class="codedirection">moc.etalllit@7raboofnavlis</span></p>

将输出电子邮件，以便至少可读。

也就是说，这几乎是一场军备竞赛。但只要你处于领先地位，获取你的地址就会比普通的未混淆的地址付出更多的努力。

Definitely!

I read this article a while ago which shows how effective (as well as the relative degree) the various methods can be.
Reversing an already reversed string seems to be fairly decent protection at the moment.

The following code sample:

<style type="text/css">
   span.codedirection { unicode-bidi:bidi-override; direction: rtl; }
</style>

<p><span class="codedirection">moc.etalllit@7raboofnavlis</span></p>

Will output the email so it's readable at least.

That said, it is almost an arms race. But as long at you're ahead of the curve, it'll be more effort to harvest your address rather than ordinary un-obfuscated ones.

回复收藏 0 原文

撩动你心 2024-08-06 12:23:32

混淆技术与验证码属于同一类别。它们不可靠，并且比机器人对普通用户的伤害更大。

JavaScript 混淆似乎受到赞扬，但并不是什么灵丹妙药：如今，自动化浏览器的电子邮件嗅探并不难。如果能在浏览器中显示出来，那就可以收获了。您甚至可以想象一个机器人会截取浏览器窗口的屏幕截图并使用 OCR 提取地址来击败您价值数百万美元的混淆技术。

根据您想要混淆电子邮件的位置和原因，这些技术可能很有用：

限制电子邮件可见性：您可以在您的网站/论坛上向匿名用户、新用户（几乎没有什么用处）隐藏电子邮件。迄今为止没有任何活动或帖子），甚至完全隐藏它们，并使用内置的私人消息传递功能取代成员之间的电子邮件联系。
使用专门的垃圾邮件过滤电子邮件：您会收到垃圾邮件，但仅限于该特定地址。当您需要向任何用户公开电子邮件地址时，这是一个很好的权衡。
使用联系表单：虽然机器人非常擅长填写表单，但事实证明它们太擅长填写表单了。隐藏字段技术可以过滤大部分即将到来的垃圾邮件通过您的联系表单。

回复收藏 0 原文

冧九 2024-08-06 12:23:32

当我看到这种类型的混淆时，我也立即想到了正则表达式。以这种方式收集“混淆”的电子邮件是小菜一碟。

我曾经有一个想法，以这种方式公开我的电子邮件地址：

你可以在这里给我发邮件：

string myEmail = "";
myEmail = myEmail
          .Append ("myname")
          .Append ("@")
          .Append ("domain")
          .Append (".")
          .Append ("com");

谁没有成功，就没有通过我的基本智力测试。

When I see this type of obfuscation I also immediately think of regular expressions. It's a piece of cake to harvest emails "obfuscated" in this manner.

I once came with an idea to publish my email address in this way:

You can mail me here:

string myEmail = "";
myEmail = myEmail
          .Append ("myname")
          .Append ("@")
          .Append ("domain")
          .Append (".")
          .Append ("com");

Whoever does not make it out, has failed my basic intelligence test.

回复收藏 0 原文

热风软妹 2024-08-06 12:23:32

垃圾邮件发送者和您的用户很难识别电子邮件地址。

维基百科上一篇关于电子邮件混淆或地址修改的好文章

隐藏电子邮件的一种常见方法
机器人和垃圾邮件发送者的目的是创建一个
包含电子邮件地址的图像。
例如，Facebook 就是这么做的。现在，
使用图像发送电子邮件本质上是
不利于可访问性，因为文本
读者将无法阅读它。
但即便如此，也有几个
免费的字符识别程序
可以很好地解码这样的
电子邮件图像。

来自此处

回复收藏 0 原文

娇柔作态 2024-08-06 12:23:32

我不确定它是否真的有助于处理垃圾邮件 - 但我已经学会喜欢 Escape Encode mailto 的混淆：标签/电子邮件。示例标记：

<a href="%6D%61%69%6C%74%6F%3A%74%65%61%6D%40%73%74%61%63%6B%6F%76%65%72%66%6C%6F%77%2E%63%6F%6D">team@stackoverflow.com</a>

邮件[电子邮件受保护]

I'm not sure if it really helps with spam - but I've learned to love the Escape Encode Obfuscation for mailto: tags/emails. An example tag:

<a href="%6D%61%69%6C%74%6F%3A%74%65%61%6D%40%73%74%61%63%6B%6F%76%65%72%66%6C%6F%77%2E%63%6F%6D">team@stackoverflow.com</a>

Mails [email protected]

回复收藏 0 原文

迷荒 2024-08-06 12:23:32

这类似于在前门上贴上“受 ADT 保护”的贴纸。

这能阻止有才华的窃贼进入你的房子吗？当然不是。

它会让隔壁的门没锁、窗户上放着 iPod 的房子成为更引人注目的目标吗？很有可能。

一个简单的、未混淆的电子邮件抓取工具将获取大量电子邮件。也许一个非常简单的正则表达式来获取非常常见的混淆方法是值得的。除此之外，您会花费大量时间尝试破译越来越少的电子邮件。

综上所述，进行一些巧妙的混淆可能是值得的。

根据记录，我的电子邮件多年来一直以纯文本形式出现在我的公开简历中，因为我使用 gmail，它有一个有效的垃圾邮件过滤器。

回复收藏 0 原文

离不开的别离 2024-08-06 12:23:32

我想知道为什么到目前为止没有人提到 ALAs 解决方案。

Roel Van Gils 在 2007 年写了一篇关于Graceful Email Obfuscation的文章

Graceful Email Obfuscation 只是一种JavaScript 电子邮件混淆技术，具有联系表单后备。

通过将电子邮件地址转换为指向联系表单的 URL 并应用 ROT13 转换
mailto:[电子邮件受保护] → contact/mail+example+com → contact/znvy+rknzcyr+pbz
通过 javascript < code>contact/znvy+rknzcyr+pbz 转换回 mailto:[email protected]
如果没有可用的 JavaScript，浏览器将打开 contact/znvy+rknzcyr+pbz 作为后备。由于 URL，联系表单将知道将电子邮件发送到哪里。

http://www.alistapart.com/articles/gracefulemailobfuscation/

回复收藏 0 原文

你的心境我的脸 2024-08-06 12:23:32

这确实让事情变得更加困难，但是有太多真正聪明的抓取工具，它可能没有多大帮助，因为大型垃圾邮件发送者正在使用高质量的垃圾邮件工具。

回复收藏 0 原文

音盲 2024-08-06 12:23:32

如何对抗垃圾邮件发送者？使电子邮件地址对于没有大脑的东西（即计算机）来说难以识别。

非英语人士是您的朋友：如果您的用户群是非英语社区，请切换到使用其他语言进行混淆：team_małpa_stackoverlow_kropka_com 或 team_Affenschwanz_stackoverflow_Punkt_com 分别是波兰语和德语社区的完全可识别的电子邮件地址。一些电子邮件收割者懂波兰语或德语，但大多数收割者可能只懂英语。

如果您不能离开英语，那么请切换到一些描述性短语 - 例如：“为了向我们发送消息，请在您的地址字段中写下团队，然后输入符号 AT，然后写下我们网站的名称！”。

回复收藏 0 原文

霊感 2024-08-06 12:23:32

从字面上看，是的，收集混淆地址比收集标准化地址更困难。真正的问题是收割机是否会付出额外的努力，以及收割机的（主要？次要？）障碍是否值得为您的用户带来可能的问题。

如果您打算打乱地址或以其他方式将它们从标准形式中调换，您应该避免在这样做时保持一致 - 至少在同一站点上。

例如，如果大型社区网站上的每个电子邮件地址在标记中都被反转，并使用 CSS 正确呈现，或标记替换（@ 变为“at”）或任何其他可预测的方法，那么收割者将只为以下内容编写一个瘦适配器：你的网站。

可以这样想：如果您只需一行代码即可在整个站点“打乱”它们，那么收割机也只需一行代码即可为您的站点“打乱”它们。大致说来。

在我看来，垃圾邮件已经成为一个严重的问题，如此多的数据库已被移交，以至于我们无法隐藏我们的地址。相反，请考虑查看 Defensio 和 Akismet 等，以帮助分类和阻止垃圾邮件。

回复收藏 0 原文

街角迷惘 2024-08-06 12:23:32

我有一个解决方案，嗯，更多的是一个理论。
问题是，机器人解析页面。他们可以获得文本。即使它被放置
通过 Javascript 以某种复杂的方式进入页面。

所以，只有你CSS3伪元素！它不会是一个链接，但您的电子邮件将是可见的，并且永远不会是实际的文本。像这样的东西：

.email::after{ content:'[email protected]'; }

再说一遍，这是一个理论，我不知道这些邪恶的人能走多远才能得到它，但我认为这是相当安全的。（除非他们解析CSS文件，我认为他们不会这样做）

I have a solution, well, more of a theory.
Problem is, the bots parse the page. they can get the text. even if it's being put
into the page in some sophisticated way through Javascript.

So, just you CSS3 pseudo element! it won't be a link, but your email will be visible, and will never be an actual text. something like this:

.email::after{ content:'[email protected]'; }

Again, it's a theory, I've no idea how far these evil people can go to get it, but I think this be pretty safe. (unless they parse the CSS files, which I don't think they do)

回复收藏 0 原文