当前位置：文江博客话题详情

从回复电子邮件中删除之前的部分

发布于 2024-09-24 10:56:11 字数 274 浏览 4 评论 0原文

我正在尝试编写定期接收电子邮件的应用程序。它将每封邮件写入数据库。但有时我会收到“回复：”电子邮件，如下所示：

新消息
2010年9月21日24:26有人写道(a)：
|旧消息 |

格式取决于电子邮件提供商。

是否有任何库可以帮助从电子邮件中删除“Re”部分？也许 IMAP 服务器可以做到这一点？我在数据库中有所有以前来自线程的电子邮件，因此我可以获取它们并在新消息中搜索。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

未央 2024-10-01 10:56:11

如果您能够将回复 (RE:) 消息与其作为回复的原始/上一条消息关联起来，那么我认为您可以从数据库中获取原始/上一条消息的正文，然后删除该文本来自回复正文。但是，此方法不会 100% 准确，因为客户可以将 HTML/富文本电子邮件转换为纯文本，反之亦然。在任何这种情况下，这个方法可能都行不通。即便如此，这种技术仍然是通用的，并且可能在大多数情况下都有效。

此外，电子邮件提供商可能会在回复中引用消息的开头添加某些标头字段或前导码。在这种情况下，我认为没有任何“包罗万象”的解决方案。

我的建议是针对一些真正庞大的网络邮件提供商（Gmail、雅虎、微软等），了解他们用于回复的格式并相应地解析消息。此外，您还可以处理一些通用格式。例如，“>”字符通常用在回复中每行引用文本的开头。

如果您打算使用 C# 等语言进行开发，请为自己创建一个类似 IReplyFormat 的接口，其中包含每个提供程序的相应实现，以及可能的一些通用格式。

我认为您不会找到解决此问题的任何包罗万象/完美的解决方案，因为有太多的邮件提供商具有太多不同的格式。然而，我认为你至少可以找到一些技术，就像上面提到的那些，这些技术对你来说会更有效，这是你目前所能期望的最好结果。

回复收藏 0 原文

谜泪 2024-10-01 10:56:11

就我个人而言，我认为您在这里运气不佳，因为消息副本是正文的一部分。因此，为了删除它，您必须处理消息正文并为每种已知格式编写提取方法（显然问题是您无法知道所有可能的格式）。

那么，为什么不将整个消息保存到数据库中，而不是解析正文呢？通常消息的大小不应该成为现代 DBMS 的问题。如果确实有问题，您始终可以压缩主体并将其存储在 BLOB 中。

回复收藏 0 原文

别靠近我心 2024-10-01 10:56:11

没有 IMAP 服务器不会也不会删除任何内容
这样的库不存在，因为没有标准，每个电子邮件提供商都以不同的方式执行，gmail 等开发了自己的工具
您必须寻找模式，该模式将以某种方式以收件人的标头开始作为发件人，例如...

发件人：<收据>
发件人：“姓名”<收件人>
发件人：收货人

并且您必须省略下面这一行中的部分，但是仅检查这一点是不够的，因为通常 from 后面跟着 subject、cc、to 等，因此需要检查模式。我认为可能存在一些开源项目或文本库，但在谷歌上很难找到它。

No IMAP Server will not and does not remove anything
Such library does not exist because there is no standard, every email provider does it differently, gmail etc have developped their own tools
You have to look for pattern, that will somehow begin with headers with recipient as sender, like...

From: <receipent>
From: "NAME" <receipent>
From: receipent

and you have to omit the parts from this line below, howerver only checking this will not be sufficient as usually from is followed by subject,cc,to etc, so the pattern needs to be checked. I think some open source project or text library may exist, but its too difficult to find it on google.

回复收藏 0 原文