从 Gmail 中的电子邮件中下载并提取信息
我想从所有项目下载邮件并对邮件进行一些分析。 这可能涉及两个不同的组成部分。
- 使用 IMAP 下载邮件
- 解析电子邮件中的非结构化数据以从中提取信息。 不 - 它不是通常从邮件中提取的电子邮件地址。 可能比这更复杂一些。
我想涉及的一个步骤是将其从 MIME 格式转换为纯文本。 解析可能可以在将所有电子邮件转储到数据库后完成,但我不想丢失邮件中存在的任何格式或附件。
我更喜欢在 .net 中完成此操作,但我对适用于所涉及的工作类型的最佳语言工具持开放态度。 听说 Perl 可能是此类分析的最佳选择。
提前致谢
I want to download mails from all items and do some analysis on the mails. this will probably involve 2 distinct components.
- download the mails using IMAP
- parse unstructured data in the emails to extract information from them. no - its no the usual extract email adresses from the mails. probably quite a bit more complex than that.
i imagine a step involved would be converting it from MIME format to pure text. the parsing can probably be done after dumping all the emails into a database, but i dont want to lose any formatting or attachments present in the mail.
i would prefer to do it in .net, but am open to the best language tools available for the kind of work involved. have heard that perl is probably the best option for this kind of analysis.
thanks in advance
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
实际上我刚刚完成了一个与此非常相似的项目。 我使用 WebDAV 和 .Net 来完成此任务。 我实际上发现了一篇关于 SO 的帖子非常非常有帮助: 阅读 MS Exchange C# 中的电子邮件
I actually just finished up a project very similar to this. I used WebDAV and .Net to accomplish this. I actually found a post on SO that was very very helpful: Read MS Exchange email in C#