文本中的奇怪代码,例如 +ADs-、+AGA- 或 +ACoAKg- 和 +ACEAIQ-
我得到一个数据集,它对不可打印的/变音符号使用奇怪的编码。我的印象是它是某些邮件系统的产物。或者也许是excel之类的?不管怎样,我得到的东西看起来像这样:
+ADs-,+AGA-,或+ACoAKg-和+ACEAIQ-
还有更多......知道这是什么以及它来自哪里吗?谷歌向我展示了邮件列表等中的内容 - 但它们看起来就像被破坏的邮件,没有讨论代码本身。
有趣的是,Excel 似乎知道如何处理它们。可能类似于引用的可打印...只是不同:)有什么想法吗?
i got a dataset that uses a strange encoding for non-printables / diacritics. i'm getting hte impression that it's an artifact of some mail system. or maybe it's excel or something? anyway, the stuff i get looks like this:
+ADs-, +AGA-, or +ACoAKg- and +ACEAIQ-
there's more.... any idea what that this and where it comes from? google shows me stuff from mailing lists etc - but theys just look like mangeled mail, nothing discussing the codes themselve.
Interestingly, Excel seems to know what to do with them. Might be something like quoted printable... just different :) any idea?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
看起来像UTF-7编码。请参阅wikipedia 条目了解详细信息,还有RFC2152 了解更多详细信息(包括更多示例)。
It looks like UTF-7 encoding. See wikipedia's entry for the gory detail, also RFC2152 for more gory details (including a few more examples).