当前位置：文江博客话题详情

如何处理 whois 数据

发布于 2024-11-05 18:55:56 字数 325 浏览 4 评论 0原文

我需要将 whois 数据放入表中，例如

注册者、
创建日期、
过期日期等。

我有从 whois 服务器提取数据的脚本，但每个域扩展的输出都不同。

例如，对于 .com 域，注册者详细信息以总地址形式出现，对于 .org 域，它以注册者名称、street1、street2、street3 等形式出现

。无法将注册者详细信息提取为一个单元放入数据库中。

我听说如果我们获取 xml 数据，我们就可以提取它，有人可以帮助解决这个问题吗？谢谢！。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

玩物 2024-11-12 18:55:56

事实上，问题比这要大得多。

没有统一的请求语法
，也没有定义的功能集
没有定义的答案方案
当地立法使内容不同
没有标准化的错误集
记录的信息质量较差
您必须处理内部化

WHOIS 服务由 RFC3912 定义。这是一个非常基本的请求协议，根本没有定义应答内容的格式。。因此，答案通常反映了包含数据的数据库的格式，并且您可能会为每个数据库得到不同的语法。由于 WHOIS 可用于您想要的任何内容，因此您不能对将得到的答案的格式做出很多假设。但希望您可以收到可解析的内容以及每个请求的类似格式的答案。

因此，您需要为每个服务器开发一个解析逻辑，您必须以非常经验的方式进行。

不过，这里有一些来自 RFC 的开发技巧。

您需要使用 TCP 端口 43 发送请求，并以 CR+LF ASCII 字符结尾的单行
您必须期望 TCP 连接结束仅意味着答案已完成。

特别是关于域名，您可能需要注意，以前对 ASCII 编码的限制使得一些注册人使用 Punycode 对 DNS 系统中的一些（通过示例强调的）字符串进行编码，因此您可能希望能够在 Whois 答案中期待这些字符串如果您在某些回复中遇到同样的情况。自 2003 年以来，国际化域名的存在将要求您支持 unicode 编码。转换名称的算法很复杂，RFC 3490 应该为您提供一些有用的详细信息。

祝你好运！