当前位置：文江博客话题详情

如何在 Delphi 中解析复杂的文件格式？（不是 CSV、XML 等）

发布于 2024-09-10 20:34:46 字数 215 浏览 13 评论 0原文

自从我必须解析比 CSV 或 XML 更难的文件以来已经有几年了，所以我缺乏实践。我的任务是在 Delphi 应用程序中解析名为 NeXus 的文件格式。

问题是我只是不知道从哪里开始，我是否使用标记器、正则表达式等？也许我现在需要的是一个教程。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

各自安好 2024-09-17 20:34:47

看看这个，它是商业广告，但看起来像一个有趣的玩具：

http://dpg.zenithlab.com/

但是，实际上：对于 Nexus，您不需要复杂的解析器。

一些位置检查代码，一些字符串分割和括号计数，你就已经写好了。

我将使用一个简单的一次标记解析器来解析它，如下所示：

将文件加载到 TStringList 中。
对于每一行，一次获取一个标记，以确定行类型。
该线型有一个枚举类型。
第一个有效的非空行应被检测为有效的#nexus 标记。
接下来的标题区域（看起来大部分被跳过）
begin 是该行的第一个关键字。
begin 块内的以下几行看起来几乎像 DOS 命令及其命令行参数，并以空格分隔，并以分号结束。非常像 pascal，但有括号。

对于上面的内容，我会为自己编写一些帮助程序，最终我可能需要编写的一件事是一个像这样的小标记分割函数：

function GetToken( var inputString:String;outputToken:String; const Separators:TStrings ;关键字:TStrings;ParenFlag:Boolean):Boolean;

当 GetToken 能够从 inputString 中找到并返回令牌字符串时，它会返回 true，它会跳过任何前导空格，并在找到分隔符时终止。分隔符是空格或逗号等项目。
ParenFlag:True 意味着我得到的下一个标记应该是整个带括号的项目列表。一旦我得到整个括号列表（（（a，b），（c，d），（e，f））），那么我将调用另一个函数，该函数将该列表的内容解压到列表/的某些数据结构中数组。

我不推荐大型解析器引擎，如果你在编写解析器之前先编写 BNF 语法，那么 BNF 语法会帮助你编写代码。但这里没有什么残酷到你无法解析它。

您是否需要对此进行查询/转换？您认为需要将其转换为 json 或 xml 才能进一步使用它吗？