我可以在运行时定义 Flex 令牌吗?
我想使用 lex/yacc 读取分隔文本文件。对于解析器来说,这将是非常简单的事情,但是不同的文本文件有不同的分隔符,所以我想让用户指定文本是否由制表符、空格、逗号、管道分隔,unicode 雪人,等等。
使用这些工具的正常方法是为 lex 和 yacc 编写规范,编译,然后使用静态代码进行解析。但是有没有办法让用户在运行时指定分隔符(从而重新定义标记)?
我目前正在使用 flex/bison,但我愿意接受小型和便携式替代品的建议。
I'd like to use lex/yacc to read in a delimited text file. This would be pretty trivial stuff for a parser, but different text files have different delimiters, so I'd like to let the user specify whether the text is separated by tabs, spaces, commas, pipes, unicode snowmen, et cetera.
The normal means of using these tools is to write a spec for lex and yacc, compile, and then use the static code for parsing. But is there a way to let the user specify the delimiter (and thus redefine the tokens) at run time?
I'm currently using flex/bison, but am open to suggestions of small and portable alternatives.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
不,没有任何办法可以做到这一点。 Lex 和 Yacc 创建词法分析器或解析器表作为 C 程序的一部分,因此在创建后您无法更改它。
目前尚不清楚您需要解析什么格式,因此如果没有示例,我不会提出任何建议。
No, there isn't any way to do this. Lex and Yacc create the lexer or parser tables as part of a C program, so you can't alter it after it has been created.
It's not exactly clear what format you need to parse, so without examples I won't make any suggestions.