Python编程语言的词法分析
有谁知道 Python 的 FLEX 或 LEX 规范文件在哪里?例如,这是 ANSI C 编程语言的 lex 规范: http://www.quut.com/c/ANSI-C-grammar-l-1998.html
仅供参考,我正在尝试将代码突出显示写入 Cocoa 应用程序中。正则表达式不会这样做,因为我还想要语法解析来折叠代码和识别块。
Does anyone know where a FLEX or LEX specification file for Python exists? For example, this is a lex specification for the ANSI C programming language: http://www.quut.com/c/ANSI-C-grammar-l-1998.html
FYI, I am trying to write code highlighting into a Cocoa application. Regex won't do it because I also want grammar parsing to fold code and recognize blocks.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
Lex 通常仅用于标记化,而不是完整解析。使用 flex/lex 进行标记化的项目通常使用 yacc/bison 进行实际解析。
您可能想看看 ANTLR,它是 lexx & 的更“现代”的替代品。 yacc。
ANTLR 项目有一个包含许多 ANTLR 4 语法的 Github 存储库,至少包括 Python 3。
Lex is typically just used for tokenizing, not full parsing. Projects that use flex/lex for tokenizing typically use yacc/bison for the actual parsing.
You may want to take a look at ANTLR, a more "modern" alternative to lexx & yacc.
The ANTLR Project has a Github repo containing many ANTLR 4 grammars including at least one for Python 3.
grammar.txt 是官方的、完整的 Python 语法——而不是直接
lex
兼容,但您应该能够将其调整为合适的形式。grammar.txt is the official, complete Python grammar -- not directly
lex
compatible, but you should be able to massage it into a suitable form.您是否考虑过使用现有的代码荧光笔之一,例如 Pygments?
Have you considered using one of the existing code highlighters, like Pygments?