如何减少斯坦福解析器的执行时间?

发布于 2024-11-09 14:34:21 字数 174 浏览 3 评论 0原文

早上好,

我在我的应用程序中使用斯坦福词性,我需要解析许多文本文件(可以到 20 个文件)。然而我注意到 stanford 需要很多时间(有时 30 分钟或更多),问题是斯坦福会自动构建语法树,即使我不需要它。 以前有人遇到过这个问题吗?我该怎么做才能减少斯坦福大学的解析时间?

欢迎任何帮助, 问候。

Good Morning,

I am using Stanford part of speech for my application, and I need to parse many text files (can go to 20 files). However I noticed that stanford takes a lot of time (sometimes 30min or more), the problem is that Stanford automatically builds the syntax tree, even when I don't need it.
Have anyone face this problem before? what can I do to reduce the parsing time of stanford?

Any help is welcome,
Regards.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

ゝ杯具 2024-11-16 14:34:33

如果您只想要词性,而不是解析树,则应该运行(序列模型)词性标记器,例如 Stanford POS Tagger,速度快几个数量级)。请参阅Stanford Parser 常见问题解答。 (如果您想要快速标记,请使用斯坦福 POS Tagger 的 left3words-wsj-0-18.tagger 模型。)

If you just want part of speech, not parse trees, you should run a (sequence model) part of speech tagger, such as the Stanford POS Tagger, which is orders of magnitude faster). See the Stanford Parser FAQ. (If you want fast tagging, use the left3words-wsj-0-18.tagger model of the Stanford POS Tagger.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文