斯坦福解析器中 Penn TreeBank 和 PCFG 模型的用途
我对 englishPCFG 模型和 Penn Treebank 注释的目的感到困惑,Standford Parser 的包只包含所有类型的模型,它总是问我如果我们已经有 Peen Treebank 的注释,这个模型如何工作。简单来说,Peen Treebank Annotation 对 Parser 有何作用,Model 是如何产生的?如果解析器收到原始文本,是否需要查询 Treebank 来再次预测树?
我正在阅读一些材料,但仍然不知道以下步骤何时生成模型。 1、选择一个可用的树库。 2、选择适合树库注释的解析器引擎。 3、选择训练和测试数据。 4、在训练集上训练解析器。 5、评估解析器在测试集上的准确性。 6、撰写项目报告并附上实验结果。
任何人都可以帮忙吗?
I was confused by the purpose of englishPCFG Model and Penn treebank annotation, the package of Standford Parser only included all kind of Models, it always questions me how does this model works if we already have annotation from Peen treebank. Simply, what is Peen Treebank Annaotation works for Parser and how does Model come out? if a raw text come for parser, does it need to query Treebank to predict trees agian?
I am reading some materials, but still dont know when did Model being generate at below steps.
1, Choose an available treebank.
2, Choose a parser engine suitable for the treebank annotation.
3, Select training and test data.
4, Train the parser on the training set.
5, Evaluate the parser's accuracy on the test set.
6, Write a report on the project with experimental results.
anyone can help?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
它在步骤 4 之后保存状态,您可以使用它来评估解析器或在以后的任何时间解析文本,而无需重新训练。
It is saved state after step 4, which you can use to evaluate the parser or to parse text at any later time, without needing to retrain.