获取文本的类别
我想选择文本(文章)(例如体育、经济)、字符串的类别,并且我想知道使用函数 similar_text()
的最佳方法还是其他。我需要比较文本。一篇文章是应该分配给类别的描述。第二个文本实际上是包含描述该类别的所有关键词的文本。比较两个文本给出相似性百分比。 与特定类别最相似的文本实际上就是该类别。我应该执行此加密 similar_text()
还是其他操作?
I want to choose a category of text(article)(ex. sport,economic), string, and I want to know whether the best way to do with function similar_text()
or otherwise. I need to compare the texts. One article is a description which should be assigned to categories. The second text is actually text with all the key words that describe the category. Comparing the two texts given the percentage of similarity.
Text that has the most similarities with the particular category is in fact and that category. Should I do this cryptographic similar_text()
or otherwise?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我将使用 贝叶斯分类器 来确定相似程度。
I would use a Bayesian classifier to determine the degree of similarity.