文章 0 浏览 3
让我们从一个简单的问题开始。假设我有一个 350 个字符的句子,并且希望将该句子放入“好心情”桶或“坏心情”桶中。 设计一个算法来存储句子的最佳方…
我正在尝试实现朴素贝叶斯分类器进行情感分析。我打算使用 TF-IDF 加权度量。我现在有点卡住了。 NB一般使用词(特征)频率来寻找最大似然。那么如何…
我刚刚开始一个文本分类应用程序,并且阅读了很多有关该主题的论文,但到目前为止我不知道如何开始,我觉得我还没有了解整个图像。我已经获得了训练数…
我需要知道 SVMlight 是否输出分类分数。我在任何地方都找不到它。我知道例如 libSVM 就是这样。thx…
如果时间不是一个因素,并且我们不知道有多少类,哪种方法是文档分类的最佳方法?…
我有大量的文档(主要是 pdf 和 doc)想要分类,因此我可以根据某些标签搜索它们。这些标签可以是我自己的(我将标签添加到文档中),也可以是从文本…
我对学习文本分类感兴趣,所以也有兴趣阅读该理论。下一步是做一些事情,因此我正在寻找不同的工具。一些链接指向 WEKA,但是 Mallet 似乎更适合此任…
我对做一个关于文档分类的项目感兴趣,并且一直在寻找对与此相关的文本挖掘的理论部分有用的书籍,或者描述从带有分类文档(带有子类别)的训练数据到…
我的大学项目有点问题。 我必须使用遗传算法来实现文档分类。 我看过这个示例并且(可以说)理解了原理遗传算法,但我不确定它们如何在文档分类中实现…
是否有任何可靠/部署的方法、算法或工具来通过解析某些网页来标记网站类型。 例如:论坛、博客、PressRelease 网站、新闻、电子商务等。 我正在寻找一…
在任何机器学习算法中使用单词本身作为特征的最佳方法是什么? 问题是我必须从特定段落中提取与单词相关的特征。我应该使用字典中的索引作为数字特征…
有人可以建议在哪里可以找到带有频率信息的字典单词列表吗? 理想情况下,来源应该是北美变体的英语单词。…
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
我想对新闻数据集和训练数据进行分类,并使用IPTC主题代码(层次分类)进行分类。 在我的项目中我应该使用 svm 。 我已经完成了所有的特征提取、词干…
我想知道是否可以使用决策树进行文档分类,如果可以,那么数据表示应该如何? 我知道 R 包 party 的用法 用于决策树。…
文章 0 评论 0
接受