文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
附加资源
- 数据源 :新闻组是 Usenet 上的讨论组,它在网络真正起飞之前的 80 年代和 90 年代很流行。 该数据集包括 18,000 个新闻组帖子,带有 20 个主题。
- Chris Manning 的矩阵分解和 LSI 的书
- Sklearn 的 截断 SVD LSI 的细节
其它教程
- Scikit-Learn:文本文档的核外分类 :使用 Reuters-21578 数据集(标有 ~100 个类别的路透社文章),
HashingVectorizer
- 使用人文和社会科学主题模型进行文本分析 :使用 Jane Austen,Charlotte Bronte,Victor Hugo 等人的 英国和法国文学数据集
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论