分类情绪数据的来源?

发布于 2025-01-05 21:49:47 字数 300 浏览 3 评论 0原文

我希望使用一些以前从未使用过的新数据源来训练朴素贝叶斯。我已经看过 Lee & 了。 IMDB 评论的 Pang 语料库和 MPQA 意见语料库。我正在寻找符合以下标准的新网络服务。

  1. 容易分类 - 必须有喜欢/不喜欢或 5 星级评级
  2. 随时可用
  3. 与新材料相关(不如前两个重要)

以下是我自己提出的一些示例。

  • Etsy API
  • 烂番茄 API
  • Yelp API

任何其他建议将不胜感激 =)

I'm looking to train a naive Bayes with some new data sources that haven't been used before. I've already looked at the Lee & Pang corpus of IMDB reviews and the MPQA opinion corpus. I'm looking for new web services that fit the following criteria.

  1. Easily Classified - must have a like/dislike or 5 star rating
  2. Readily available
  3. Pertain to new material (less important than the first two)

Here are some samples I have come up with on my own.

  • Etsy API
  • Rotten Tomatoes API
  • Yelp API

Any other suggestions would be much appreciated =)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

携余温的黄昏 2025-01-12 21:49:47

在 Pang & Lee 的后期著作 (2008)“意见挖掘和情绪分析”这里 他们有一个公开可用资源的部分。它具有到这些语料库的链接。

In Pang&Lee's later work (2008) "Opinion Mining and Sentiment Analysis" here they have a section for publicly available resources. It has links to those corpora.

烟柳画桥 2025-01-12 21:49:47

看看sentiment140。它有一个语料库可供您下载和训练。您可以轻松扩展到新的推文。

Take a look at sentiment140. It has a corpus that you can download and train with. You can easily extend to new tweets.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文