当前位置：文江博客话题详情

无监督情感分析

发布于 2024-09-27 20:59:32 字数 155 浏览 9 评论 0原文

我读过很多文章，这些文章解释了在情绪分析系统真正发挥作用之前需要一组被分类为“积极”或“消极”的初始文本。

我的问题是：是否有人尝试对“积极”形容词与“消极”形容词进行基本检查，考虑到任何简单的否定词以避免将“不快乐”归类为积极？如果是这样，是否有任何文章讨论为什么该策略不现实？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

醉城メ夜风 2024-10-04 20:59:32

Peter Turney 的经典论文 (2002) 解释了一种进行无监督情绪的方法仅使用单词优秀和差作为种子集进行分析（正/负分类）。 Turney 利用其他词与这两个形容词的相互信息达到了 74% 的准确率。

回复收藏 0 原文

若无相欠,怎会相见 2024-10-04 20:59:32

我没有尝试过像您所描述的那样进行未经训练的情绪分析，但从我的角度来看，我想说您过于简单化了问题。仅仅分析形容词并不足以很好地把握文本的情感；例如，考虑“愚蠢”这个词。单独而言，您会将其归类为负面，但如果产品评论中有“...[x]产品让他们的竞争对手因为没有首先考虑此功能而显得愚蠢......”那么那里的情绪肯定会是积极的。在这样的事情中，单词出现的更大背景肯定很重要。这就是为什么仅未经训练的词袋方法（更不用说更有限的形容词袋）不足以充分解决这个问题。

预先分类的数据（“训练数据”）有助于将问题从尝试从头开始确定文本是否具有积极或消极情绪转变为尝试确定文本是否与积极文本或消极文本更相似，并以此方式对其进行分类。另一个要点是，诸如情感分析之类的文本分析常常受到不同领域文本特征差异的很大影响。这就是为什么拥有一组好的数据来训练（即来自您正在工作的领域内的准确数据，并且希望能够代表您将要分类的文本）与构建良好的数据集同样重要。系统进行分类。

不完全是一篇文章，但希望有所帮助。

回复收藏 0 原文