如何分析文本片段中的积极或消极词语?

发布于 2024-10-11 14:31:34 字数 189 浏览 4 评论 0原文

我正在寻找某种模块(最好是Python),它允许我为该模块提供一个大约200个字符长的字符串。然后,模块应该返回该字符串有多少个正面或负面的单词。 (例如爱,喜欢,喜欢与恨,不喜欢,坏)

我真的很想避免在自然语言处理中重新发明轮子,所以如果你们知道什么可以让我做我所描述的事情以上,如果您可以分享,将会节省大量时间。

感谢您的帮助!

I'm looking for some sort of module (preferably for python) that would allow me to give that module a string about 200 characters long. The module should then return how many positive or negative words that string had. (e.g. love, like, enjoy vs. hate, dislike, bad)

I'd really like to avoid having to reinvent the wheel in natural language processing, so if there is anything you guys know of that would allow me to do what I described above, it'd be a huge time-saver if you could share.

Thanks for the help!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

白龙吟 2024-10-18 14:31:34

在分析文本片段之前,您需要通过删除标点符号、修复语言、分割空格、降低整个文本并将单词存储在可迭代的数据结构中来预处理给定文本。

对于一些基本的情感分析,可以使用以下技术:

词袋

在词袋技术中,我们基本上会遍历一个词袋(文件)并检查我们制作的可迭代是否包含这些词。如果确实如此,那么我们会为每个单词的存在分配一些值,以权衡文本的总体情感。
此链接应该可以帮助您了解更多相关信息
https://en.wikipedia.org/wiki/Bag-of-words_model

关键字提取和标记

可以通过标记元素然后删除不需要的数据来从输入文本中提取关键字和重要信息。
例如:
我的名字是约翰。
约翰,名字就是信息,“是”并不是真正需要的。
同样,可以删除动词和其他不重要的事物,以便仅保留主要信息。
分块和拼缝有帮助。
这个链接一定有帮助。
http://nltk.org/book/ch07.html

Before you analyse pieces of text you need to preprocess given text by striping punctuation, repair language, split spaces,lower the whole text and store the words in an iterable data structure.

For some basic sentiment analysis, following techniques can be used:

Bag of words

In bag of words technique we basically go through a bag(file) of words and check if the iterable made by us contains these. If it does then we assign some value to each word's presence in order to weigh the total sentiment of the text.
This link should help you understand more about this
https://en.wikipedia.org/wiki/Bag-of-words_model

Keyword Extraction and Tagging

Keywords and important information can be extracted from the input text by tagging the elements and then removing unwanted data.
For example:
My name is John.
Here John, name are the information and "is" isn't really needed.
Similarly verbs and other unimportant things can be removed in order to retain only the main information.
Chunking and Chinking helps.
This link must be of help.
http://nltk.org/book/ch07.html

梦里°也失望 2024-10-18 14:31:34

您可以使用现有的情绪分析工具对文本进行标记并获取情绪。据我所知,最全面的情感分析工具是 SentiBench。这基本上是对所有情绪分析工具的调查研究。以及代码和如何使用代码的示例。

You can tokenize your text and get the sentiment using existing sentiment analysis tools. The most comprehensive sentiment analysis tool that I know is SentiBench. This is basically a survey study of all sentiment analysis tools. As well as the code and examples on how to use the code.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文