NaiveBayesClassifier太多值无法解开错误

发布于 2025-02-01 10:35:48 字数 1191 浏览 3 评论 0原文

我正在尝试建立一个情感分析模型来检查一些新闻文章，并且我有点困惑。我不太确定除了将其制作成词典之外，我还需要做些什么才能构造我的数据集。

我使用的数据集是来自此线程的： https：//forum.knime.com/t/mpqa-corpus/mmpqa-corpus/7887/7887/ 2

import nltk
from Noise_Removal import lemmatize_sentence, remove_noise
from Single_Article_Scrape import scrape_news
import pandas as pd

positive_MPQA = pd.read_csv("C:/Users/.../Model_Data/MPQA-OpinionCorpus-NegativeList.csv")
negative_MPQA = pd.read_csv("C:/Users/.../Model_Data/MPQA-OpinionCorpus-PositiveList.csv")
positive_MPQA['Sentiment'] = 'Positive'
negative_MPQA['Sentiment'] = 'Negative'

positive_tokens = positive_MPQA.values.tolist()
negative_tokens = negative_MPQA.values.tolist()

positive_data = dict(positive_tokens)
negative_data = dict(negative_tokens)
dataset = positive_data | negative_data

import random
keys = list(dataset.keys())
random.shuffle(keys)

ShuffledDataset = dict()
for key in keys:
    ShuffledDataset.update({key: dataset[key]})
    
from nltk import classify
from nltk import NaiveBayesClassifier

classifier = NaiveBayesClassifier.train(dataset)

原文

I am trying to build a sentiment analysis model to examine some news articles and I am a bit stumped building my model. I am not quite sure what else I need to do to structure my dataset aside from making it into a dictionary.

The dataset I am using is from this thread:
https://forum.knime.com/t/mpqa-corpus/7887/2

import nltk
from Noise_Removal import lemmatize_sentence, remove_noise
from Single_Article_Scrape import scrape_news
import pandas as pd

positive_MPQA = pd.read_csv("C:/Users/.../Model_Data/MPQA-OpinionCorpus-NegativeList.csv")
negative_MPQA = pd.read_csv("C:/Users/.../Model_Data/MPQA-OpinionCorpus-PositiveList.csv")
positive_MPQA['Sentiment'] = 'Positive'
negative_MPQA['Sentiment'] = 'Negative'

positive_tokens = positive_MPQA.values.tolist()
negative_tokens = negative_MPQA.values.tolist()

positive_data = dict(positive_tokens)
negative_data = dict(negative_tokens)
dataset = positive_data | negative_data

import random
keys = list(dataset.keys())
random.shuffle(keys)

ShuffledDataset = dict()
for key in keys:
    ShuffledDataset.update({key: dataset[key]})
    
from nltk import classify
from nltk import NaiveBayesClassifier

classifier = NaiveBayesClassifier.train(dataset)

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

坠似风落 2025-02-08 10:35:48

方法naivebayesclassifier.train（）期望可以迭代的元组列表。当它试图迭代您通过的字典时，它（实际上）与键列表结束。这是称呼它的正确方法：

classifier = NaiveBayesClassifier.train(dataset.items())

The method NaiveBayesClassifier.train() expects a list of tuples that it can iterate over. When it tries to iterate over the dictionary you passed, it ends up (in effect) with the list of keys. This is the correct way to call it:

classifier = NaiveBayesClassifier.train(dataset.items())

回复收藏 0 原文

~没有更多了~

关于作者

惟欲睡

暂无简介

文章

28 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

NaiveBayesClassifier太多值无法解开错误

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

NaiveBayesClassifier太多值无法解开错误

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。