3.实验方法与步骤

发布于 2024-01-28 21:41:24 字数 783 浏览 0 评论 0 收藏 0

实验一

1）打开Python软件，仿照excel2txt.py脚本输入命令。

2）使用readLines（）函数读取数据，并筛选出某个品牌的评论，保存成文本文件（编码统一用UTF-8，下同）。

依次编写clean_same.py函数和clean_prefix.py函数。

clean_prefix.py函数对于各个类别的评分进行删除。

3）编写并运行程序后，与之前的对比、观察预处理后的效果。

实验二

1）利用ROSTCM6将预处理后的文本一分为二（只保留正面评价和负面评价）。

打开ROSTCM6软件，选择“功能性分析”——“情感分析”。

在“待分析文件路径”中选择预处理后的文件路径，单击“分析”。

将得到的正面评价和负面评价文本另存为到“\test\data\”目录下，并将编码改回UTF-8（而非unicode）。

编写clean_prefix.py代码，运用正则表达式将上述两个文本的前缀评分和空格去除，并保存为meidi_jd_pos.txt和meidi_jd_pos.txt文本。

2）利用jieba模块分别对上述所得的两个文本做分词，为达到更好的分词效果，添加自定义词典myDict.txt（在\data中），可以尝试往myDict.txt中自定义编辑添加词组。

3）编写LDA.py代码，分别对meidi_jd_pos_cut.txt和meidi_jd_pos_cut.txt文本运行，分析产品的优点和不足。

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据